CN117637092A - 一种基于人工智能模型的病历预编码方法及装置 - Google Patents

一种基于人工智能模型的病历预编码方法及装置 Download PDF

Info

Publication number
CN117637092A
CN117637092A CN202410098947.4A CN202410098947A CN117637092A CN 117637092 A CN117637092 A CN 117637092A CN 202410098947 A CN202410098947 A CN 202410098947A CN 117637092 A CN117637092 A CN 117637092A
Authority
CN
China
Prior art keywords
coding
medical record
model
training data
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410098947.4A
Other languages
English (en)
Other versions
CN117637092B (zh
Inventor
伍千虎
陈超
黄帆
宋亚涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Powersi Information Technology Co ltd
Original Assignee
Powersi Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Powersi Information Technology Co ltd filed Critical Powersi Information Technology Co ltd
Priority to CN202410098947.4A priority Critical patent/CN117637092B/zh
Publication of CN117637092A publication Critical patent/CN117637092A/zh
Application granted granted Critical
Publication of CN117637092B publication Critical patent/CN117637092B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明实施例提供了一种基于人工智能模型的病历预编码方法及装置,涉及病历编码技术的技术领域。其方法包括:获取病历信息;通过预先训练好的编码模型对所述病历信息进行编码推导,以得到第一编码;根据系统编码指令对所述第一编码进行预编码处理,以得到目标预编码。通过本发明,解决了病历编码准确度低的问题,进而达到了提高病历编码精度及效率的效果。

Description

一种基于人工智能模型的病历预编码方法及装置
技术领域
本发明实施例涉及病历编码技术领域,具体而言,涉及一种基于人工智能模型的病历预编码方法及装置。
背景技术
国际疾病分类(international classification of diseases,ICD)编码是在医院等医疗机构使用的统一的编码方法。它根据疾病的病因、病理、临床表现和解剖位置等特性将疾病分门别类,同时也包含手术、诊断和治疗程序的统一代码。ICD代码使用字母数字组合的形式表示具体的疾病或诊断,如E860.0(酒精饮料意外中毒)。ICD代码有多种用途,如报告疾病和健康状况、协助医疗报销决策、收集发病率和死亡率统计数据等。
在患者就医出院后,医院的病案编码人员以病历为依据填写病案首页,其中重要的部分是填写患者的诊断(ICD-10)和手术操作编码(ICD-9),到目前在各医院中积累了大量的患者住院病历和对应的病案首页数据。
目前各地对医院的病案首页诊断、手术、操作编码质量要求有很大的提高,因医生编写病历的质量和病案编码人员能力参差不齐,导制医院存在错编、漏编问题。
针对上述问题,当前并无较好的解决方案。
发明内容
本发明实施例提供了一种基于人工智能模型的病历预编码方法及装置,以至少解决相关技术中病案编码准确度低的问题。
根据本发明的一个实施例,提供了一种基于人工智能模型的病历预编码方法,包括:
获取病历信息;
通过预先训练好的编码模型对所述病历信息进行编码推导,以得到第一编码,其中,所述编码模型是通过对历史病历信息进行去噪和合并加强后得到的训练数据进行训练得到的;
根据系统编码指令对所述第一编码进行预编码处理,以得到目标预编码,其中,所述预编码处理是基于预设的国际疾病分类编码规则实现的。
在一个示例性实施例中,在所述通过预先训练好的编码模型对所述病历信息进行编码推导,以得到第一编码之前,所述方法包括:
获取历史病历信息,其中所述历史病历信息至少包括历史病历记录以及历史医嘱信息;
通过统计分析算法,对所述历史病历信息进行噪音去除处理,以得到第一训练数据;
通过预设的实体识别模型对所述第一训练数据进行分词提取合并处理,以得到第二训练数据;
通过预设的成本模型对所述第二训练数据进行语料训练组合处理,以得到目标训练数据;
通过所述目标训练数据分别对预设的初始诊断编码模型以及初始手术编码模型进行训练,以得到目标诊断编码模型以及目标手术编码模型,其中,所述预先训练好的编码模型包括所述目标诊断编码模型以及所述目标手术编码模型。
在一个示例性实施例中,所述通过预设的实体识别模型对所述第一训练数据进行分词提取合并处理,以得到第二训练数据包括:
通过预设的实体识别模型对所述第一训练数据中包含的去除噪音后的历史病历记录进行分词提取处理;
将分词提取处理结果与所述第一训练数据中包含的去除噪音后的历史医嘱信息进行合并加强处理,以得到所述第二训练数据。
在一个示例性实施例中,所述通过预设的成本模型对所述第二训练数据进行语料训练组合处理,以得到目标训练数据包括:
通过预设的成本模型对所述第二训练数据进行语料训练组合处理,以得到语料训练数据;
将所述语料训练数据与预设的编码相组合,以得到所述目标训练数据。
在一个示例性实施例中,在所述根据系统编码指令对所述第一编码进行预编码处理,以得到目标预编码之后,所述方法还包括:
获取第一编码信息,其中,所述第一编码信息包括通过对人工编码结果进行数据识别得到的编码信息;
将所述第一编码信息与所述目标预编码信息进行匹配处理;
在匹配失败的情况下,确定所述第一编码信息和/或目标预编码信息存在异常,并进行告警处理;否则进行正常提示处理。
在一个示例性实施例中,在匹配失败的情况下,确定所述第一编码信息和/或目标预编码信息存在异常之后,所述方法包括:
获取所述第一编码信息对应的第一病历信息;
根据所述第一病历信息确定多维病历特征,并计算所述多维病历特征之间的特征关系;
对所述特征关系进行编码分析处理,并基于所述编码分析处理结果进行编码异常反馈处理。
根据本发明的另一个实施例,提供了一种基于人工智能模型的病历预编码装置,包括:
病历采集模块,用于获取病历信息;
第一编码模块,用于通过预先训练好的编码模型对所述病历信息进行编码推导,以得到第一编码,其中,所述编码模型是通过对历史病历信息进行去噪和合并加强后得到的训练数据进行训练得到的;
编码处理模块,用于根据系统编码指令对所述第一编码进行预编码处理,以得到目标预编码,其中,所述预编码处理是基于预设的国际疾病分类编码规则实现的。
在一个示例性实施例中,所述装置包括:
历史病历采集模块,用于在所述通过预先训练好的编码模型对所述病历信息进行编码推导,以得到第一编码之前,获取历史病历信息,其中所述历史病历信息至少包括历史病历记录以及历史医嘱信息;
去噪模块,用于通过统计分析算法,对所述历史病历信息进行噪音去除处理,以得到第一训练数据;
分词提取合并模块,用于通过预设的实体识别模型对所述第一训练数据进行分词提取合并处理,以得到第二训练数据;
语料训练组合模块,用于通过预设的成本模型对所述第二训练数据进行语料训练组合处理,以得到目标训练数据;
模型训练模块,用于通过所述目标训练数据分别对预设的初始诊断编码模型以及初始手术编码模型进行训练,以得到目标诊断编码模型以及目标手术编码模型,其中,所述预先训练好的编码模型包括所述目标诊断编码模型以及所述目标手术编码模型。
根据本发明的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
通过本发明,由于通过预先训练好的编码模型对病历进行编码推导,再将推导得到的编码通过系统指令进行进一步预编码处理,从而得到精确的预编码,因此,可以解决病历编码准确度低的问题,达到提高病历编码准确度和效率的效果,并为医院编码工作提供辅助,减少在手工编码上的人力投入,同时使得地区内编码水平同质化,解决因编码水平不一导致的编码质量洼地的问题。
附图说明
图1是本发明实施例的一种基于人工智能模型的病历预编码方法的移动终端的硬件结构框图;
图2是根据本发明实施例的一种基于人工智能模型的病历预编码方法的流程图;
图3是根据本发明实施例的一种基于人工智能模型的病历预编码装置的结构框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明的实施例。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本申请实施例中所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明实施例的一种基于人工智能模型的病历预编码方法的移动终端的硬件结构框图。如图1所示,移动终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,其中,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的一种病历预编码方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输设备106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种病历预编码方法,图2是根据本发明实施例的一种病历预编码的流程图,如图2所示,该流程包括如下步骤:
步骤S201,获取病历信息;
在本实施例中,病历信息包括电子病历出院记录、住院医嘱明细(药品、耗材、检查、手术等)、病案首页编码等信息。
其中,为实现病历信息的采集,需要实现医学临床专业实体的识别及其中文词向量库的建立,且词向量库的覆盖实体量和关联性体现决定了文本分类任务过程中与标签相关物证识别能力,从而影响后续模型编码的正确性。
步骤S202,通过预先训练好的编码模型对所述病历信息进行编码推导,以得到第一编码,其中,所述编码模型是通过对历史病历信息进行去噪和合并加强后得到的训练数据进行训练得到的;
在本实施例中,通过对历史病历信息进行去噪,以减少噪音的干扰;而对去噪后的数据进行合并加强是为了增加训练数据的特征维度,以此改善预测和分析效果,从而提高训练数据对模型的训练效果;而通过编码模型预先对编码进行推导,能够预先提供编码方案,方便后续根据这些编码方案进一步编码;其中,第一编码包括(但不限于)由国际疾病分类编码的组成的编码,例如主诊编码、手术编码等。
步骤S203,根据系统编码指令对所述第一编码进行预编码处理,以得到目标预编码,其中,所述预编码处理是基于预设的国际疾病分类编码规则实现的。
在本实施例中,采用人工智能文本分类模型技术,以历史积累的数据为训练语料,以对应的诊断、手术操作为标签,训练出人工智能辅助编码模型,为医院病案编码人员提供预编码功能,减少人工错误,提高编码效率和精度,从而提高医疗系统的管理能力;同时为医院病历编码工作提供辅助,在一定程度上替代人工编码,减少医院在编码工作上的人力投入;同时让地区内编码水平同质化,解决一级、二级医院编码能力和质量洼地的问题。
需要说明的是,在编码过程中,首先生成主诊编码和主手术编码,再生成其它诊断编码、其它手术编码,将这些编码合并后即为预编码(对应前述目标预编码)。
需要说明的是,本系统主要为人工智能模型,而模型的训练需要大量的标签数据,而标签数据的正确性决定了模型输出的正确性。
在一个可选的实施例中,在所述通过预先训练好的编码模型对所述病历信息进行编码推导,以得到第一编码之前,所述方法包括:
步骤S20201,获取历史病历信息,其中所述历史病历信息至少包括历史病历记录以及历史医嘱信息;
步骤S20202,通过统计分析算法,对所述历史病历信息进行噪音去除处理,以得到第一训练数据;
在本实施例中,由于历史病历信息中往往因为记录错误(例如录入错误的药物剂量、手术时间、诊断编码)、信息缺失(例如缺失某次就诊的关键检查结果、治疗方案等)、数据异常(有些记录可能是异常的或者不符合常规的数据,如异常的生化指标、不合理的手术记录等)、信息冗余(在病历信息中可能存在冗余的信息)等原因而存在信息噪音,此时可以通过大数据统计需要的数据的特点以及错误数据的特点的方式来去除掉低概率噪音数据,留下的数据为可用训练数据,以减少噪音干扰。
步骤S20203,通过预设的实体识别模型对所述第一训练数据进行分词提取合并处理,以得到第二训练数据;
在本实施例中,采用训练医学临床实体识别模型,对出院记录做实体识别并完成分词抽取,同时尽可能保留关键特征,以方便后续根据关键特征进行病历文本的识别。
其中,实体识别模型可以(但不限于)是支持向量机(SVM)、随机森林(RandomForest)等模型;分词提取合并处理是将原始文本进行分词、特征提取和合并处理,从而为后续的文本分析和挖掘提供基础数据;具体包括以下步骤:
S1、分词:将原始文本按照空格、标点符号等进行分割,转化为单词、短语或符号等离散的词汇单位。分词的目的是将文本转化为计算机可处理的离散单元,为后续的文本处理和分析提供基础;
S2、特征提取:在分词的基础上,针对文本中的不同特征(如词性、词频、句法结构等),进行特征提取的处理。这可以包括词袋模型(Bag of Words)、TF-IDF(TermFrequency-Inverse Document Frequency)等方法,用于提取文本特征以辅助后续的文本分析和机器学习任务;
S3、合并处理:将分词和特征提取得到的结果进行合并处理,构建文本的完整特征表示。这一步可以包括将不同特征向量进行合并、加权、连接等操作,以有效地整合文本的多维信息,为后续的文本挖掘和分析任务提供丰富的信息源。
步骤S20204,通过预设的成本模型对所述第二训练数据进行语料训练组合处理,以得到目标训练数据;
步骤S20205,通过所述目标训练数据分别对预设的初始诊断编码模型以及初始手术编码模型进行训练,以得到目标诊断编码模型以及目标手术编码模型,其中,所述预先训练好的编码模型包括所述目标诊断编码模型以及所述目标手术编码模型。
在本实施例中,采用人工智能NLP文本分类技术,用目标训练数据对主诊断编码模型、手术编码模型、其他诊断模型、其他手术编码模型等编码模型进行训练,从而得到需要的目标模型。
在一个可选的实施例中,所述通过预设的实体识别模型对所述第一训练数据进行分词提取合并处理,以得到第二训练数据包括:
步骤S202031,通过预设的实体识别模型对所述第一训练数据中包含的去除噪音后的历史病历记录进行分词提取处理;
步骤S202032,将分词提取处理结果与所述第一训练数据中包含的去除噪音后的历史医嘱信息进行合并加强处理,以得到所述第二训练数据。
在本实施例中,将历史病历记录与历史医嘱信息进行合并加强有助于消除历史信息的重复性、矛盾性和不一致性,提高医疗记录的准确性和一致性;其中,将历史病历记录与历史医嘱信息进行合并和加强指的是将患者的病历信息(包括病史、诊断结果、检查报告等)与医生开具的医嘱信息(包括治疗方案、用药建议等)进行整合和关联。
在一个可选的实施例中,所述通过预设的成本模型对所述第二训练数据进行语料训练组合处理,以得到目标训练数据包括:
步骤S202041,通过预设的成本模型对所述第二训练数据进行语料训练组合处理,以得到语料训练数据;
步骤S202042,将所述语料训练数据与预设的编码相组合,以得到所述目标训练数据。
在本实施例中,在医疗行业中,成本模型可以用于评估医疗服务、治疗方案、设备采购和医疗信息技术等方面的成本,从而可以根据病历特征判断相关手术操作的编排是否合理;而进行语料的训练组合是为了将语料与对应的病案首页诊断、手术、操作编码组合(组合后的数据先是诊断和手术编码也就是训练标签,之后是语料,例如:O24.400;Z37.000;O80.000
入院诊断:1、妊娠期糖尿病(A2级);2、胎膜早破;3、孕1产0宫内孕374周LOA单活胎先兆临产。
入院情况:宫高32cm,腹围100cm,LOA位,不规则宫缩,心率140次分,规则。骨盆外测量:IS:25cm,IC:26cm,EC:19cm,TO:9cm。查:宫口未开,胎膜已破,先露S3。阴道窥器检查:阴道通畅。
诊疗经过:202302515:46在会阴侧切下顺娩一活婴,重2950g,Apgar评分1分钟10分,5分钟10分,羊水清,胎盘、胎膜自然娩出完整,会阴切口予皮内缝合,产后24小时出血270ml,II甲愈合。
出院情况:无出院诊断:1、妊娠期糖尿病(A2级);2、胎膜早破;3、孕1产1宫内孕374周LOA产一活婴出院时医嘱:无),以生成最终的人工智能编码模型所需要的目标训练数据;容易理解的,此处为了进行现实的模拟,可以按照国际疾病分类编码规则(internationalclassification of diseases,ICD)进行有序组合,在一些特定环境,也可以是随机组合以模拟错误数据。
在一个可选的实施例中,在所述根据系统编码指令对所述第一编码进行预编码处理,以得到目标预编码之后,所述方法还包括:
步骤S204,获取第一编码信息,其中,所述第一编码信息包括通过对人工编码结果进行数据识别得到的编码信息;
步骤S205,将所述第一编码信息与所述目标预编码信息进行匹配处理;
步骤S206,在匹配失败的情况下,确定所述第一编码信息和/或目标预编码信息存在异常,并进行告警处理;否则进行正常提示处理。
在本实施例中,为了保证编码的准确性,避免医护人员在根据目标预编码进行编码时出现错误,或目标预编码因为系统故障导致的错误编码,可以将医护人员的编码结果与系统的目标预编码进行匹配对比,当出现医护人员的编码结果与目标预编码不一致时,说明其中有一个内容存在错误,此时则需要对异常情况进行分析调整。
其中,语义识别包括ORC识别技术或其他识别技术。
需要说明的是,需要对异常情况进行分析,具体的则是根据前述对历史病历数据进行加强整合时得到的病历与医嘱之间的关联情况,确定病历特征之间的特征关系,即从多个维度确定医嘱与病历是否合理,当医嘱与病历均合理时,则根据前述预设的国际疾病分类编码规则(ICD)来判断系统预编码是否合理,在系统的预编码合理的情况下再判断语义识别结果是否准确,从而判断医护人员的编码是否准确;当然,也可以根据实际使用环境先判断医护人员的编码,再判断系统的预编码;由此实现对异常情况的识别处理,从而方便相关人员根据不同的识别结果进行不同的处理;即在匹配失败的情况下,确定所述第一编码信息和/或目标预编码信息存在异常之后,还可以通过获取所述第一编码信息对应的第一病历信息、根据所述第一病历信息确定多维病历特征,并计算所述多维病历特征之间的特征关系、对所述特征关系进行编码分析处理,并基于所述编码分析处理结果进行编码异常反馈处理来及时对编码异常情况进行风险反馈。
其中,病历特征包括(但不限于)病史特征、临床表现特征、检查报告特征、诊断特征、医嘱特征、治疗特征等,计算所述多维病历特征之间的特征关系可以是通过对病历特征进行逻辑编码并进行矩阵化,再对矩阵的值以及子矩阵之间的相关性进行计算得到的,例如,通过大数据统计,某个病史特征、诊断特征、临床表现特征等数据对应的医嘱特征的编码应当为O80.000,但是实际医嘱特征的编码为080.000,由此计算得到的矩阵结果会与根据大数据统计结果计算得到的矩阵结果不同,则此时说明医嘱特征存在异常,以此类推。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
在本实施例中还提供了一种基于人工智能模型的病历预编码装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图3是根据本发明实施例的一种基于人工智能模型的病历预编码装置的结构框图,如图3所示,该装置包括:
病历采集模块,用于获取病历信息;
第一编码模块,用于通过预先训练好的编码模型对所述病历信息进行编码推导,以得到第一编码,其中,所述编码模型是通过对历史病历信息进行去噪和合并加强后得到的训练数据进行训练得到的;
编码处理模块,用于根据系统编码指令对所述第一编码进行预编码处理,以得到目标预编码,其中,所述预编码处理是基于预设的国际疾病分类编码规则实现的。
在一个可选的实施例中,所述装置还包括:
历史病历采集模块,用于在所述通过预先训练好的编码模型对所述病历信息进行编码推导,以得到第一编码之前,获取历史病历信息,其中所述历史病历信息至少包括历史病历记录以及历史医嘱信息;
去噪模块,用于通过统计分析算法,对所述历史病历信息进行噪音去除处理,以得到第一训练数据;
分词提取合并模块,用于通过预设的实体识别模型对所述第一训练数据进行分词提取合并处理,以得到第二训练数据;
语料训练组合模块,用于通过预设的成本模型对所述第二训练数据进行语料训练组合处理,以得到目标训练数据;
模型训练模块,用于通过所述目标训练数据分别对预设的初始诊断编码模型以及初始手术编码模型进行训练,以得到目标诊断编码模型以及目标手术编码模型,其中,所述预先训练好的编码模型包括所述目标诊断编码模型以及所述目标手术编码模型。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
本发明的实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述计算机可读存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于人工智能模型的病历预编码方法,其特征在于,包括:
获取病历信息;
通过预先训练好的编码模型对所述病历信息进行编码推导,以得到第一编码,其中,所述编码模型是通过对历史病历信息进行去噪和合并加强后得到的训练数据进行训练得到的;
根据系统编码指令对所述第一编码进行预编码处理,以得到目标预编码,其中,所述预编码处理是基于预设的国际疾病分类编码规则实现的。
2.根据权利要求1所述的方法,其特征在于,在所述通过预先训练好的编码模型对所述病历信息进行编码推导,以得到第一编码之前,所述方法包括:
获取历史病历信息,其中所述历史病历信息至少包括历史病历记录以及历史医嘱信息;
通过统计分析算法,对所述历史病历信息进行噪音去除处理,以得到第一训练数据;
通过预设的实体识别模型对所述第一训练数据进行分词提取合并处理,以得到第二训练数据;
通过预设的成本模型对所述第二训练数据进行语料训练组合处理,以得到目标训练数据;
通过所述目标训练数据分别对预设的初始诊断编码模型以及初始手术编码模型进行训练,以得到目标诊断编码模型以及目标手术编码模型,其中,所述预先训练好的编码模型包括所述目标诊断编码模型以及所述目标手术编码模型。
3.根据权利要求2所述的方法,其特征在于,所述通过预设的实体识别模型对所述第一训练数据进行分词提取合并处理,以得到第二训练数据包括:
通过预设的实体识别模型对所述第一训练数据中包含的去除噪音后的历史病历记录进行分词提取处理;
将分词提取处理结果与所述第一训练数据中包含的去除噪音后的历史医嘱信息进行合并加强处理,以得到所述第二训练数据。
4.根据权利要求2所述的方法,其特征在于,所述通过预设的成本模型对所述第二训练数据进行语料训练组合处理,以得到目标训练数据包括:
通过预设的成本模型对所述第二训练数据进行语料训练组合处理,以得到语料训练数据;
将所述语料训练数据与预设的编码相组合,以得到所述目标训练数据。
5.根据权利要求1所述的方法,其特征在于,在所述根据系统编码指令对所述第一编码进行预编码处理,以得到目标预编码之后,所述方法还包括:
获取第一编码信息,其中,所述第一编码信息包括通过对人工编码结果进行数据识别得到的编码信息;
将所述第一编码信息与所述目标预编码信息进行匹配处理;
在匹配失败的情况下,确定所述第一编码信息和/或目标预编码信息存在异常,并进行告警处理;否则进行正常提示处理。
6.根据权利要求5所述的方法,其特征在于,在匹配失败的情况下,确定所述第一编码信息和/或目标预编码信息存在异常之后,所述方法包括:
获取所述第一编码信息对应的第一病历信息;
根据所述第一病历信息确定多维病历特征,并计算所述多维病历特征之间的特征关系;
对所述特征关系进行编码分析处理,并基于所述编码分析处理结果进行编码异常反馈处理。
7.一种基于人工智能模型的病历预编码装置,其特征在于,包括:
病历采集模块,用于获取病历信息;
第一编码模块,用于通过预先训练好的编码模型对所述病历信息进行编码推导,以得到第一编码,其中,所述编码模型是通过对历史病历信息进行去噪和合并加强后得到的训练数据进行训练得到的;
编码处理模块,用于根据系统编码指令对所述第一编码进行预编码处理,以得到目标预编码,其中,所述预编码处理是基于预设的国际疾病分类编码规则实现的。
8.根据权利要求7所述的装置,其特征在于,所述装置包括:
历史病历采集模块,用于在所述通过预先训练好的编码模型对所述病历信息进行编码推导,以得到第一编码之前,获取历史病历信息,其中所述历史病历信息至少包括历史病历记录以及历史医嘱信息;
去噪模块,用于通过统计分析算法,对所述历史病历信息进行噪音去除处理,以得到第一训练数据;
分词提取合并模块,用于通过预设的实体识别模型对所述第一训练数据进行分词提取合并处理,以得到第二训练数据;
语料训练组合模块,用于通过预设的成本模型对所述第二训练数据进行语料训练组合处理,以得到目标训练数据;
模型训练模块,用于通过所述目标训练数据分别对预设的初始诊断编码模型以及初始手术编码模型进行训练,以得到目标诊断编码模型以及目标手术编码模型,其中,所述预先训练好的编码模型包括所述目标诊断编码模型以及所述目标手术编码模型。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至6任一项中所述的方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至6任一项中所述的方法。
CN202410098947.4A 2024-01-24 2024-01-24 一种基于人工智能模型的病历预编码方法及装置 Active CN117637092B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410098947.4A CN117637092B (zh) 2024-01-24 2024-01-24 一种基于人工智能模型的病历预编码方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410098947.4A CN117637092B (zh) 2024-01-24 2024-01-24 一种基于人工智能模型的病历预编码方法及装置

Publications (2)

Publication Number Publication Date
CN117637092A true CN117637092A (zh) 2024-03-01
CN117637092B CN117637092B (zh) 2024-04-23

Family

ID=90027274

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410098947.4A Active CN117637092B (zh) 2024-01-24 2024-01-24 一种基于人工智能模型的病历预编码方法及装置

Country Status (1)

Country Link
CN (1) CN117637092B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118098476A (zh) * 2024-04-28 2024-05-28 山东新时代药业有限公司 一种基于大数据的电子病历合格程度评价方法及系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110491499A (zh) * 2019-07-10 2019-11-22 厦门大学 面向标注电子病历的临床辅助决策方法及系统
CN111339126A (zh) * 2020-02-27 2020-06-26 平安医疗健康管理股份有限公司 医疗数据筛选方法、装置、计算机设备和存储介质
CN112489740A (zh) * 2020-12-17 2021-03-12 北京惠及智医科技有限公司 病历检测方法及相关模型的训练方法和相关设备、装置
CN112735544A (zh) * 2020-12-30 2021-04-30 杭州依图医疗技术有限公司 病历数据的处理方法、装置及存储介质
WO2021114620A1 (zh) * 2020-06-16 2021-06-17 平安科技(深圳)有限公司 病历质控方法、装置、计算机设备和存储介质
CN113012774A (zh) * 2019-12-18 2021-06-22 医渡云(北京)技术有限公司 病案自动编码方法、装置、电子设备及存储介质
WO2021139231A1 (zh) * 2020-06-30 2021-07-15 平安科技(深圳)有限公司 基于神经网络模型的分诊方法、装置和计算机设备
US20210319858A1 (en) * 2020-04-14 2021-10-14 International Business Machines Corporation Assigning medical codings
CN115064230A (zh) * 2022-06-09 2022-09-16 山东浪潮智慧医疗科技有限公司 Drg分组编码生成方法及系统
CN116230146A (zh) * 2022-10-09 2023-06-06 马上消费金融股份有限公司 数据处理方法、icd编码模型的训练方法及相关设备
CN116822579A (zh) * 2023-07-03 2023-09-29 齐鲁工业大学(山东省科学院) 基于对比学习的疾病分类icd自动编码方法和装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110491499A (zh) * 2019-07-10 2019-11-22 厦门大学 面向标注电子病历的临床辅助决策方法及系统
CN113012774A (zh) * 2019-12-18 2021-06-22 医渡云(北京)技术有限公司 病案自动编码方法、装置、电子设备及存储介质
CN111339126A (zh) * 2020-02-27 2020-06-26 平安医疗健康管理股份有限公司 医疗数据筛选方法、装置、计算机设备和存储介质
US20210319858A1 (en) * 2020-04-14 2021-10-14 International Business Machines Corporation Assigning medical codings
WO2021114620A1 (zh) * 2020-06-16 2021-06-17 平安科技(深圳)有限公司 病历质控方法、装置、计算机设备和存储介质
WO2021139231A1 (zh) * 2020-06-30 2021-07-15 平安科技(深圳)有限公司 基于神经网络模型的分诊方法、装置和计算机设备
CN112489740A (zh) * 2020-12-17 2021-03-12 北京惠及智医科技有限公司 病历检测方法及相关模型的训练方法和相关设备、装置
CN112735544A (zh) * 2020-12-30 2021-04-30 杭州依图医疗技术有限公司 病历数据的处理方法、装置及存储介质
CN115064230A (zh) * 2022-06-09 2022-09-16 山东浪潮智慧医疗科技有限公司 Drg分组编码生成方法及系统
CN116230146A (zh) * 2022-10-09 2023-06-06 马上消费金融股份有限公司 数据处理方法、icd编码模型的训练方法及相关设备
CN116822579A (zh) * 2023-07-03 2023-09-29 齐鲁工业大学(山东省科学院) 基于对比学习的疾病分类icd自动编码方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王天罡;李晓亮;张晓滨;蔡宏伟;: "基于预训练表征模型的自动ICD编码", 中国数字医学, no. 07, 15 July 2020 (2020-07-15) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118098476A (zh) * 2024-04-28 2024-05-28 山东新时代药业有限公司 一种基于大数据的电子病历合格程度评价方法及系统

Also Published As

Publication number Publication date
CN117637092B (zh) 2024-04-23

Similar Documents

Publication Publication Date Title
US11200379B2 (en) Ontologically driven procedure coding
CN117637092B (zh) 一种基于人工智能模型的病历预编码方法及装置
US8612261B1 (en) Automated learning for medical data processing system
CN110827941B (zh) 电子病历信息校正方法及系统
WO2021012637A1 (zh) 放射影像报告的智能随访方法、系统、设备及存储介质
WO2013176903A1 (en) Medical record generation and processing
WO2019045637A2 (en) PREDICTIVE ANALYTICAL SOLUTION FOR CUSTOM CLINIC DECISION ASSISTANCE
US20190108264A1 (en) System prototype of intelligent regional mobile healthcare integrated data center based on metadata
CN117637153B (zh) 患者安全护理的信息化管理系统及方法
CN112951414A (zh) 基层医疗临床辅助决策系统
CN113611433A (zh) 一种问诊辅助系统及方法
CN116895372A (zh) 一种基于大规模语言模型与元学习的智能急救分级系统
CN106777966B (zh) 基于医疗信息平台的数据互动训练方法及系统
CN116258136A (zh) 检错模型训练方法、医学影像报告检测方法、系统及设备
CN117012385A (zh) 一种基于知识图谱的病情风险检测方法和装置以及设备
CN108320788A (zh) 医院业务分析方法及装置
Hussain et al. Semantic transformation model for clinical documents in big data to support healthcare analytics
CN116230151A (zh) 一种病案双首页上传的方法、装置及系统
CN113643825A (zh) 基于临床关键特征信息的医疗案例知识库构建方法和系统
CN110910980A (zh) 一种脓毒血症的预警装置、设备及存储介质
AU2019100889A4 (en) System and method to find minimum diagnostics required for prescriptions and minimum medicines required to cure patient symptoms
Santos et al. SiSPED 2.0: an extension of a system to monitor diabetic patients
Borlawsky et al. Evaluation of an automated pressure ulcer risk assessment model
US20150379208A1 (en) Database Maping Method and System
Balasubramaniam Using Machine Learning to Identify Risk Factors Associated with Causes of Fetal Deaths in the United States, 2021

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant