CN114388085A - 一种基于病案的实时智能辅助icd编码方法及系统 - Google Patents

一种基于病案的实时智能辅助icd编码方法及系统 Download PDF

Info

Publication number
CN114388085A
CN114388085A CN202111391266.XA CN202111391266A CN114388085A CN 114388085 A CN114388085 A CN 114388085A CN 202111391266 A CN202111391266 A CN 202111391266A CN 114388085 A CN114388085 A CN 114388085A
Authority
CN
China
Prior art keywords
medical record
record data
real
icd
mapping model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111391266.XA
Other languages
English (en)
Other versions
CN114388085B (zh
Inventor
葛丹丹
夏泳
章豪
昂洁
司明舒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
First Affiliated Hospital of Wannan Medical College
Original Assignee
First Affiliated Hospital of Wannan Medical College
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by First Affiliated Hospital of Wannan Medical College filed Critical First Affiliated Hospital of Wannan Medical College
Priority to CN202111391266.XA priority Critical patent/CN114388085B/zh
Publication of CN114388085A publication Critical patent/CN114388085A/zh
Application granted granted Critical
Publication of CN114388085B publication Critical patent/CN114388085B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Primary Health Care (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Epidemiology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种基于病案的实时智能辅助ICD编码方法及系统,包括以下步骤:步骤S1、基于历史病案数据构建出表征病案数据和病种名称的非线性映射关系的第一映射模型;步骤S2、构建出表征病种名称和ICD编码的线性映射关系的第二映射模型,以及构建出表征病案数据和ICD编码的非线性关系的第三映射模型;步骤S3、将实时病案数据与历史病案数据进行偏离度比较,并在偏离度超阈值情况下利用第三映射模型输出实时病案数据的ICD编码以实现对实时病案数据的重编码。本发明将病案数据具象为数学函数进行表达,在此基础上构建的第一映射模型训练和运算从离散数据点转化为函数形式,训练速度以及运算效率都得以提高。

Description

一种基于病案的实时智能辅助ICD编码方法及系统
技术领域
本发明涉及病案ICD编码技术领域,具体涉及一种基于病案的实时智能辅助ICD编码方法及系统。
背景技术
疾病诊断相关分组(DRGs)是一种“以病人为中心”的病例组合系统,也是控制医疗付费,医院精细化管理及医疗评价的一项有效的工具,其主要数据来源于病案首页。国际疾病分类(ICD)是一种对不同类型的疾病及与健康相关的问题进行编码和分类的国际标准。DRGs入组的第一道门坎即是ICD-10 疾病编码,所以ICD疾病编码直接影响DRGs的顺利开展。
目前实际应用中,由医院产生ICD的编码过程难以满足包括医院在内各种管理需求。在我国,对疾病分类进行编码的工作主要是由医院的病案科(室) 的编码员负责,但编码员常常为其繁杂的查找方法、低质低效的查找结果、枯燥的工作内容所烦扰;厚重的分类修订本既不易携带,也不易于翻阅,若要高质量的编码,疾病统计工作量会远远大于医院已有的病案科人力所能承担的负荷,所以很多时候难以确保编码的准确性,更何况很多中小医院连合格的编码员都没有。为解决手工ICD编码耗时费力、成本昂贵、稳定性差等问题,研究者们开始研究通过计算机辅助进行ICD自动编码的各类方法和系统。包括基于规则的ICD编码系统、基于机器学习的ICD编码系统和基于深度学习的编码。
但现有技术中均存在以下问题:
1.编码系统多采用事后编码而非实时编码机制,即编码任务通常由病案小组的编码人员在病人出院后才完成。编码人员并不真正了解患者的实际情况,也存在对医生书写病历误解的可能性。因此,事后由病案小组编码的方式相比由医生实时进行ICD编码,存在更多的编码错误。
2.现有方法灵活性不够,难以适应不同医生的诊断书写风格,导致编码准确性不高。如基于规则的编码系统需要维护一个庞大的规则库,占用大量的存储空间;且该系统一旦迁移到其它医院,可能由于医生书写风格的改变,如多字、少字、同义词替换等,导致无法映射得到正确的ICD编码。
3.编码所用信息不全,导致系统准确率和查全率不高。医院病案中病历文本和医生(手写)诊断是两个最重要的编码依据,多数已有研究要么只对病历文本进行深度学习,但考虑到ICD编码的种类多达3万种,因此查准率不高;要么只关注医生诊断,一旦医生出现漏写、错写,则系统查全率降低。
发明内容
本发明的目的在于提供一种基于病案的实时智能辅助ICD编码方法及系统,以解决现有技术中ICD编码准确率低和及时性差的技术问题。
为解决上述技术问题,本发明具体提供下述技术方案:
一种基于病案的实时智能辅助ICD编码方法,包括以下步骤:
步骤S1、基于历史病案数据构建出表征病案数据和病种名称的非线性映射关系的第一映射模型,所述第一映射模型用于实现根据病案数据识别出病种名称;
步骤S2、基于ICD编码库构建出表征病种名称和ICD编码的线性映射关系的第二映射模型,所述第二映射模型用于实现根据病种名称识别出ICD编码,基于所述第一映射模型和第二映射模型构建出表征病案数据和ICD编码的非线性关系的第三映射模型,所述第三映射模型用于实现根据病案数据识别出 ICD编码;
步骤S3、将实时病案数据与历史病案数据进行偏离度比较,并在偏离度超阈值情况下利用第三映射模型输出实时病案数据的ICD编码以实现对实时病案数据的重编码,以及在偏离度未超阈值情况下将最小偏离度对应的历史病案数据的ICD编码作为实时病案数据的ICD编码以实现编码复用来降低编码通道的数据并发。
作为本发明的一种优选方案,所述基于历史病案数据构建出表征病案数据和病种名称的非线性映射关系的第一映射模型,包括:
将所述历史病案数据按病种名称进行分类得到多个病案数据集,并将历史病案数据的病种名称作为病案数据集的病种名称,所述病案数据集是由表征同一病种名称的所有历史病案数据聚集产生;
为病案数据集中的历史病案数据设置游离权重,并基于游离权重将病案数据集具象为数学函数以整体表达病案数据集中的所有历史病案数据,所述游离权重是衡量历史病案数据与病案数据集的集合中心处的病案数据的偏离程度的指标;
利用神经网络将病案数据集的数学函数和病案数据集的病种名称构建表征病案数据和病种名称的非线性映射关系的第一映射模型,所述第一映射模型的模型表达式为:
Z=F[X];
式中,Z表征为所述病案名称,X表征为所述数学函数,F表征为神经网络;
将所有病案数据集的数学函数和病案名称构成用于映射模型训练的样本元组集,并将样本元组集以数据量为7∶3分割成训练集和测试集带入第一映射模型进行模型训练以得到信号特征和工况环境特征非线性映射关系,所述样本元组的格式为:[数学函数,病案名称]。
作为本发明的一种优选方案,所述为病案数据集中的历史病案数据设置游离权重,并基于游离权重将病案数据集具象为数学函数,包括:
为病案数据集中的历史病案数据设置游离权重,所述游离权重的计算公式为:
Figure RE-GDA0003523017790000031
式中,wi,k表征为第i个病案数据集中第k个历史病案数据的游离权重, xi,o表征为第i个病案数据集的集合中心处的历史病案数据,xi,k表征为第i个病案数据集中第k个历史病案数据;
在游离权重中选择出最小游离权重wi,min和最大游离权重wi,max,并将最小游离权重和最大游离权重与病案数据集中心位置处的病案数据进行区间组合得到病案数据集的数学函数,所述病案数据集的数学函数为:
Xi=[wi,min*xi,o,wi,max*xi,o];
式中,wi,min、wi,max分别表征为第i个病案数据集的最小游离权重和最大游离权重,i,k,o均为计量常数,无实质含义。
作为本发明的一种优选方案,所述病案数据集的集合中心处的历史病案数据的计算公式为:
Figure RE-GDA0003523017790000041
式中,m表征为第i个信号数据集中包含的历史病案数据的总数目。
作为本发明的一种优选方案,所述基于ICD编码库构建出表征病种名称和 ICD编码的线性映射关系的第二映射模型,包括:
利用线性网络将病种名称和ICD编码构建表征病种名称和ICD编码的线性映射关系的第二映射模型,所述第二映射模型的模型表达式为:
Y=G[Z];
式中,Z表征为病案名称,Y表征为ICD编码,G表征为线性网络。
作为本发明的一种优选方案,所述基于所述第一映射模型和第二映射模型构建出表征病案数据和ICD编码的非线性关系的第三映射模型,包括:
基于所述第一映射模型和第二映射模型构建出表征病案数据和ICD编码的非线性关系的第三映射模型,所述第三映射模型的模型表达式为:
Y=G(F[X])。
作为本发明的一种优选方案,所述将实时病案数据与历史病案数据进行偏离度比较,包括:
计算实时病案数据与历史病案数据的偏离度,并选取出最小偏离度与阈值比较,其中,
当最小偏离度未超过阈值,则将实时病案数据的最小偏离度对应的历史病案数据的ICD编码作为实时病案数据的ICD编码;
当最小偏离度超过阈值,则利用第三映射模型输出实时病案数据的ICD 编码;
所述实时病案数据与历史病案数据的偏离度计算公式为:
Figure RE-GDA0003523017790000051
式中,pj,new表征为实时病案数据xnew与第j个历史病案数据xj的偏离度, xj表征为第j个历史病案数据,j为计量常数,无实质含义。
作为本发明的一种优选方案,所述利用第三映射模型输出实时病案数据的ICD编码,包括:
在偏离中选择出最小偏离度pmin,并将最小偏离度pmin与实时病案数据进行区间组合得到数学函数Xnew=[pmin*xnew,pmin*xnew];
将Xnew=[pmin*xnew,pmin*xnew]带入第三映射模型Y=G(F[X])中得到实时病案数据的ICD编码Ynew
作为本发明的一种优选方案,本发明提供了一种根据所述的基于病案的实时智能辅助ICD编码方法的编码系统,包括:
模型建立单元,用于基于历史病案数据构建出表征病案数据和病种名称的非线性映射关系的第一映射模型,基于ICD编码库构建出表征病种名称和 ICD编码的线性映射关系的第二映射模型,以及基于所述第一映射模型和第二映射模型构建出表征病案数据和ICD编码的非线性关系的第三映射模型;
实时编码单元,用于将实时病案数据与历史病案数据进行偏离度比较,并在偏离度超阈值情况下利用第三映射模型输出实时病案数据的ICD编码以实现对实时病案数据的重编码,以及在偏离度未超阈值情况下将最小偏离度对应的历史病案数据的ICD编码作为实时病案数据的ICD编码以实现编码复用来降低编码通道的数据并发。
作为本发明的一种优选方案,所述模型建立单元和实时编码单元通过网络通信完成数据交互。
本发明与现有技术相比较具有如下有益效果:
本发明基于历史病案数据构建出表征病案数据和病种名称的非线性映射关系的第一映射模型,避免医生漏写或误写编码信息而导致的准确率和查全率不高,实现准确率的提高,将病案数据具象为数学函数进行表达,在此基础上构建的第一映射模型训练和运算从离散数据点转化为函数形式,训练速度以及运算效率都得以提高,并在偏离度超阈值情况下利用第三映射模型输出实时病案数据的ICD编码以实现对实时病案数据的重编码,以及在偏离度未超阈值情况下将最小偏离度对应的历史病案数据的ICD编码作为实时病案数据的ICD编码以实现编码复用来降低编码通道的数据并发。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
图1为本发明实施例提供的实时智能辅助ICD编码方法流程图;
图2为本发明实施例提供的编码系统结构框图。
图中的标号分别表示如下:
1-模型建立单元;2-实时编码单元。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,编码系统多采用事后编码而非实时编码机制,即编码任务通常由病案小组的编码人员在病人出院后才完成。编码人员并不真正了解患者的实际情况,也存在对医生书写病历误解的可能性,或者医生书写风格存在差异,编码人员难以理解,以及医生出现漏写、误写情况,编码人员也无法确保编码正确性,因此本发明提供了一种基于病案的实时智能辅助ICD编码方法,可在获取实时病案数据后立即识别出病种名称再同步进行编码,并且直接根据病案数据识别出的病种名称进行编码,无需识别医生的书写风格,也避免医生漏写以及误写病种名称导致的编码错误,有效的提高编码效率和准确率。
一种基于病案的实时智能辅助ICD编码方法,包括以下步骤:
步骤S1、基于历史病案数据构建出表征病案数据和病种名称的非线性映射关系的第一映射模型,第一映射模型用于实现根据病案数据识别出病种名称;
为了避免医生书写风格、漏写和误写导致的无法识别到病种名称,本实施例直接从历史病案数据中自行识别出病种名称,病案数据包括各种仪器检查出的病理数据,该数据是固定且规范的,不存在书写风格的问题,直接基于此类规范数据构建出病案数据和病种名称的非线性映射关系的第一映射模型,可直接根据病案数据识别出病种名称,高效且准确,第一映射模型的构建方法如下:
基于历史病案数据构建出表征病案数据和病种名称的非线性映射关系的第一映射模型,包括:
将历史病案数据按病种名称进行分类得到多个病案数据集,并将历史病案数据的病种名称作为病案数据集的病种名称,病案数据集是由表征同一病种名称的所有历史病案数据聚集产生;
为病案数据集中的历史病案数据设置游离权重,并基于游离权重将病案数据集具象为数学函数以整体表达病案数据集中的所有历史病案数据,游离权重是衡量历史病案数据与病案数据集的集合中心处的病案数据的偏离程度的指标;
利用神经网络将病案数据集的数学函数和病案数据集的病种名称构建表征病案数据和病种名称的非线性映射关系的第一映射模型,第一映射模型的模型表达式为:
Z=F[X];
式中,Z表征为病案名称,X表征为数学函数,F表征为神经网络;
将所有病案数据集的数学函数和病案名称构成用于映射模型训练的样本元组集,并将样本元组集以数据量为7∶3分割成训练集和测试集带入第一映射模型进行模型训练以得到信号特征和工况环境特征非线性映射关系,样本元组的格式为:[数学函数,病案名称]。
为病案数据集中的历史病案数据设置游离权重,并基于游离权重将病案数据集具象为数学函数,包括:
为病案数据集中的历史病案数据设置游离权重,游离权重的计算公式为:
Figure RE-GDA0003523017790000081
式中,wi,k表征为第i个病案数据集中第k个历史病案数据的游离权重, xi,o表征为第i个病案数据集的集合中心处的历史病案数据,xi,k表征为第i个病案数据集中第k个历史病案数据;
在游离权重中选择出最小游离权重wi,min和最大游离权重wi,max,并将最小游离权重和最大游离权重与病案数据集中心位置处的病案数据进行区间组合得到病案数据集的数学函数,病案数据集的数学函数为:
Xi=[wi,min*xi,o,wi,max*xi,o];
式中,wi,min、wi,max分别表征为第i个病案数据集的最小游离权重和最大游离权重,i,k,o均为计量常数,无实质含义。
利用游离权重将整个病案数据集进行函数表达,可将历史病案数据从离散数据点形式量化为函数形式,实现了数据的压缩,降低了存储空间,而且基于函数形式的模型构建,可以直接将病案数据集的数学函数作为训练数据,无需对每个历史病案数据均进行模型训练,有效的提高了训练效率,比如,某一病案数据集包含100个历史病案数据点,将该病案数据集量化为数学函数形式得到Xi=[wi,min*xi,o,wi,max*xi,o],对于原始训练方式而言利用神经网络将病案数据集的历史病案数据和病案数据集的病种名称构建表征病案数据和病种名称的非线性映射关系的第一映射模型,第一映射模型的模型表达式为:
Z=F[x];
式中,Z表征为病案名称,x表征为历史病案数据,F表征为神经网络,原始训练而言是将该100个历史病案数据点xi,1~xi,100依次以样本元组[历史病案数据,病案名称]输入到第一映射模型Z=F[x]中训练得到表征病案数据和病种名称的非线性映射关系,整体训练的运算复杂度为病案数据集总数与每个病案数据集中病案数据量的总数目m的乘积,而本实施例将第一映射模型构建为利用神经网络将病案数据集的数学函数和病案数据集的病种名称构建表征病案数据和病种名称的非线性映射关系,第一映射模型的模型表达式为:
Z=F[X];
式中,Z表征为病案名称,X表征为数学函数,F表征为神经网络,在训练时只需将[数学函数,病案名称]输入到第一映射模型Z=F[x]中训练得到表征病案数据和病种名称的非线性映射关系,整体训练的运算复杂度等同于病案数据集总数,相交而言本实施例的训练效率更高。
病案数据集的集合中心处的历史病案数据的计算公式为:
Figure RE-GDA0003523017790000091
式中,m表征为第i个信号数据集中包含的历史病案数据的总数目。
步骤S2、基于ICD编码库构建出表征病种名称和ICD编码的线性映射关系的第二映射模型,第二映射模型用于实现根据病种名称识别出ICD编码,基于第一映射模型和第二映射模型构建出表征病案数据和ICD编码的非线性关系的第三映射模型,第三映射模型用于实现根据病案数据识别出ICD编码;
基于ICD编码库构建出表征病种名称和ICD编码的线性映射关系的第二映射模型,包括:
利用线性网络将病种名称和ICD编码构建表征病种名称和ICD编码的线性映射关系的第二映射模型,第二映射模型的模型表达式为:
Y=G[Z];
式中,Z表征为病案名称,Y表征为ICD编码,G表征为线性网络。
基于第一映射模型和第二映射模型构建出表征病案数据和ICD编码的非线性关系的第三映射模型,包括:
基于第一映射模型和第二映射模型构建出表征病案数据和ICD编码的非线性关系的第三映射模型,第三映射模型的模型表达式为:
Y=G(F[X])。
步骤S3、将实时病案数据与历史病案数据进行偏离度比较,并在偏离度超阈值情况下利用第三映射模型输出实时病案数据的ICD编码以实现对实时病案数据的重编码,以及在偏离度未超阈值情况下将最小偏离度对应的历史病案数据的ICD编码作为实时病案数据的ICD编码以实现编码复用来降低编码通道的数据并发。
将实时病案数据与历史病案数据进行偏离度比较,包括:
计算实时病案数据与历史病案数据的偏离度,并选取出最小偏离度与阈值比较,其中,
当最小偏离度未超过阈值,即说明实时病案数据与最小偏离度对应的历史病案数据越相似,则二者表达为同一种病案名称的概率越大,则将实时病案数据的最小偏离度对应的历史病案数据的ICD编码作为实时病案数据的ICD 编码,可无需调用第三映射模型进行运算,避免无效占用运算资源;
当最小偏离度超过阈值,即说明实时病案数据与最小偏离度对应的历史病案数据越不相似,则二者表达为同一种病案名称的概率越小,则利用第三映射模型输出实时病案数据的ICD编码;
实时病案数据与历史病案数据的偏离度计算公式为:
Figure RE-GDA0003523017790000101
式中,pj,new表征为实时病案数据xnew与第j个历史病案数据xj的偏离度, xj表征为第j个历史病案数据,j为计量常数,无实质含义。
利用第三映射模型输出实时病案数据的ICD编码,包括:
在偏离中选择出最小偏离度pmin,并将最小偏离度pmin与实时病案数据进行区间组合得到数学函数Xnew=[pmin*xnew,pmin*xnew];
将实时病案数据基于最小偏离度转换为数学函数形式Xnew=[pmin* xnew,pmin*xnew],符合模型的输入格式,利用最小偏离度是因为偏离度最小表征实时病案数据与最小偏离度对应的历史病案数据具有最高相似度,将实时病案数据和历史病案数据两个数据点构建为一个病案数据集合,将实时病案数据作为集合中心处的历史病案数据,则该病案数据集合的函数表达式 Xnew=[pmin*xnew,pmax*xnew],其中,由于只有两个点则pmax=pmin,因此构建得到Xnew=[pmin*xnew,pmin*xnew],也可以将实时病案数据的病案数据集构建的很大,但是如此只会增加计算复杂度,对于运算结果并会产生影响,在实际使用时可由用户进行自定义。
将Xnew=[pmin*xnew,pmin*xnew]带入第三映射模型Y=G(F[X])中得到实时病案数据的ICD编码Ynew
如图2所示,基于病案的实时智能辅助ICD编码方法,本发明提供了一种编码系统,包括:
模型建立单元1,用于基于历史病案数据构建出表征病案数据和病种名称的非线性映射关系的第一映射模型,基于ICD编码库构建出表征病种名称和 ICD编码的线性映射关系的第二映射模型,以及基于第一映射模型和第二映射模型构建出表征病案数据和ICD编码的非线性关系的第三映射模型;
实时编码单元2,用于将实时病案数据与历史病案数据进行偏离度比较,并在偏离度超阈值情况下利用第三映射模型输出实时病案数据的ICD编码以实现对实时病案数据的重编码,以及在偏离度未超阈值情况下将最小偏离度对应的历史病案数据的ICD编码作为实时病案数据的ICD编码以实现编码复用来降低编码通道的数据并发。
模型建立单元和实时编码单元通过网络通信完成数据交互。
本发明基于历史病案数据构建出表征病案数据和病种名称的非线性映射关系的第一映射模型,避免医生漏写或误写编码信息而导致的准确率和查全率不高,实现准确率的提高,将病案数据具象为数学函数进行表达,在此基础上构建的第一映射模型训练和运算从离散数据点转化为函数形式,训练速度以及运算效率都得以提高,并在偏离度超阈值情况下利用第三映射模型输出实时病案数据的ICD编码以实现对实时病案数据的重编码,以及在偏离度未超阈值情况下将最小偏离度对应的历史病案数据的ICD编码作为实时病案数据的ICD编码以实现编码复用来降低编码通道的数据并发。
以上实施例仅为本申请的示例性实施例,不用于限制本申请,本申请的保护范围由权利要求书限定。本领域技术人员可以在本申请的实质和保护范围内,对本申请做出各种修改或等同替换,这种修改或等同替换也应视为落在本申请的保护范围内。

Claims (10)

1.一种基于病案的实时智能辅助ICD编码方法,其特征在于,包括以下步骤:
步骤S1、基于历史病案数据构建出表征病案数据和病种名称的非线性映射关系的第一映射模型,所述第一映射模型用于实现根据病案数据识别出病种名称;
步骤S2、基于ICD编码库构建出表征病种名称和ICD编码的线性映射关系的第二映射模型,所述第二映射模型用于实现根据病种名称识别出ICD编码,基于所述第一映射模型和第二映射模型构建出表征病案数据和ICD编码的非线性关系的第三映射模型,所述第三映射模型用于实现根据病案数据识别出ICD编码;
步骤S3、将实时病案数据与历史病案数据进行偏离度比较,并在偏离度超阈值情况下利用第三映射模型输出实时病案数据的ICD编码以实现对实时病案数据的重编码,以及在偏离度未超阈值情况下将最小偏离度对应的历史病案数据的ICD编码作为实时病案数据的ICD编码以实现编码复用来降低编码通道的数据并发。
2.根据权利要求1所述的一种基于病案的实时智能辅助ICD编码方法,其特征在于:所述基于历史病案数据构建出表征病案数据和病种名称的非线性映射关系的第一映射模型,包括:
将所述历史病案数据按病种名称进行分类得到多个病案数据集,并将历史病案数据的病种名称作为病案数据集的病种名称,所述病案数据集是由表征同一病种名称的所有历史病案数据聚集产生;
为病案数据集中的历史病案数据设置游离权重,并基于游离权重将病案数据集具象为数学函数以整体表达病案数据集中的所有历史病案数据,所述游离权重是衡量历史病案数据与病案数据集的集合中心处的病案数据的偏离程度的指标;
利用神经网络将病案数据集的数学函数和病案数据集的病种名称构建表征病案数据和病种名称的非线性映射关系的第一映射模型,所述第一映射模型的模型表达式为:
Z=F[X];
式中,Z表征为所述病案名称,X表征为所述数学函数,F表征为神经网络;
将所有病案数据集的数学函数和病案名称构成用于映射模型训练的样本元组集,并将样本元组集以数据量为7∶3分割成训练集和测试集带入第一映射模型进行模型训练以得到信号特征和工况环境特征非线性映射关系,所述样本元组的格式为:[数学函数,病案名称]。
3.根据权利要求2所述的一种基于病案的实时智能辅助ICD编码方法,其特征在于:所述为病案数据集中的历史病案数据设置游离权重,并基于游离权重将病案数据集具象为数学函数,包括:
为病案数据集中的历史病案数据设置游离权重,所述游离权重的计算公式为:
Figure RE-FDA0003523017780000021
式中,wi,k表征为第i个病案数据集中第k个历史病案数据的游离权重,xi,o表征为第i个病案数据集的集合中心处的历史病案数据,xi,k表征为第i个病案数据集中第k个历史病案数据;
在游离权重中选择出最小游离权重wi,min和最大游离权重wi,max,并将最小游离权重和最大游离权重与病案数据集中心位置处的病案数据进行区间组合得到病案数据集的数学函数,所述病案数据集的数学函数为:
Xi=[wi,min*xi,o,wi,max*xi,o];
式中,wi,min、wi,max分别表征为第i个病案数据集的最小游离权重和最大游离权重,i,k,o均为计量常数,无实质含义。
4.根据权利要求3所述的一种基于病案的实时智能辅助ICD编码方法,其特征在于,所述病案数据集的集合中心处的历史病案数据的计算公式为:
Figure RE-FDA0003523017780000022
式中,m表征为第i个信号数据集中包含的历史病案数据的总数目。
5.根据权利要求4所述的一种基于病案的实时智能辅助ICD编码方法,其特征在于:所述基于ICD编码库构建出表征病种名称和ICD编码的线性映射关系的第二映射模型,包括:
利用线性网络将病种名称和ICD编码构建表征病种名称和ICD编码的线性映射关系的第二映射模型,所述第二映射模型的模型表达式为:
Y=G[Z];
式中,Z表征为病案名称,Y表征为ICD编码,G表征为线性网络。
6.根据权利要求5所述的一种基于病案的实时智能辅助ICD编码方法,其特征在于:所述基于所述第一映射模型和第二映射模型构建出表征病案数据和ICD编码的非线性关系的第三映射模型,包括:
基于所述第一映射模型和第二映射模型构建出表征病案数据和ICD编码的非线性关系的第三映射模型,所述第三映射模型的模型表达式为:
Y=G(F[X])。
7.根据权利要求6所述的一种基于病案的实时智能辅助ICD编码方法,其特征在于:所述将实时病案数据与历史病案数据进行偏离度比较,包括:
计算实时病案数据与历史病案数据的偏离度,并选取出最小偏离度与阈值比较,其中,
当最小偏离度未超过阈值,则将实时病案数据的最小偏离度对应的历史病案数据的ICD编码作为实时病案数据的ICD编码;
当最小偏离度超过阈值,则利用第三映射模型输出实时病案数据的ICD编码;
所述实时病案数据与历史病案数据的偏离度计算公式为:
Figure RE-FDA0003523017780000031
式中,pj,new表征为实时病案数据xnew与第j个历史病案数据xj的偏离度,xj表征为第j个历史病案数据,j为计量常数,无实质含义。
8.根据权利要求7所述的一种基于病案的实时智能辅助ICD编码方法,其特征在于,所述利用第三映射模型输出实时病案数据的ICD编码,包括:
在偏离中选择出最小偏离度pmin,并将最小偏离度pmin与实时病案数据进行区间组合得到数学函数Xnew=[pmin*xnew,pmin*xnew];
将Xnew=[pmin*xnew,pmin*xnew]带入第三映射模型Y=G(F[X])中得到实时病案数据的ICD编码Ynew
9.一种根据权利要求1-8任一项所述的基于病案的实时智能辅助ICD编码方法的编码系统,其特征在于,包括:
模型建立单元(1),用于基于历史病案数据构建出表征病案数据和病种名称的非线性映射关系的第一映射模型,基于ICD编码库构建出表征病种名称和ICD编码的线性映射关系的第二映射模型,以及基于所述第一映射模型和第二映射模型构建出表征病案数据和ICD编码的非线性关系的第三映射模型;
实时编码单元(2),用于将实时病案数据与历史病案数据进行偏离度比较,并在偏离度超阈值情况下利用第三映射模型输出实时病案数据的ICD编码以实现对实时病案数据的重编码,以及在偏离度未超阈值情况下将最小偏离度对应的历史病案数据的ICD编码作为实时病案数据的ICD编码以实现编码复用来降低编码通道的数据并发。
10.根据权利要求9所述的一种编码系统,其特征在于,所述模型建立单元和实时编码单元通过网络通信完成数据交互。
CN202111391266.XA 2021-11-23 2021-11-23 一种基于病案的实时智能辅助icd编码方法及系统 Active CN114388085B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111391266.XA CN114388085B (zh) 2021-11-23 2021-11-23 一种基于病案的实时智能辅助icd编码方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111391266.XA CN114388085B (zh) 2021-11-23 2021-11-23 一种基于病案的实时智能辅助icd编码方法及系统

Publications (2)

Publication Number Publication Date
CN114388085A true CN114388085A (zh) 2022-04-22
CN114388085B CN114388085B (zh) 2022-09-09

Family

ID=81195929

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111391266.XA Active CN114388085B (zh) 2021-11-23 2021-11-23 一种基于病案的实时智能辅助icd编码方法及系统

Country Status (1)

Country Link
CN (1) CN114388085B (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004066122A2 (en) * 2003-01-16 2004-08-05 Fabricant Christopher J Method and system for facilitating medical diagnostic coding
CN109273062A (zh) * 2018-08-09 2019-01-25 北京爱医声科技有限公司 Icd智能辅助编码系统
WO2019196211A1 (zh) * 2018-04-09 2019-10-17 平安科技(深圳)有限公司 一种筛选病历的方法、终端设备及计算机可读存储介质
CN110491465A (zh) * 2019-08-20 2019-11-22 山东众阳健康科技集团有限公司 基于深度学习的疾病分类编码方法、系统、设备及介质
CN110991170A (zh) * 2019-12-05 2020-04-10 清华大学 基于电子病历信息的中文疾病名称智能标准化方法与系统
CN111026841A (zh) * 2019-11-27 2020-04-17 云知声智能科技股份有限公司 一种基于检索和深度学习的自动编码方法及装置
US20200143914A1 (en) * 2018-11-05 2020-05-07 Intelligent Medical Objects, Inc. User Interface, System, and Method for Optimization of Patient Problem List Encoding
CN111462896A (zh) * 2020-03-31 2020-07-28 重庆大学 一种基于病案的实时智能辅助icd编码系统和方法
CN111506673A (zh) * 2020-03-27 2020-08-07 泰康保险集团股份有限公司 一种病案的分类码确定方法和装置
CN111540468A (zh) * 2020-04-21 2020-08-14 重庆大学 一种诊断原因可视化的icd自动编码方法与系统
CN111785387A (zh) * 2020-07-02 2020-10-16 朱玮 一种使用Bert做疾病标准化映射分类的方法及系统
JP2021060932A (ja) * 2019-10-09 2021-04-15 株式会社イーエムシステムズ 傷病名推論システム、傷病名推論方法、傷病名推論プログラム、及びデータ構造
CN112992366A (zh) * 2021-03-01 2021-06-18 袁素华 基于医保病种付费制icd编码人工智能审核质控模式与系统
WO2021146941A1 (zh) * 2020-01-21 2021-07-29 京东方科技集团股份有限公司 疾病位置获取方法、装置、设备以及计算机可读存储介质
CN113674824A (zh) * 2021-07-09 2021-11-19 中电通商数字技术(上海)有限公司 一种基于区域医疗大数据的疾病编码方法和系统

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004066122A2 (en) * 2003-01-16 2004-08-05 Fabricant Christopher J Method and system for facilitating medical diagnostic coding
WO2019196211A1 (zh) * 2018-04-09 2019-10-17 平安科技(深圳)有限公司 一种筛选病历的方法、终端设备及计算机可读存储介质
CN109273062A (zh) * 2018-08-09 2019-01-25 北京爱医声科技有限公司 Icd智能辅助编码系统
US20200143914A1 (en) * 2018-11-05 2020-05-07 Intelligent Medical Objects, Inc. User Interface, System, and Method for Optimization of Patient Problem List Encoding
WO2021032219A2 (zh) * 2019-08-20 2021-02-25 山东众阳健康科技集团有限公司 基于深度学习的疾病分类编码方法、系统、设备及介质
CN110491465A (zh) * 2019-08-20 2019-11-22 山东众阳健康科技集团有限公司 基于深度学习的疾病分类编码方法、系统、设备及介质
JP2021060932A (ja) * 2019-10-09 2021-04-15 株式会社イーエムシステムズ 傷病名推論システム、傷病名推論方法、傷病名推論プログラム、及びデータ構造
CN111026841A (zh) * 2019-11-27 2020-04-17 云知声智能科技股份有限公司 一种基于检索和深度学习的自动编码方法及装置
CN110991170A (zh) * 2019-12-05 2020-04-10 清华大学 基于电子病历信息的中文疾病名称智能标准化方法与系统
WO2021146941A1 (zh) * 2020-01-21 2021-07-29 京东方科技集团股份有限公司 疾病位置获取方法、装置、设备以及计算机可读存储介质
CN111506673A (zh) * 2020-03-27 2020-08-07 泰康保险集团股份有限公司 一种病案的分类码确定方法和装置
CN111462896A (zh) * 2020-03-31 2020-07-28 重庆大学 一种基于病案的实时智能辅助icd编码系统和方法
CN111540468A (zh) * 2020-04-21 2020-08-14 重庆大学 一种诊断原因可视化的icd自动编码方法与系统
CN111785387A (zh) * 2020-07-02 2020-10-16 朱玮 一种使用Bert做疾病标准化映射分类的方法及系统
CN112992366A (zh) * 2021-03-01 2021-06-18 袁素华 基于医保病种付费制icd编码人工智能审核质控模式与系统
CN113674824A (zh) * 2021-07-09 2021-11-19 中电通商数字技术(上海)有限公司 一种基于区域医疗大数据的疾病编码方法和系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
MARIO ALMAGRO 等: "ICD-10 Coding of Spanish Electronic Discharge Summaries:An Extreme Classification Problem", 《IEEE ACCESS》 *
候雪飞: "面向医疗数据的实体分析与自动编码技术研究与应用", 《中国优秀硕士学位论文全文数据库 医药卫生科技辑》 *
宁温馨 等: "基于语义相似度计算的临床诊断自动编码算法研究", 《医学信息学杂志》 *
梁文桐 等: "基于BERT的医疗电子病历命名实体识别", 《湖南工业大学学报》 *
陈峰 等: "自动编码系统在病案首页疾病编码中应用的效果分析", 《中国病案》 *

Also Published As

Publication number Publication date
CN114388085B (zh) 2022-09-09

Similar Documents

Publication Publication Date Title
CN111462896B (zh) 一种基于病案的实时智能辅助icd编码系统和方法
WO2022078346A1 (zh) 文本意图识别方法、装置、电子设备及存储介质
CN109584975B (zh) 医疗数据标准化处理方法及装置
CN112183026B (zh) Icd编码方法、装置、电子设备和存储介质
CN112149414B (zh) 文本相似度确定方法、装置、设备及存储介质
CN106649223A (zh) 基于自然语言处理的金融报告自动生成方法
US20150317449A1 (en) Medication Delivery System
CN109994216A (zh) 一种基于机器学习的icd智能诊断编码方法
WO2009008968A1 (en) System and method for data collection and management
CN111400366B (zh) 一种基于CatBoost模型的交互式门诊量预测可视分析方法及系统
CN108564991A (zh) 基于icd的数据化编码病历错误识别系统及其识别方法
CN111180062A (zh) 基于原始诊断数据的疾病分类编码智能推荐方法
US11791048B2 (en) Machine-learning-based healthcare system
CN116860987A (zh) 基于生成式大语言模型的领域知识图谱构建方法和系统
WO2021114635A1 (zh) 患者分群模型构建方法、患者分群方法及相关设备
CN112489740A (zh) 病历检测方法及相关模型的训练方法和相关设备、装置
US11875884B2 (en) Expression of clinical logic with positive and negative explainability
CN113343696A (zh) 电子病历命名实体的识别方法、装置、远程终端及系统
CN101877035A (zh) 基于金标准数据库的心电图分析系统
JP2021536636A (ja) 医療記録を分類する方法
CN113297852B (zh) 一种医学实体词的识别方法和装置
Qudsi et al. Predictive data mining of chronic diseases using decision tree: A case study of health insurance company in Indonesia
CN117809798A (zh) 基于大模型的检验报告解读方法、系统、设备及介质
CN114388085B (zh) 一种基于病案的实时智能辅助icd编码方法及系统
TWI825467B (zh) 資料分析系統及資料分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant