CN109785959A - 一种疾病编码方法和装置 - Google Patents

一种疾病编码方法和装置 Download PDF

Info

Publication number
CN109785959A
CN109785959A CN201811535074.XA CN201811535074A CN109785959A CN 109785959 A CN109785959 A CN 109785959A CN 201811535074 A CN201811535074 A CN 201811535074A CN 109785959 A CN109785959 A CN 109785959A
Authority
CN
China
Prior art keywords
candidate
diseases
international classification
coding
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811535074.XA
Other languages
English (en)
Inventor
李濠辰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Medical and Healthcare Management Co Ltd
Original Assignee
Ping An Medical and Healthcare Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Medical and Healthcare Management Co Ltd filed Critical Ping An Medical and Healthcare Management Co Ltd
Priority to CN201811535074.XA priority Critical patent/CN109785959A/zh
Publication of CN109785959A publication Critical patent/CN109785959A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种疾病编码方法和装置,该方法包括:获取结构化的电子病例;对结构化的电子病例的目标字段进行分词,得到多个关键词,目标字段至少包括医生诊断描述字段、患病部位字段、症状字段、检查结果字段;从医疗知识库中查找与多个关键词相匹配的至少一个候选国际疾病分类编码;将候选国际疾病分类编码输入机器学习模型,得到候选国际疾病分类编码的分数排名;输出候选国际疾病分类编码及其分数排名;根据候选国际疾病分类编码的分数排名向用户推荐至少一个候选国际疾病分类编码。因此,本发明实施例提供的技术方案能够解决现有技术中凭借经验人工编码准确度低的问题。

Description

一种疾病编码方法和装置
【技术领域】
本发明涉及编码领域,尤其涉及一种疾病编码方法和装置。
【背景技术】
目前对病案首页进行ICD编码(国际疾病分类,international Classificationof diseases,ICD),是依据疾病的某些特征,按照规则将疾病分门别类,并用编码的方法来表示的系统。大部分是靠医生在对患者诊治之后进行填写,但由于医生往往按照自己的习惯去书写诊断情况,不一定符合ICD规范,而且还会有写错或者漏写的情况,所以这些问题还需要后续病案科的编码人员去完善,但受限于编码人员水平参差不齐,编码遗漏或者写错的情况依然存在。
【发明内容】
有鉴于此,本发明实施例提供了一种疾病编码方法和装置,用以解决现有技术凭借经验人工编码准确度低的问题。
一方面,本发明实施例提供了一种疾病编码方法,所述方法包括:获取结构化的电子病例;对所述结构化的电子病例的目标字段进行分词,得到多个关键词,所述目标字段至少包括医生诊断描述字段、患病部位字段、症状字段、检查结果字段;从医疗知识库中查找与多个所述关键词相匹配的至少一个候选国际疾病分类编码;将所述候选国际疾病分类编码输入机器学习模型,得到所述候选国际疾病分类编码的分数排名;输出所述候选国际疾病分类编码及其分数排名;根据所述候选国际疾病分类编码的分数排名向用户推荐至少一个所述候选国际疾病分类编码。
进一步地,所述根据所述候选国际疾病分类编码的分数排名向用户推荐至少一个所述候选国际疾病分类编码,包括:筛选出分数排名靠前的预设数量的所述候选国际疾病分类编码,并向所述用户推荐筛选出的所述候选国际疾病分类编码;或,计算分数排名靠前的预设数量的所述候选国际疾病分类编码的置信度;将置信度大于预设置信度的所述候选国际疾病分类编码向所述用户进行推荐。
进一步地,所述医疗知识库有多个,所述从医疗知识库中查找与多个所述关键词相匹配的至少一个候选国际疾病分类编码,包括:计算多个所述关键词与每个所述医疗知识库的匹配程度;将匹配程度最高的所述医疗知识库作为目标医疗知识库;从所述目标医疗知识库中查找与多个所述关键词相匹配的至少一个所述候选国际疾病分类编码。
进一步地,所述将所述候选国际疾病分类编码输入机器学习模型,得到所述候选国际疾病分类编码的分数排名,包括:将所述候选国际疾病分类编码输入机器学习模型的多维度评分器,得到所述候选国际疾病分类编码基于多个预设维度的分数;将所述候选国际疾病分类编码基于多个所述预设维度的分数进行加权计算,得到所述候选国际疾病分类编码的分数;按照分数由高到低的顺序对多个所述候选国际疾病分类编码进行排名。
进一步地,所述从医疗知识库中查找与多个所述关键词相匹配的至少一个候选国际疾病分类编码,包括:获取所述关键词之间的医疗关联关系;根据所述医疗关联关系从所述医疗知识库中查找与多个所述关键词相匹配的至少一个所述候选国际疾病分类编码。
进一步地,所述对结构化的电子病例的目标字段进行分词,得到的多个所述关键词包括命名实体,所述从医疗知识库中查找与多个所述关键词相匹配的至少一个候选国际疾病分类编码,包括:根据所述命名实体和分词得到的其他关键词从所述医疗知识库中查找所述候选国际疾病分类编码。
一方面,本发明实施例提供了一种疾病编码装置,所述装置包括:获取单元,用于获取结构化的电子病例;分词单元,用于对所述结构化的电子病例的目标字段进行分词,得到多个关键词,所述目标字段至少包括医生诊断描述字段、患病部位字段、症状字段、检查结果字段;查找单元,用于从医疗知识库中查找与多个所述关键词相匹配的至少一个候选国际疾病分类编码;输入单元,用于将所述候选国际疾病分类编码输入机器学习模型,得到所述候选国际疾病分类编码的分数排名;输出单元,用于输出所述候选国际疾病分类编码及其分数排名;推荐单元,用于根据所述候选国际疾病分类编码的分数排名向用户推荐至少一个所述候选国际疾病分类编码。
进一步地,所述推荐单元包括:第一推荐子单元,用于筛选出分数排名靠前的预设数量的所述候选国际疾病分类编码,并向所述用户推荐筛选出的所述候选国际疾病分类编码;或,第二推荐子单元,用于计算分数排名靠前的预设数量的所述候选国际疾病分类编码的置信度;将置信度大于预设置信度的所述候选国际疾病分类编码向所述用户进行推荐。
进一步地,所述医疗知识库有多个,所述查找单元包括:第一计算子单元,用于计算多个所述关键词与每个所述医疗知识库的匹配程度;确定子单元,用于将匹配程度最高的所述医疗知识库作为目标医疗知识库;第一查找子单元,用于从所述目标医疗知识库中查找与多个所述关键词相匹配的至少一个所述候选国际疾病分类编码。
进一步地,所述输入单元包括:输入子单元,用于将所述候选国际疾病分类编码输入机器学习模型的多维度评分器,得到所述候选国际疾病分类编码基于多个预设维度的分数;第二计算子单元,用于将所述候选国际疾病分类编码基于多个所述预设维度的分数进行加权计算,得到所述候选国际疾病分类编码的分数;排名子单元,用于按照分数由高到低的顺序对多个所述候选国际疾病分类编码进行排名。
进一步地,所述查找单元包括:获取子单元,用于获取所述关键词之间的医疗关联关系;第二查找子单元,用于根据所述医疗关联关系从所述医疗知识库中查找与多个所述关键词相匹配的至少一个所述候选国际疾病分类编码。
进一步地,所述对结构化的电子病例的目标字段进行分词,得到的多个所述关键词包括命名实体,所述查找单元包括:第三查找子单元,用于根据所述命名实体和分词得到的其他关键词从所述医疗知识库中查找所述候选国际疾病分类编码。
一方面,本发明实施例提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述的疾病编码方法。
一方面,本发明实施例提供了一种计算机设备,包括存储器和处理器,所述存储器用于存储包括程序指令的信息,所述处理器用于控制程序指令的执行,所述程序指令被处理器加载并执行时实现上述的疾病编码方法的步骤。
本方案中,对医生诊断描述字段、患病部位字段、症状字段、检查结果字段进行分词,得到多个关键词,根据多个关键词从医疗知识库中查找候选ICD编码,使用机器学习模型对候选ICD编码进行打分,根据分数排名向用户推荐候选ICD编码,避免了凭借经验人工编码准确度低的问题,达到了提高编码准确度的效果。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例提供的一种疾病编码方法的流程图;
图2是本发明实施例提供的一种疾病编码装置的示意图;
图3是本发明实施例提供的一种计算机设备的示意图。
【具体实施方式】
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
国际疾病分类编码,下文简称为ICD编码。
本发明实施例提供了一种疾病编码方法,如图1所示,该方法包括:
步骤S100,获取结构化的电子病例。
步骤S102,对结构化的电子病例的目标字段进行分词,得到多个关键词,目标字段至少包括医生诊断描述字段、患病部位字段、症状字段、检查结果字段。
步骤S104,从医疗知识库中查找与多个关键词相匹配的至少一个候选ICD编码。
步骤S106,将候选ICD编码输入机器学习模型,得到候选ICD编码的分数排名。
步骤S108,输出候选ICD编码及其分数排名。
步骤S110,根据候选ICD编码的分数排名向用户推荐至少一个候选ICD编码。
国际疾病分类(International Classification of Diseases,ICD)是国际统一的疾病分类方法,它根据疾病的病因、病例、临床表现等特性,将疾病分门别类,使其成为一个有序的组合,并用编码的方法来表示的系统。
本方案中,对医生诊断描述字段、患病部位字段、症状字段、检查结果字段进行分词,得到多个关键词,根据多个关键词从医疗知识库中查找候选ICD编码,使用机器学习模型对候选ICD编码进行打分,根据分数排名向用户推荐候选ICD编码,避免了凭借经验人工编码准确度低的问题,达到了提高编码准确度的效果。
根据候选ICD编码的分数排名向用户推荐候选ICD编码的方法有多种,下面列出其中两种。
可选地,根据候选ICD编码的分数排名向用户推荐至少一个候选ICD编码,具体包括:筛选出分数排名靠前的预设数量的候选ICD编码,并向用户推荐筛选出的候选ICD编码。
可选地,根据候选ICD编码的分数排名向用户推荐至少一个候选ICD编码,具体包括:计算分数排名靠前的预设数量的候选ICD编码的置信度;将置信度大于预设置信度的候选ICD编码向用户进行推荐。
本方案中,使用机器学习模型对结构化电子病例进行语义语法分析,从而生成相应的ICD编码,实现自动生成电子病例诊断、手术等ICD编码,并结合深度学习技术和电子病例中症状或检查结果,避免了现阶段只根据诊断描述进行ICD编码导致的编码不准确问题,提高了编码的准确度,实现了智能编码。
可选地,医疗知识库有多个,从医疗知识库中查找与多个关键词相匹配的至少一个候选ICD编码,具体包括:计算关键词与每个医疗知识库的匹配程度;将匹配程度最高的医疗知识库作为目标医疗知识库;从目标医疗知识库中查找与多个关键词相匹配的至少一个候选ICD编码。
例如,一共有3个医疗知识库,分别为内科医疗知识库、外科医疗知识库、手术医疗知识库。对结构化的电子病例的医生诊断描述字段、患病部位字段、症状字段、检查结果字段进行分词,得到多个关键词,分别为关键词K1、关键词K2、……、关键词K8。将关键词K1、关键词K2、……、关键词K8与3个医疗知识库进行匹配,假设匹配程度最高的医疗知识库为手术医疗知识库,则将手术医疗知识库作为目标医疗知识库,从手术医疗知识库中查找与上述8个关键词相匹配的至少一个候选ICD编码。
可选地,将候选ICD编码输入机器学习模型,得到候选ICD编码的分数排名,具体地,可以为:将候选ICD编码输入机器学习模型的多维度评分器,得到候选ICD编码基于多个预设维度的分数;将候选ICD编码基于多个预设维度的分数进行加权计算,得到候选ICD编码的分数;按照分数由高到低的顺序对多个候选ICD编码进行排名。
例如,多个预设维度包括维度D1、维度D2、维度D3、……、维度Dn,将候选ICD编码输入机器学习模型的多维度评分器,得到候选ICD编码基于n个预设维度的分数,其中,基于维度D1的分数为S1、基于维度D2的分数为S2、……、基于维度Dn的分数为Sn,则候选ICD编码的分数=S1×Q1+S2×Q2+……+Sn×Qn,其中,Q1为维度D1的权重,Q2为维度D2的权重,……,Sn为维度Dn的权重。
通过调整不同维度的权重指标,能够改变排名时重点考虑的因素。例如,如果想着重考虑维度D3,则将维度D3的权重Q3调高即可。
当维度的权重指标调整后,候选ICD编码进行排名之后得到的排名顺序可能会发生变化。
可选地,对结构化的电子病例的目标字段进行分词,得到多个关键词,从医疗知识库中查找与多个关键词相匹配的至少一个候选ICD编码,具体包括:获取不同关键词之间的医疗关联关系;根据不同关键词之间的医疗关联关系从医疗知识库中查找与多个关键词相匹配的至少一个候选ICD编码。
医疗关联关系可以是一种制约关系,例如,关键词A和关键词B大多数情况下不会出现在同一个病案首页,再例如,关键词A和关键词C经常出现在同一个语境下。通过根据医疗关联关系查找候选ICD编码,能够提高查找候选ICD编码的效率。
可选地,对结构化的电子病例的目标字段进行分词,得到多个关键词,其中,得到的关键词包括命名实体,之后,根据命名实体从医疗知识库中查找候选ICD编码。
在生物医学领域内,重要的命名实体包括:基因名称、蛋白质名称、蛋白质结构属性名称、化合物名称、药物名称和疾病名称等,其中比较重要的是基因名称和蛋白质名称。根据命名实体从医疗知识库中查找候选ICD编码,能够使查找结果准确度更高。
使用机器学习对电子病例进行自动编码,解决了编码不准确、不规范、遗漏缺项的问题,同时运用深度学习技术,并结合病例中相关诊断描述,提高了编码的准确度。
本发明实施例提供了一种疾病编码装置,该装置用于执行上述疾病编码方法,如图2所示,该装置包括:获取单元210、分词单元220、查找单元230、输入单元240、输出单元250、推荐单元260。
获取单元210,用于获取结构化的电子病例。
分词单元220,用于对结构化的电子病例的目标字段进行分词,得到多个关键词,目标字段至少包括医生诊断描述字段、患病部位字段、症状字段、检查结果字段。
查找单元230,用于从医疗知识库中查找与多个关键词相匹配的至少一个候选国际疾病分类编码。
输入单元240,用于将候选国际疾病分类编码输入机器学习模型,得到候选国际疾病分类编码的分数排名。
输出单元250,用于输出候选国际疾病分类编码及其分数排名。
推荐单元260,用于根据候选国际疾病分类编码的分数排名向用户推荐至少一个候选国际疾病分类编码。
国际疾病分类(International Classification of Diseases,ICD)是国际统一的疾病分类方法,它根据疾病的病因、病例、临床表现等特性,将疾病分门别类,使其成为一个有序的组合,并用编码的方法来表示的系统。
本方案中,对医生诊断描述字段、患病部位字段、症状字段、检查结果字段进行分词,得到多个关键词,根据多个关键词从医疗知识库中查找候选ICD编码,使用机器学习模型对候选ICD编码进行打分,根据分数排名向用户推荐候选ICD编码,避免了凭借经验人工编码准确度低的问题,达到了提高编码准确度的效果。
可选地,推荐单元260包括:第一推荐子单元或第二推荐子单元。第一推荐子单元,用于筛选出分数排名靠前的预设数量的候选国际疾病分类编码,并向用户推荐筛选出的候选国际疾病分类编码。第二推荐子单元,用于计算分数排名靠前的预设数量的候选国际疾病分类编码的置信度;将置信度大于预设置信度的候选国际疾病分类编码向用户进行推荐。
可选地,医疗知识库有多个,查找单元230包括:第一计算子单元、确定子单元、第一查找子单元。第一计算子单元,用于计算多个关键词与每个医疗知识库的匹配程度。确定子单元,用于将匹配程度最高的医疗知识库作为目标医疗知识库。第一查找子单元,用于从目标医疗知识库中查找与多个关键词相匹配的至少一个候选国际疾病分类编码。
例如,一共有3个医疗知识库,分别为内科医疗知识库、外科医疗知识库、手术医疗知识库。对结构化的电子病例的医生诊断描述字段、患病部位字段、症状字段、检查结果字段进行分词,得到多个关键词,分别为关键词K1、关键词K2、……、关键词K8。将关键词K1、关键词K2、……、关键词K8与3个医疗知识库进行匹配,假设匹配程度最高的医疗知识库为手术医疗知识库,则将手术医疗知识库作为目标医疗知识库,从手术医疗知识库中查找与上述8个关键词相匹配的至少一个候选ICD编码。
可选地,输入单元240包括:输入子单元、第二计算子单元、排名子单元。输入子单元,用于将候选国际疾病分类编码输入机器学习模型的多维度评分器,得到候选国际疾病分类编码基于多个预设维度的分数。第二计算子单元,用于将候选国际疾病分类编码基于多个预设维度的分数进行加权计算,得到候选国际疾病分类编码的分数。排名子单元,用于按照分数由高到低的顺序对多个候选国际疾病分类编码进行排名。
例如,多个预设维度包括维度D1、维度D2、维度D3、……、维度Dn,将候选ICD编码输入机器学习模型的多维度评分器,得到候选ICD编码基于n个预设维度的分数,其中,基于维度D1的分数为S1、基于维度D2的分数为S2、……、基于维度Dn的分数为Sn,则候选ICD编码的分数=S1×Q1+S2×Q2+……+Sn×Qn,其中,Q1为维度D1的权重,Q2为维度D2的权重,……,Sn为维度Dn的权重。
通过调整不同维度的权重指标,能够改变排名时重点考虑的因素。例如,如果想着重考虑维度D3,则将维度D3的权重Q3调高即可。
当维度的权重指标调整后,候选ICD编码进行排名之后得到的排名顺序可能会发生变化。
可选地,查找单元230包括:获取子单元、第二查找子单元。获取子单元,用于获取关键词之间的医疗关联关系。第二查找子单元,用于根据医疗关联关系从医疗知识库中查找与多个关键词相匹配的至少一个候选国际疾病分类编码。
医疗关联关系可以是一种制约关系,例如,关键词A和关键词B大多数情况下不会出现在同一个病案首页,再例如,关键词A和关键词C经常出现在同一个语境下。通过根据医疗关联关系查找候选ICD编码,能够提高查找候选ICD编码的效率。
可选地,对结构化的电子病例的目标字段进行分词,得到的多个关键词包括命名实体,查找单元230包括:第三查找子单元。第三查找子单元,用于根据命名实体和分词得到的其他关键词从医疗知识库中查找候选国际疾病分类编码。
在生物医学领域内,重要的命名实体包括:基因名称、蛋白质名称、蛋白质结构属性名称、化合物名称、药物名称和疾病名称等,其中比较重要的是基因名称和蛋白质名称。根据命名实体从医疗知识库中查找候选ICD编码,能够使查找结果准确度更高。
本发明实施例提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行以下步骤:获取结构化的电子病例;对结构化的电子病例的目标字段进行分词,得到多个关键词,目标字段至少包括医生诊断描述字段、患病部位字段、症状字段、检查结果字段;从医疗知识库中查找与多个关键词相匹配的至少一个候选国际疾病分类编码;将候选国际疾病分类编码输入机器学习模型,得到候选国际疾病分类编码的分数排名;输出候选国际疾病分类编码及其分数排名;根据候选国际疾病分类编码的分数排名向用户推荐至少一个候选国际疾病分类编码。
可选地,在程序运行时控制存储介质所在设备还执行以下步骤:筛选出分数排名靠前的预设数量的候选国际疾病分类编码,并向用户推荐筛选出的候选国际疾病分类编码;或,计算分数排名靠前的预设数量的候选国际疾病分类编码的置信度;将置信度大于预设置信度的候选国际疾病分类编码向用户进行推荐。
可选地,在程序运行时控制存储介质所在设备还执行以下步骤:计算多个关键词与每个医疗知识库的匹配程度;将匹配程度最高的医疗知识库作为目标医疗知识库;从目标医疗知识库中查找与多个关键词相匹配的至少一个候选国际疾病分类编码。
可选地,在程序运行时控制存储介质所在设备还执行以下步骤:将候选国际疾病分类编码输入机器学习模型的多维度评分器,得到候选国际疾病分类编码基于多个预设维度的分数;将候选国际疾病分类编码基于多个预设维度的分数进行加权计算,得到候选国际疾病分类编码的分数;按照分数由高到低的顺序对多个候选国际疾病分类编码进行排名。
可选地,在程序运行时控制存储介质所在设备还执行以下步骤:获取关键词之间的医疗关联关系;根据医疗关联关系从医疗知识库中查找与多个关键词相匹配的至少一个候选国际疾病分类编码。
可选地,在程序运行时控制存储介质所在设备还执行以下步骤:根据命名实体和分词得到的其他关键词从医疗知识库中查找候选国际疾病分类编码。
本发明实施例提供了一种计算机设备,包括存储器和处理器,存储器用于存储包括程序指令的信息,处理器用于控制程序指令的执行,程序指令被处理器加载并执行时实现以下步骤:获取结构化的电子病例;对结构化的电子病例的目标字段进行分词,得到多个关键词,目标字段至少包括医生诊断描述字段、患病部位字段、症状字段、检查结果字段;从医疗知识库中查找与多个关键词相匹配的至少一个候选国际疾病分类编码;将候选国际疾病分类编码输入机器学习模型,得到候选国际疾病分类编码的分数排名;输出候选国际疾病分类编码及其分数排名;根据候选国际疾病分类编码的分数排名向用户推荐至少一个候选国际疾病分类编码。
可选地,程序指令被处理器加载并执行时还实现以下步骤:筛选出分数排名靠前的预设数量的候选国际疾病分类编码,并向用户推荐筛选出的候选国际疾病分类编码;或,计算分数排名靠前的预设数量的候选国际疾病分类编码的置信度;将置信度大于预设置信度的候选国际疾病分类编码向用户进行推荐。
可选地,程序指令被处理器加载并执行时还实现以下步骤:计算多个关键词与每个医疗知识库的匹配程度;将匹配程度最高的医疗知识库作为目标医疗知识库;从目标医疗知识库中查找与多个关键词相匹配的至少一个候选国际疾病分类编码。
可选地,程序指令被处理器加载并执行时还实现以下步骤:将候选国际疾病分类编码输入机器学习模型的多维度评分器,得到候选国际疾病分类编码基于多个预设维度的分数;将候选国际疾病分类编码基于多个预设维度的分数进行加权计算,得到候选国际疾病分类编码的分数;按照分数由高到低的顺序对多个候选国际疾病分类编码进行排名。
可选地,程序指令被处理器加载并执行时还实现以下步骤:获取关键词之间的医疗关联关系;根据医疗关联关系从医疗知识库中查找与多个关键词相匹配的至少一个候选国际疾病分类编码。
可选地,程序指令被处理器加载并执行时还实现以下步骤:根据命名实体和分词得到的其他关键词从医疗知识库中查找候选国际疾病分类编码。
图3是本发明实施例提供的一种计算机设备的示意图。如图3所示,该实施例的计算机设备50包括:处理器51、存储器52以及存储在存储器52中并可在处理器51上运行的计算机程序53,该计算机程序53被处理器51执行时实现实施例中的疾病编码方法,为避免重复,此处不一一赘述。或者,该计算机程序被处理器51执行时实现实施例中疾病编码装置中各模型/单元的功能,为避免重复,此处不一一赘述。
计算机设备50可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。计算机设备可包括,但不仅限于,处理器51、存储器52。本领域技术人员可以理解,图3仅仅是计算机设备50的示例,并不构成对计算机设备50的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如计算机设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器51可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器52可以是计算机设备50的内部存储单元,例如计算机设备50的硬盘或内存。存储器52也可以是计算机设备50的外部存储设备,例如计算机设备50上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器52还可以既包括计算机设备50的内部存储单元也包括外部存储设备。存储器52用于存储计算机程序以及计算机设备所需的其他程序和数据。存储器52还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (10)

1.一种疾病编码方法,其特征在于,所述方法包括:
获取结构化的电子病例;
对所述结构化的电子病例的目标字段进行分词,得到多个关键词,所述目标字段至少包括医生诊断描述字段、患病部位字段、症状字段、检查结果字段;
从医疗知识库中查找与多个所述关键词相匹配的至少一个候选国际疾病分类编码;
将所述候选国际疾病分类编码输入机器学习模型,得到所述候选国际疾病分类编码的分数排名;
输出所述候选国际疾病分类编码及其分数排名;
根据所述候选国际疾病分类编码的分数排名向用户推荐至少一个所述候选国际疾病分类编码。
2.根据权利要求1所述的方法,其特征在于,所述根据所述候选国际疾病分类编码的分数排名向用户推荐至少一个所述候选国际疾病分类编码,包括:
筛选出分数排名靠前的预设数量的所述候选国际疾病分类编码,并向所述用户推荐筛选出的所述候选国际疾病分类编码;
或,
计算分数排名靠前的预设数量的所述候选国际疾病分类编码的置信度;将置信度大于预设置信度的所述候选国际疾病分类编码向所述用户进行推荐。
3.根据权利要求1所述的方法,其特征在于,所述医疗知识库有多个,所述从医疗知识库中查找与多个所述关键词相匹配的至少一个候选国际疾病分类编码,包括:
计算多个所述关键词与每个所述医疗知识库的匹配程度;
将匹配程度最高的所述医疗知识库作为目标医疗知识库;
从所述目标医疗知识库中查找与多个所述关键词相匹配的至少一个所述候选国际疾病分类编码。
4.根据权利要求1所述的方法,其特征在于,所述将所述候选国际疾病分类编码输入机器学习模型,得到所述候选国际疾病分类编码的分数排名,包括:
将所述候选国际疾病分类编码输入机器学习模型的多维度评分器,得到所述候选国际疾病分类编码基于多个预设维度的分数;
将所述候选国际疾病分类编码基于多个所述预设维度的分数进行加权计算,得到所述候选国际疾病分类编码的分数;
按照分数由高到低的顺序对多个所述候选国际疾病分类编码进行排名。
5.根据权利要求1所述的方法,其特征在于,所述从医疗知识库中查找与多个所述关键词相匹配的至少一个候选国际疾病分类编码,包括:
获取所述关键词之间的医疗关联关系;
根据所述医疗关联关系从所述医疗知识库中查找与多个所述关键词相匹配的至少一个所述候选国际疾病分类编码。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述对结构化的电子病例的目标字段进行分词,得到的多个所述关键词包括命名实体,所述从医疗知识库中查找与多个所述关键词相匹配的至少一个候选国际疾病分类编码,包括:
根据所述命名实体和分词得到的其他关键词从所述医疗知识库中查找所述候选国际疾病分类编码。
7.一种疾病编码装置,其特征在于,所述装置包括:
获取单元,用于获取结构化的电子病例;
分词单元,用于对所述结构化的电子病例的目标字段进行分词,得到多个关键词,所述目标字段至少包括医生诊断描述字段、患病部位字段、症状字段、检查结果字段;
查找单元,用于从医疗知识库中查找与多个所述关键词相匹配的至少一个候选国际疾病分类编码;
输入单元,用于将所述候选国际疾病分类编码输入机器学习模型,得到所述候选国际疾病分类编码的分数排名;
输出单元,用于输出所述候选国际疾病分类编码及其分数排名;
推荐单元,用于根据所述候选国际疾病分类编码的分数排名向用户推荐至少一个所述候选国际疾病分类编码。
8.根据权利要求7所述的装置,其特征在于,所述推荐单元包括:
第一推荐子单元,用于筛选出分数排名靠前的预设数量的所述候选国际疾病分类编码,并向所述用户推荐筛选出的所述候选国际疾病分类编码;
或,
第二推荐子单元,用于计算分数排名靠前的预设数量的所述候选国际疾病分类编码的置信度;将置信度大于预设置信度的所述候选国际疾病分类编码向所述用户进行推荐。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至6中任意一项所述的疾病编码方法。
10.一种计算机设备,包括存储器和处理器,所述存储器用于存储包括程序指令的信息,所述处理器用于控制程序指令的执行,其特征在于:所述程序指令被处理器加载并执行时实现权利要求1至6任意一项所述的疾病编码方法的步骤。
CN201811535074.XA 2018-12-14 2018-12-14 一种疾病编码方法和装置 Pending CN109785959A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811535074.XA CN109785959A (zh) 2018-12-14 2018-12-14 一种疾病编码方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811535074.XA CN109785959A (zh) 2018-12-14 2018-12-14 一种疾病编码方法和装置

Publications (1)

Publication Number Publication Date
CN109785959A true CN109785959A (zh) 2019-05-21

Family

ID=66496987

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811535074.XA Pending CN109785959A (zh) 2018-12-14 2018-12-14 一种疾病编码方法和装置

Country Status (1)

Country Link
CN (1) CN109785959A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110321556A (zh) * 2019-06-14 2019-10-11 中山职业技术学院 一种医生诊疗医保控费智能推荐方案的方法及其系统
CN110491465A (zh) * 2019-08-20 2019-11-22 山东众阳健康科技集团有限公司 基于深度学习的疾病分类编码方法、系统、设备及介质
CN110827947A (zh) * 2019-10-31 2020-02-21 北京东软望海科技有限公司 确定icd编码的方法、装置、电子设备及可读存储介质
CN111180060A (zh) * 2019-11-25 2020-05-19 云知声智能科技股份有限公司 一种疾病诊断自动编码方法及装置
CN111241806A (zh) * 2019-12-23 2020-06-05 望海康信(北京)科技股份公司 电子病历和病案首页诊断一致性校验方法及系统
CN111462896A (zh) * 2020-03-31 2020-07-28 重庆大学 一种基于病案的实时智能辅助icd编码系统和方法
CN111506673A (zh) * 2020-03-27 2020-08-07 泰康保险集团股份有限公司 一种病案的分类码确定方法和装置
CN111951972A (zh) * 2020-08-12 2020-11-17 望海康信(北京)科技股份公司 病案分组方法、装置、计算机设备及存储介质
CN112509692A (zh) * 2020-12-01 2021-03-16 北京百度网讯科技有限公司 用于匹配医学表达的方法、装置、电子设备及存储介质
CN112632910A (zh) * 2020-12-21 2021-04-09 北京惠及智医科技有限公司 手术编码方法以及电子设备、存储装置
CN113204942A (zh) * 2021-04-16 2021-08-03 中译语通科技股份有限公司 病案编码方法、装置、终端设备及可读存储介质
CN114580354A (zh) * 2022-05-05 2022-06-03 阿里巴巴达摩院(杭州)科技有限公司 基于同义词的信息编码方法、装置、设备和存储介质
CN112509692B (zh) * 2020-12-01 2024-05-28 北京百度网讯科技有限公司 用于匹配医学表达的方法、装置、电子设备及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105468900A (zh) * 2015-11-20 2016-04-06 邹远强 一种基于知识库的智能病历录入平台
CN106202955A (zh) * 2016-07-19 2016-12-07 中电科软件信息服务有限公司 基于编码智能适配的诊断相关分组方法及系统
CN106933806A (zh) * 2017-03-15 2017-07-07 北京大数医达科技有限公司 医疗同义词的确定方法和装置
CN107436922A (zh) * 2017-07-05 2017-12-05 北京百度网讯科技有限公司 文本标签生成方法和装置
CN107491655A (zh) * 2017-08-31 2017-12-19 康安健康管理咨询(常熟)有限公司 基于机器学习的肝脏疾病信息智能咨询方法及系统
CN107577826A (zh) * 2017-10-25 2018-01-12 山东众阳软件有限公司 基于原始诊断数据的疾病分类编码方法及系统
CN108182972A (zh) * 2017-12-15 2018-06-19 上海长江科技发展有限公司 基于分词网络的中文疾病诊断的智能编码方法及系统
CN108182207A (zh) * 2017-12-15 2018-06-19 上海长江科技发展有限公司 基于分词网络的中文手术操作的智能编码方法及系统
CN108920661A (zh) * 2018-07-04 2018-11-30 平安健康保险股份有限公司 国际疾病分类标记方法、装置、计算机设备及存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105468900A (zh) * 2015-11-20 2016-04-06 邹远强 一种基于知识库的智能病历录入平台
CN106202955A (zh) * 2016-07-19 2016-12-07 中电科软件信息服务有限公司 基于编码智能适配的诊断相关分组方法及系统
CN106933806A (zh) * 2017-03-15 2017-07-07 北京大数医达科技有限公司 医疗同义词的确定方法和装置
CN107436922A (zh) * 2017-07-05 2017-12-05 北京百度网讯科技有限公司 文本标签生成方法和装置
CN107491655A (zh) * 2017-08-31 2017-12-19 康安健康管理咨询(常熟)有限公司 基于机器学习的肝脏疾病信息智能咨询方法及系统
CN107577826A (zh) * 2017-10-25 2018-01-12 山东众阳软件有限公司 基于原始诊断数据的疾病分类编码方法及系统
CN108182972A (zh) * 2017-12-15 2018-06-19 上海长江科技发展有限公司 基于分词网络的中文疾病诊断的智能编码方法及系统
CN108182207A (zh) * 2017-12-15 2018-06-19 上海长江科技发展有限公司 基于分词网络的中文手术操作的智能编码方法及系统
CN108920661A (zh) * 2018-07-04 2018-11-30 平安健康保险股份有限公司 国际疾病分类标记方法、装置、计算机设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
AITZIBER ATUTXA等: "Machine Learning Approaches on Diagnostic Term Encoding With the ICD for Clinical Documentation" *
潘囿丞: "基于领域知识的自动答题方法研究" *
陈云志: "肝炎本体构建及语义相似度研究" *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110321556A (zh) * 2019-06-14 2019-10-11 中山职业技术学院 一种医生诊疗医保控费智能推荐方案的方法及其系统
CN110491465A (zh) * 2019-08-20 2019-11-22 山东众阳健康科技集团有限公司 基于深度学习的疾病分类编码方法、系统、设备及介质
AU2020333132B2 (en) * 2019-08-20 2023-07-13 Shan Dong Msun Health Technology Group Co., Ltd. Method and system for disease classification coding based on deep learning, and device and medium
WO2021032219A3 (zh) * 2019-08-20 2021-04-15 山东众阳健康科技集团有限公司 基于深度学习的疾病分类编码方法、系统、设备及介质
CN110827947A (zh) * 2019-10-31 2020-02-21 北京东软望海科技有限公司 确定icd编码的方法、装置、电子设备及可读存储介质
CN111180060A (zh) * 2019-11-25 2020-05-19 云知声智能科技股份有限公司 一种疾病诊断自动编码方法及装置
CN111241806A (zh) * 2019-12-23 2020-06-05 望海康信(北京)科技股份公司 电子病历和病案首页诊断一致性校验方法及系统
CN111506673A (zh) * 2020-03-27 2020-08-07 泰康保险集团股份有限公司 一种病案的分类码确定方法和装置
CN111462896B (zh) * 2020-03-31 2023-04-18 重庆大学 一种基于病案的实时智能辅助icd编码系统和方法
CN111462896A (zh) * 2020-03-31 2020-07-28 重庆大学 一种基于病案的实时智能辅助icd编码系统和方法
CN111951972A (zh) * 2020-08-12 2020-11-17 望海康信(北京)科技股份公司 病案分组方法、装置、计算机设备及存储介质
CN112509692A (zh) * 2020-12-01 2021-03-16 北京百度网讯科技有限公司 用于匹配医学表达的方法、装置、电子设备及存储介质
CN112509692B (zh) * 2020-12-01 2024-05-28 北京百度网讯科技有限公司 用于匹配医学表达的方法、装置、电子设备及存储介质
CN112632910A (zh) * 2020-12-21 2021-04-09 北京惠及智医科技有限公司 手术编码方法以及电子设备、存储装置
CN113204942A (zh) * 2021-04-16 2021-08-03 中译语通科技股份有限公司 病案编码方法、装置、终端设备及可读存储介质
CN114580354A (zh) * 2022-05-05 2022-06-03 阿里巴巴达摩院(杭州)科技有限公司 基于同义词的信息编码方法、装置、设备和存储介质

Similar Documents

Publication Publication Date Title
CN109785959A (zh) 一种疾病编码方法和装置
CN109299344B (zh) 排序模型的生成方法、搜索结果的排序方法、装置及设备
CN113707297B (zh) 医疗数据的处理方法、装置、设备及存储介质
CN105701120B (zh) 确定语义匹配度的方法和装置
CN108804641A (zh) 一种文本相似度的计算方法、装置、设备和存储介质
Yosef et al. ANAT: a tool for constructing and analyzing functional protein networks
CN103729395A (zh) 用于推断查询答案的方法和系统
WO2021017306A1 (zh) 根据用户画像的个性化搜索方法、系统、设备及存储介质
CN110275952A (zh) 基于用户短期兴趣的新闻推荐方法、装置及介质
CN111259660A (zh) 基于文本对的关键词抽取方法、装置、设备及存储介质
JP7191443B2 (ja) 機械学習に基づくターゲットオブジェクト属性予測方法、関連機器及びコンピュータプログラム
CN114065856B (zh) 基于医生画像的医生推荐方法、装置、设备及存储介质
CN110472043A (zh) 一种针对评论文本的聚类方法及装置
CN110969172A (zh) 一种文本的分类方法以及相关设备
CN111785366A (zh) 患者治疗方案的确定方法、装置及计算机设备
CN114417986A (zh) 基于人工智能的药物特征信息确定方法及装置
CN115410717A (zh) 模型训练方法、数据检索方法、影像数据检索方法和装置
Maâtouk et al. Evolutionary biclustering algorithms: an experimental study on microarray data
CN110110119B (zh) 图像检索的方法、装置及计算机可读存储介质
CN113658720A (zh) 匹配诊断名称和icd编码的方法、装置、电子设备和存储介质
Baak et al. An efficient algorithm for keyframe-based motion retrieval in the presence of temporal deformations
CN109472322B (zh) 基于聚类的分类方法、装置、存储介质和电子设备
CN109712704B (zh) 方案的推荐方法及其装置
CN110134943A (zh) 领域本体生成方法、装置、设备及介质
CN110532389A (zh) 一种文本聚类方法、装置和计算设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination