CN108920661A - 国际疾病分类标记方法、装置、计算机设备及存储介质 - Google Patents

国际疾病分类标记方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN108920661A
CN108920661A CN201810724243.8A CN201810724243A CN108920661A CN 108920661 A CN108920661 A CN 108920661A CN 201810724243 A CN201810724243 A CN 201810724243A CN 108920661 A CN108920661 A CN 108920661A
Authority
CN
China
Prior art keywords
description information
target
icd code
disease description
icd
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810724243.8A
Other languages
English (en)
Other versions
CN108920661B (zh
Inventor
冯晓俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Health Insurance Company of China Ltd
Original Assignee
Ping An Health Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Health Insurance Company of China Ltd filed Critical Ping An Health Insurance Company of China Ltd
Priority to CN201810724243.8A priority Critical patent/CN108920661B/zh
Publication of CN108920661A publication Critical patent/CN108920661A/zh
Application granted granted Critical
Publication of CN108920661B publication Critical patent/CN108920661B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供一种国际疾病分类标记方法、装置、计算机设备及存储介质,通过对获取的待标记的目标疾病描述信息,在预先创建的平行语料库中查找与之相对应的至少一个目标ICD代码,并按照设定的规则,在查找到的至少一个目标ICD代码中选择为目标疾病描述信息进行标记的最终ICD代码,利用所述最终ICD代码对所述待标记的目标疾病描述信息进行分类标记。本发明可以自动在平行语料库中为目标疾病描述信息选择最终的ICD代码,提高了标记效率,且按照设定规则进行选择,保证了标记的统一性。

Description

国际疾病分类标记方法、装置、计算机设备及存储介质
技术领域
本发明涉及疾病分类技术领域,尤其涉及一种国际疾病分类标记方法、装置、计算机设备及存储介质。
背景技术
国际疾病分类(International Classification of Diseases,ICD)是根据疾病的某些特征,按照规则将疾病分门别类,并用编码的方法来表示的系统,在我国的应用已有二十多年。目前全世界使用最广泛的ICD版本是世界卫生组织WHO于1992年公布的ICD-10。根据WHO的规定,WHO只提供4位编码的ICD-10,各国或地区可以根据需要对ICD-10进行扩展形成本地化版本(例如可以通过添加扩展码来增加疾病数量)。
ICD使得疾病术语得以标准化和格式化,是医学信息化、医疗信息管理的应用基础,也是医疗保险结算的重要依据,因此,有效使用ICD对医疗卫生体系的发展具有非常重要的作用。
在我国ICD应用领域,目前主要通过人工编码来实现疾病描述信息的分类标记。医院病案室的编码员通过专业学习和培训可基于编码规范,借助字典库进行查询,选择跟医生的诊断结果相同或相近的编码。现有技术中通过人工进行标记不仅效率低,且存在由于不同编码员专业能力的差异导致对同一诊断结果不同标记结果的缺点。
发明内容
本发明的目的是提供一种国际疾病分类标记方法、装置、计算机设备及存储介质,用于解决现有技术存在的问题。
为实现上述目的,本发明提供一种国际疾病分类标记方法,包括以下步骤:
步骤01,获取待标记的目标疾病描述信息;
步骤02,在预先创建的平行语料库中查找与所述目标疾病描述信息相对应的至少一个目标国际疾病分类ICD代码;其中,所述平行语料库包括若干条疾病描述信息与ICD代码的对应关系;
步骤03,按照设定规则,在所述至少一个目标ICD代码中选择为所述目标疾病描述信息进行标记的最终ICD代码;
步骤04,利用所述最终ICD代码对所述待标记的目标疾病描述信息进行分类标记。
进一步地,所述平行语料库中的疾病描述信息包括疾病的标准术语和疾病的不标准术语;其中,所述标准术语为所参考的ICD版本中包含的各个疾病术语;所述不标准术语为所述标准术语对应的俗称、别称或缩略语。
进一步地,在步骤01之前还包括:将所述平行语料库中包括的疾病描述信息逐条与所参考的ICD版本中疾病的标准术语进行匹配,对匹配到的疾病描述信息对应的ICD代码的准确性进行自动校正,以及对未匹配到的疾病描述信息进行人工校正,以及对该人工校正后的疾病描述信息对应的ICD代码的准确性进行人工校正。
进一步地,步骤03中的所述设定规则包括:针对每一个目标ICD代码,利用下述公式计算P(Bi|A)的值,选择最大P(Bi|A)值对应的目标ICD代码为所述目标疾病描述信息进行标记的最终ICD代码;
其中,A用于表征所述目标疾病描述信息,Bi用于表征第i个目标ICD代码,Bj用于表征所述平行语料库中的第j个非目标ICD代码,n为大于等于1的整数。
进一步地,步骤03中的所述设定规则还包括选择的最终ICD代码的个数。
进一步地,在步骤02中若未查找到与所述目标疾病描述信息对应的目标ICD代码时,还包括:将所述目标疾病描述信息发送给人工处理平台,以人工确定为所述目标疾病描述信息进行标记的最终ICD代码。
进一步地,在人工确定出为所述目标疾病描述信息进行标记的最终ICD代码之后还包括:将所述目标疾病描述信息及人工确定的最终ICD代码的对应关系添加到所述平行语料库中。
为实现上述目的,本发明还提供一种国际疾病分类标记装置,包括:
目标疾病描述信息获取模块,用于获取待标记的目标疾病描述信息;
ICD代码查找模块,用于在预先创建的平行语料库中查找与所述目标疾病描述信息相对应的至少一个目标国际疾病分类ICD代码;其中,所述平行语料库包括若干条疾病描述信息与ICD代码的对应关系;
ICD代码选择模块,用于按照设定规则,在所述至少一个目标ICD代码中选择为所述目标疾病描述信息进行标记的最终ICD代码;
ICD代码标记模块,用于利用所述最终ICD代码对所述待标记的目标疾病描述信息进行分类标记。
为实现上述目的,本发明还提供一种计算机设备,计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
为实现上述目的,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述方法的步骤。
本发明提供的国际疾病分类标记方法、装置、计算机设备及存储介质,通过对获取的待标记的目标疾病描述信息,在预先创建的平行语料库中查找与之相对应的至少一个目标ICD代码,并按照设定的规则,在查找到的至少一个目标ICD代码中选择为目标疾病描述信息进行标记的最终ICD代码,并利用所述最终ICD代码对所述待标记的目标疾病描述信息进行分类标记。本发明可以自动在平行语料库中为目标疾病描述信息选择最终的ICD代码,提高了标记效率,且按照设定规则进行选择,保证了标记的统一性。
附图说明
图1为本发明国际疾病分类标记方法实施例一的流程图;
图2为本发明国际疾病分类标记装置实施例一的程序模块示意图;
图3为本发明国际疾病分类标记装置实施例一的硬件结构示意图;
图4为本发明国际疾病分类标记方法实施例二的流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供的国际疾病分类标记方法、装置、计算机设备及存储介质,适用于疾病分类领域,为医生开具的疾病诊断单上的疾病描述信息进行自动标记的方法。本发明通过对获取的待标记的目标疾病描述信息,在预先创建的平行语料库中查找与之相对应的至少一个目标ICD代码,并按照设定的规则,在查找到的至少一个目标ICD代码中选择为目标疾病描述信息进行标记的最终ICD代码,并利用所述最终ICD代码对所述待标记的目标疾病描述信息进行分类标记。本发明可以自动在平行语料库中为目标疾病描述信息选择最终的ICD代码,提高了标记效率,且按照设定规则进行选择,保证了标记的统一性。
实施例一
请参阅图1,本实施例的一种国际疾病分类标记方法中,包括以下步骤:
步骤01,获取待标记的目标疾病描述信息。
其中,该目标疾病描述信息的来源可以是医务人员开具的疾病诊断报告,也可以是基本医疗保险结算单。
以医务人员开具的疾病诊断报告为例,在诊断报告中不仅包括疾病描述信息,还包括一些格式信息以及一些非医学术语。其中,格式信息一般为标点符号等。非医学术语一般为起备注作用的词语或描述性语句,例如,待查、原因、温馨提示、建议、如病情加重请随时就诊等信息。
在本实施例中,可以是编码人员在获取到医务人员开具的疾病诊断报告之后,根据疾病诊断报告中包含的疾病描述信息,将其作为待标记的目标疾病描述信息输入到标记系统中。
在本实施例中,为了进一步提高标记速度,也可以是直接将医务人员开具的疾病诊断报告作为输入信息,例如,将疾病诊断报告的扫描件输入到标记系统中,由标记系统对疾病诊断报告中的信息进行扫描,并基于现有的分词处理方式获取到疾病诊断报告中的疾病描述信息,将获取到的疾病描述信息作为待标记的目标疾病描述信息。
步骤02,在预先创建的平行语料库中查找与所述目标疾病描述信息相对应的至少一个目标国际疾病分类ICD代码;其中,所述平行语料库包括若干条疾病描述信息与ICD代码的对应关系。
在本实施例中,需要预先创建平行语料库,其中,平行语料库包括若干条疾病描述信息与ICD代码的对应关系。所述平行语料库中的疾病描述信息包括疾病的标准术语和疾病的不标准术语;其中,所述标准术语为所参考的ICD版本中包含的各个疾病术语;所述不标准术语为所述标准术语对应的俗称、别称或缩略语。例如,该所参考的ICD版本为ICD10。
优选地,该平行语料库的创建,可以是在业务积累过程中得来的,例如,在业务积累过程中,每获取到一份待标记的疾病描述信息,则利用传统方式标记该疾病描述信息的ICD代码,并将疾病描述信息及相应ICD代码的对应关系存储到平行语料库中。
可选地,该平行语料库的创建,也可以是根据所要参考的ICD版本来创建。具体地,首先将该ICD版本中包含的各个疾病术语以及相应的ICD代码添加到平行语料库中;其次确定医学领域中各个疾病术语对应的俗称、别称或缩略语等,将各个疾病术语的俗称、别称或缩略语及其相应的ICD代码添加到平行语料库中;再次,确定各个疾病术语对应的子类疾病术语,并将与该子类疾病术语的属种关系最接近的疾病术语的ICD代码赋予给该子类疾病术语,并将该子类疾病术语及其对应的ICD代码添加到平行语料库中;最后,确定新产生的疾病术语,并将与该新产生的疾病术语的属种关系最接近的疾病术语的ICD代码赋予给该新产生的疾病术语,并将该新产生的疾病术语及其对应的ICD代码添加到平行语料库中。
在创建平行语料库的过程中,由于不同编码人员业务水平的不同,存在对同一个疾病描述信息进行了不同的标记情况,例如,对于“二尖瓣狭窄”这一疾病描述信息,编码人员在对其进行标记时,查询到“风湿性二尖瓣狭窄”、“非风湿性二尖瓣狭窄”对应的ICD代码,那么编码人员根据自己的业务认知,可能将“风湿性二尖瓣狭窄”的ICD代码作为“二尖瓣狭窄”这一疾病描述信息的标记,也可能将“非风湿性二尖瓣狭窄”的ICD代码作为“二尖瓣狭窄”这一疾病描述信息的标记;再创建平行语料库过程中,也存在对疾病描述信息进行了多个ICD代码作为其标记的情况,例如,对于“二尖瓣狭窄合并心房颤动伴左房血栓”这一疾病描述信息,由于其包含了“二尖瓣狭窄”、“心房颤动”、“心房血栓”三个疾病术语,因此,该疾病描述信息对应三个疾病术语的ICD代码。
基于平行语料库中存在对同一个疾病描述信息进行了不同的标记情况以及对疾病描述信息进行了多个ICD代码作为其标记的情况,因此,在平行语料库中可能查找到与目标疾病描述信息相对应的目标ICD代码不止一个。
步骤03,按照设定规则,在所述至少一个目标ICD代码中选择为所述目标疾病描述信息进行标记的最终ICD代码。
在本实施例中,为了保证对疾病描述信息进行标记的统一性,可以通过一个设定规则进行标记,该设定规则可以包括:可以确定至少一个目标ICD代码在平行语料库中的排列顺序,按照排列顺序选择为目标疾病描述信息进行标记的最终ICD代码。
优选地,为了提高标记准确率以及保证标记的统一性,该设定规则可以包括:针对每一个目标ICD代码,利用公式(1)计算P(Bi|A)的值,选择最大P(Bi|A)值对应的目标ICD代码为目标疾病描述信息标记的最终ICD代码;
其中,A用于表征所述目标疾病描述信息,Bi用于表征第i个目标ICD代码,Bj用于表征所述平行语料库中的第j个非目标ICD代码,n为大于等于1的整数。
基于公式(1)中存在如下如下计算公式(2)、公式(3):
其中,P(A)用于表征目标疾病描述信息在平行语料库中出现的概率;P(Bi)用于表征第i个目标ICD代码在平行语料库中出现的概率;P(Bj)用于表征第j个非目标ICD代码在平行语料库中出现的概率;P(ABi)用于表征目标疾病描述信息与第i个目标ICD代码在平行语料库中同时出现的概率;P(ABj)用于表征目标疾病描述信息与第j个非目标ICD代码在平行语料库中同时出现的概率。
根据该设定规则,在针对每一个目标ICD代码,计算出P(Bi|A)的值,选择最大P(Bi|A)值对应的目标ICD代码为目标疾病描述信息进行标记的最终ICD代码。
进一步地,该设定规则还可以包括选择的最终ICD代码的个数。例如,该设定规则中设定选择的最终ICD代码的个数为3个,那么可以选择最大的3个P(Bi|A)值分别对应的目标ICD代码作为目标疾病描述信息进行标记的最终ICD代码。
其中,在计算的P(Bi|A)值存在相同值的情况下,且需要在相同P(Bi|A)值内选择设定个数个P(Bi|A)值时,则随机在相同P(Bi|A)值内选择所述设定个数个目标ICD代码。例如,根据设定规则需要选择2个目标ICD代码作为最终ICD代码,而在计算P(Bi|A)值时最大的3个P(Bi|A)值相同,那么需要在3个相同的P(Bi|A)值内随机选择两个P(Bi|A)值对应的目标ICD代码最为最终ICD代码。
作为优选,该设定规则可以包括:针对目标疾病描述信息在平行语料库中进行查找,将查找到的第一个目标疾病描述信息对应的目标ICD代码作为最终ICD代码。例如,在平行语料库中共包括5条包含有目标疾病描述信息的对应关系,那么按照平行语料库中若干条对应关系的排序,从头至尾依次查找目标疾病描述信息,将排序最前的目标疾病描述信息对应的目标ICD代码作为最终ICD代码。
步骤04,利用所述最终ICD代码对所述待标记的目标疾病描述信息进行分类标记。
在本实施例中,对于选择的最终ICD代码可以直接输出到标记系统的界面上,供编码人员记录,也可以是直接将选择的最终ICD代码输出到为目标疾病描述信息标记的位置上进行存储。
其中,选择的最终ICD代码可以是一个,也可以是两个以上,由设定规则来设定。
本发明实施例,可以自动在平行语料库中为目标疾病描述信息选择最终的ICD代码,提高了标记效率,且按照设定规则进行选择,保证了标记的统一性。
请继续参阅图2,示出了一种国际疾病分类标记装置,在本实施例中,国际疾病分类标记装置10可以包括或被分割成一个或多个程序模块,一个或者多个程序模块被存储于存储介质中,并由一个或多个处理器所执行,以完成本发明,并可实现上述国际疾病分类标记方法。本发明所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序本身更适合于描述国际疾病分类标记装置10在存储介质中的执行过程。以下描述将具体介绍本实施例各程序模块的功能:
目标疾病描述信息获取模块11,用于获取待标记的目标疾病描述信息;
ICD代码查找模块12,用于在预先创建的平行语料库中查找与所述目标疾病描述信息获取模块11获取的所述目标疾病描述信息相对应的至少一个目标国际疾病分类ICD代码;其中,所述平行语料库包括若干条疾病描述信息与ICD代码的对应关系;
ICD代码选择模块13,用于按照设定规则,在所述ICD代码查找模块12查找到的所述至少一个目标ICD代码中选择为所述目标疾病描述信息进行标记的最终ICD代码;
ICD代码标记模块14,用于利用所述最终ICD代码对所述待标记的目标疾病描述信息进行分类标记。
本实施例还提供一种计算机设备,如可以执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。本实施例的计算机设备20至少包括但不限于:可通过系统总线相互通信连接的存储器21、处理器22,如图3所示。需要指出的是,图3仅示出了具有组件21-22的计算机设备20,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
本实施例中,存储器21(即可读存储介质)包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器21可以是计算机设备20的内部存储单元,例如该计算机设备20的硬盘或内存。在另一些实施例中,存储器21也可以是计算机设备20的外部存储设备,例如该计算机设备20上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器21还可以既包括计算机设备20的内部存储单元也包括其外部存储设备。本实施例中,存储器21通常用于存储安装于计算机设备20的操作系统和各类应用软件,例如实施例一的国际疾病分类标记装置10的程序代码等。此外,存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器22在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制计算机设备20的总体操作。本实施例中,处理器22用于运行存储器21中存储的程序代码或者处理数据,例如运行国际疾病分类标记装置10,以实现实施例一的国际疾病分类标记方法。
本实施例还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,程序被处理器执行时实现相应功能。本实施例的计算机可读存储介质用于存储国际疾病分类标记装置10,被处理器执行时实现实施例一的国际疾病分类标记方法。
实施例二
请参阅图4,本实施例的国际疾病分类标记方法以实施例一为基础,包括以下步骤:
步骤01,创建平行语料库。其中,创建的平行语料库中包括若干条疾病描述信息与ICD代码的对应关系。
在业务积累过程中,每获取到一份待标记的疾病描述信息,则利用传统方式标记该疾病描述信息的ICD代码,并将疾病描述信息及相应ICD代码的对应关系存储到平行语料库中。
步骤02,将所述平行语料库中包括的疾病描述信息逐条与所参考的ICD版本中疾病的标准术语进行匹配,对匹配到的疾病描述信息对应的ICD代码的准确性进行自动校正,以及对未匹配到的疾病描述信息对应的ICD代码的准确性进行人工校正。
在业务积累过程中,由于不同编码人员业务水平的不同,可能存在明显标记错误的情况,以及疾病描述信息不准确的情况,因此,为了保证平行语料库中对应关系的准确性,提高后续标记效率,可以通过将平行语料库中的信息与所要参考的ICD版本中疾病的标准术语进行匹配,若匹配到该疾病描述信息,则对该疾病描述信息对应的ICD代码进行自动校正,若未匹配到该疾病描述信息,则咨询专家意见,对该未匹配到的疾病描述信息进行人工校正,以使校正后的疾病描述信息准确,并对该人工校正后的疾病描述信息对应的ICD代码的准确度进行人工校正。
具体地,在对该疾病描述信息对应的ICD代码进行自动校正时,确定该疾病描述信息在所要参考的ICD版本中匹配到的疾病的标准术语,并确定该标准术语在所要参考的ICD版本中的ICD代码,若平行语料库中该疾病描述信息的ICD代码与所要参考的ICD版本中的ICD代码相同,则无需对该疾病描述信息对应的ICD代码进行校正,若平行语料库中该疾病描述信息的ICD代码与所要参考的ICD版本中的ICD代码不相同,则将该疾病描述信息的ICD代码校正为该匹配到的所要参考的ICD版本中的ICD代码。
例如,对平行语料库中的疾病描述信息为“二尖瓣狭窄”与所参考的ICD版本中疾病的标准术语进行匹配,在所要参考的ICD版本中匹配到该疾病描述信息为“二尖瓣狭窄”,确定在所要参考的ICD版本中“二尖瓣狭窄”对应的ICD代码为A1,平行语料库中该“二尖瓣狭窄”对应的ICD代码为A2,若A1与A2相同,那么无需对平行语料库中该“二尖瓣狭窄”对应的ICD代码进行校正,若A1与A2不相同,那么在自动校正时是将平行语料库中该“二尖瓣狭窄”对应的ICD代码校正为A1。
步骤03,获取待标记的目标疾病描述信息。
步骤04,在预先创建的平行语料库中查找与所述目标疾病描述信息相对应的至少一个目标国际疾病分类ICD代码,若查找到,执行步骤05,否则,执行步骤07。
步骤05,按照设定规则,在所述至少一个目标ICD代码中选择为所述目标疾病描述信息进行标记的最终ICD代码。
步骤06,利用所述最终ICD代码对所述待标记的目标疾病描述信息进行分类标记。
步骤07,将所述目标疾病描述信息发送给人工处理平台,以人工确定为所述目标疾病描述信息标记的最终ICD代码,并分别执行步骤06和步骤08。
在人工确定目标疾病描述信息标记的最终ICD代码时,可以利用传统方式标记该目标疾病描述信息的ICD代码。
步骤08,将所述目标疾病描述信息及人工确定的最终ICD代码的对应关系添加到所述平行语料库中。
由于该目标疾病描述信息在平行语料库中未查找到,为了保证后续过程中再次需要对目标疾病描述信息进行标记时能够根据平行语料库进行自动标记,可以将该目标疾病描述信息及人工确定的最终ICD代码的对应关系添加到所述平行语料库中,以实现平行语料库中存储的对应关系的更新。
为了进一步提高最终ICD代码确定的准确率,在本发明一个实施例中,还可以将自动确定的最终ICD代码与目标疾病描述信息存储到平行语料库中。
在本发明一个实施例中,在实际代码标记过程中,为了提高标记效率,可以直接上传电子病历文件,在对上传的电子病历文件进行扫描,当扫描到电子病历文件中的目标位置中包含目标疾病描述信息时,可以利用上述步骤从平行语料库中获取到最终的ICD代码,并将获取到的最终的ICD代码标记在该目标位置的对应位置处,从而可实现对电子病历文件中各个疾病描述信息的ICD代码的分类标记。
其中,该电子病历文件中的目标位置与目标位置的对应位置可以是同一个位置,也可以是不同位置,且该目标位置与目标位置的对应位置可以是预先设定的。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种国际疾病分类标记方法,其特征在于,包括以下步骤:
步骤01,获取待标记的目标疾病描述信息;
步骤02,在预先创建的平行语料库中查找与所述目标疾病描述信息相对应的至少一个目标国际疾病分类ICD代码;其中,所述平行语料库包括若干条疾病描述信息与ICD代码的对应关系;
步骤03,按照设定规则,在所述至少一个目标ICD代码中选择为所述目标疾病描述信息进行标记的最终ICD代码;
步骤04,利用所述最终ICD代码对所述待标记的目标疾病描述信息进行分类标记。
2.根据权利要求1所述的国际疾病分类标记方法,其特征在于,所述平行语料库中的疾病描述信息包括疾病的标准术语和疾病的不标准术语;其中,所述标准术语为所参考的ICD版本中包含的各个疾病术语;所述不标准术语为所述标准术语对应的俗称、别称或缩略语。
3.根据权利要求2所述的国际疾病分类标记方法,其特征在于,在步骤01之前还包括:将所述平行语料库中包括的疾病描述信息逐条与所参考的ICD版本中疾病的标准术语进行匹配,对匹配到的疾病描述信息对应的ICD代码的准确性进行自动校正,以及对未匹配到的疾病描述信息进行人工校正,以及对该人工校正后的疾病描述信息对应的ICD代码的准确性进行人工校正。
4.根据权利要求1所述的国际疾病分类标记方法,其特征在于,步骤03中的所述设定规则包括:针对每一个目标ICD代码,利用下述公式计算P(Bi|A)的值,选择最大P(Bi|A)值对应的目标ICD代码为所述目标疾病描述信息进行标记的最终ICD代码;
其中,A用于表征所述目标疾病描述信息,Bi用于表征第i个目标ICD代码,Bj用于表征所述平行语料库中的第j个非目标ICD代码,n为大于等于1的整数。
5.根据权利要求4所述的国际疾病分类标记方法,其特征在于,步骤03中的所述设定规则还包括选择的最终ICD代码的个数。
6.根据权利要求1所述的国际疾病分类标记方法,其特征在于,在步骤02中若未查找到与所述目标疾病描述信息对应的目标ICD代码时,还包括:将所述目标疾病描述信息发送给人工处理平台,以人工确定为所述目标疾病描述信息进行标记的最终ICD代码。
7.根据权利要求6所述的国际疾病分类标记方法,其特征在于,在人工确定出为所述目标疾病描述信息进行标记的最终ICD代码之后还包括:将所述目标疾病描述信息及人工确定的最终ICD代码的对应关系添加到所述平行语料库中。
8.一种国际疾病分类标记装置,其特征在于,包括:
目标疾病描述信息获取模块,用于获取待标记的目标疾病描述信息;
ICD代码查找模块,用于在预先创建的平行语料库中查找与所述目标疾病描述信息相对应的至少一个目标国际疾病分类ICD代码;其中,所述平行语料库包括若干条疾病描述信息与ICD代码的对应关系;
ICD代码选择模块,用于按照设定规则,在所述至少一个目标ICD代码中选择为所述目标疾病描述信息进行标记的最终ICD代码;
ICD代码标记模块,用于利用所述最终ICD代码对所述待标记的目标疾病描述信息进行分类标记。
9.一种计算机设备,计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述方法的步骤。
CN201810724243.8A 2018-07-04 2018-07-04 国际疾病分类标记方法、装置、计算机设备及存储介质 Active CN108920661B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810724243.8A CN108920661B (zh) 2018-07-04 2018-07-04 国际疾病分类标记方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810724243.8A CN108920661B (zh) 2018-07-04 2018-07-04 国际疾病分类标记方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN108920661A true CN108920661A (zh) 2018-11-30
CN108920661B CN108920661B (zh) 2023-08-08

Family

ID=64424488

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810724243.8A Active CN108920661B (zh) 2018-07-04 2018-07-04 国际疾病分类标记方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN108920661B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109785959A (zh) * 2018-12-14 2019-05-21 平安医疗健康管理股份有限公司 一种疾病编码方法和装置
CN109993227A (zh) * 2019-03-29 2019-07-09 京东方科技集团股份有限公司 自动添加国际疾病分类编码的方法、系统、装置和介质
CN111274305A (zh) * 2020-01-15 2020-06-12 平安医疗健康管理股份有限公司 三维图片的生成方法、装置、计算机设备和存储介质
CN111445993A (zh) * 2020-03-25 2020-07-24 北京嘉和海森健康科技有限公司 疾病的层级关系处理方法、装置及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120254083A1 (en) * 2011-03-31 2012-10-04 Infosys Technologies Limited System and method for automatically generating a medical code
CN105069124A (zh) * 2015-08-13 2015-11-18 易保互联医疗信息科技(北京)有限公司 一种自动化的国际疾病分类编码方法及系统
CN106844308A (zh) * 2017-01-20 2017-06-13 天津艾登科技有限公司 一种使用语义识别进行自动化疾病编码转换的方法
CN108182972A (zh) * 2017-12-15 2018-06-19 上海长江科技发展有限公司 基于分词网络的中文疾病诊断的智能编码方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120254083A1 (en) * 2011-03-31 2012-10-04 Infosys Technologies Limited System and method for automatically generating a medical code
CN105069124A (zh) * 2015-08-13 2015-11-18 易保互联医疗信息科技(北京)有限公司 一种自动化的国际疾病分类编码方法及系统
CN106844308A (zh) * 2017-01-20 2017-06-13 天津艾登科技有限公司 一种使用语义识别进行自动化疾病编码转换的方法
CN108182972A (zh) * 2017-12-15 2018-06-19 上海长江科技发展有限公司 基于分词网络的中文疾病诊断的智能编码方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
邹小琴;莫春梅;罗建;廖贵蓉;陈春丽;邓春燕;: "探索建立疾病诊断标准术语及编码字典库的新模式", 四川医学 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109785959A (zh) * 2018-12-14 2019-05-21 平安医疗健康管理股份有限公司 一种疾病编码方法和装置
CN109993227A (zh) * 2019-03-29 2019-07-09 京东方科技集团股份有限公司 自动添加国际疾病分类编码的方法、系统、装置和介质
CN109993227B (zh) * 2019-03-29 2021-09-24 京东方科技集团股份有限公司 自动添加国际疾病分类编码的方法、系统、装置和介质
CN111274305A (zh) * 2020-01-15 2020-06-12 平安医疗健康管理股份有限公司 三维图片的生成方法、装置、计算机设备和存储介质
CN111274305B (zh) * 2020-01-15 2023-03-31 深圳平安医疗健康科技服务有限公司 三维图片的生成方法、装置、计算机设备和存储介质
CN111445993A (zh) * 2020-03-25 2020-07-24 北京嘉和海森健康科技有限公司 疾病的层级关系处理方法、装置及电子设备
CN111445993B (zh) * 2020-03-25 2023-08-08 北京嘉和海森健康科技有限公司 疾病的层级关系处理方法、装置及电子设备

Also Published As

Publication number Publication date
CN108920661B (zh) 2023-08-08

Similar Documents

Publication Publication Date Title
CN108920661A (zh) 国际疾病分类标记方法、装置、计算机设备及存储介质
US9230060B2 (en) Associating records in healthcare databases with individuals
WO2019071661A1 (zh) 电子装置、医疗文本实体命名的识别方法、系统及存储介质
CN107544726B (zh) 基于人工智能的语音识别结果纠错方法、装置及存储介质
CN113707300B (zh) 基于人工智能的搜索意图识别方法、装置、设备及介质
RU2760471C1 (ru) Способы и системы идентификации полей в документе
CN108959566B (zh) 一种基于Stacking集成学习的医疗文本去隐私方法和系统
CN111859857B (zh) 基于标注文本的训练数据集生成方法、系统、设备和介质
CN116737879A (zh) 知识库查询方法、装置、电子设备及存储介质
CN116721778B (zh) 一种医学术语标准化方法、系统、设备及介质
CN111985241A (zh) 医学信息查询方法、装置、电子设备及介质
CN112597135A (zh) 用户分类方法、装置、电子设备及可读存储介质
CN111444339B (zh) 文本题目难度标注方法、装置及计算机可读存储介质
CN113658720A (zh) 匹配诊断名称和icd编码的方法、装置、电子设备和存储介质
CN110706121B (zh) 确定医保欺诈结果的方法、装置、电子设备及存储介质
US11393232B2 (en) Extracting values from images of documents
CN111104481B (zh) 一种识别匹配字段的方法、装置及设备
CN116578704A (zh) 文本情感分类方法、装置、设备及计算机可读介质
CN114706985A (zh) 文本分类方法、装置、电子设备及存储介质
US20170169192A1 (en) Inserting structured content in itemized reports
CN112766314A (zh) 解剖结构的识别方法、电子设备及存储介质
US11361032B2 (en) Computer driven question identification and understanding within a commercial tender document for automated bid processing for rapid bid submission and win rate enhancement
CN116504389A (zh) 基于人工智能的问诊对话评估方法及相关设备
CN113590845B (zh) 基于知识图谱的文献检索方法、装置、电子设备及介质
CN113821641B (zh) 基于权重分配的药品分类的方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant