CN112509692A - 用于匹配医学表达的方法、装置、电子设备及存储介质 - Google Patents
用于匹配医学表达的方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112509692A CN112509692A CN202011383426.1A CN202011383426A CN112509692A CN 112509692 A CN112509692 A CN 112509692A CN 202011383426 A CN202011383426 A CN 202011383426A CN 112509692 A CN112509692 A CN 112509692A
- Authority
- CN
- China
- Prior art keywords
- chinese
- expression
- clinical
- medical
- expressions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000014509 gene expression Effects 0.000 title claims abstract description 282
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000002372 labelling Methods 0.000 claims abstract description 49
- 201000010099 disease Diseases 0.000 claims abstract description 19
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 19
- 230000015654 memory Effects 0.000 claims description 20
- 230000007170 pathology Effects 0.000 claims description 13
- 238000003745 diagnosis Methods 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 3
- 238000013135 deep learning Methods 0.000 abstract description 2
- 206010028980 Neoplasm Diseases 0.000 description 12
- 201000011510 cancer Diseases 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 210000002460 smooth muscle Anatomy 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000001575 pathological effect Effects 0.000 description 6
- 210000004190 broad ligament Anatomy 0.000 description 4
- 210000000621 bronchi Anatomy 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 201000010260 leiomyoma Diseases 0.000 description 3
- 230000036210 malignancy Effects 0.000 description 3
- 210000000845 cartilage Anatomy 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 210000002345 respiratory system Anatomy 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/20—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Primary Health Care (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Epidemiology (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本申请实施例公开了用于匹配医学表达的方法、装置、电子设备及计算机可读存储介质,涉及知识图谱、云服务、深度学习、智能医疗技术领域。该方法的一具体实施方式包括:获取医生对患者病历诊断得出的临床中文表达,临床中文表达为医生根据其表述风格书写得到的疾病中文名称;利用预设的BIO表示法对构成临床中文表达的各组分进行标注,得到标注结果;利用预先构建的医学知识图谱确定与标注结果匹配的目标ICD中文表达,医学知识图谱中记录有与构成临床中文表达的各组分对应的医学知识。该实施方式使匹配结果的准确率得到了提升,进而尽可能的降低因匹配错误导致的收费错误等问题对效率的影响。
Description
技术领域
本申请涉及人工智能技术领域,具体涉及知识图谱、云服务、深度学习、智能医疗技术领域,尤其涉及用于匹配医学表达的方法、装置、电子设备及计算机可读存储介质。
背景技术
在根据医生开具的诊疗单在医保系统上进行收费操作时,经常会因为医保记录的ICD(International Classification of Diseases,国际疾病分类)中文表达与医生所使用的临床中文表达不匹配的问题,使得医生上传时很容易出现匹配错误、收费错误等问题,进而影响整体效率。
发明内容
本申请实施例提出了一种用于匹配医学表达的方法、装置、电子设备及计算机可读存储介质。
第一方面,本申请实施例提出了一种用于匹配医学表达的方法,包括:获取医生对患者病历诊断得出的临床中文表达;其中,临床中文表达为医生根据其表述风格书写得到的疾病中文名称;利用预设的BIO表示法对构成临床中文表达的各组分进行标注,得到标注结果;利用预先构建的医学知识图谱确定与标注结果匹配的目标ICD中文表达;其中,医学知识图谱中记录有与构成临床中文表达的各组分对应的医学知识。
第二方面,本申请实施例提出了一种用于匹配医学表达的装置,包括:临床中文表达获取单元,被配置成获取医生对患者病历诊断得出的临床中文表达;其中,临床中文表达为医生根据其表述风格书写得到的疾病中文名称;BIO标注单元,被配置成利用预设的BIO表示法对构成临床中文表达的各组分进行标注,得到标注结果;ICD中文表达确定单元,被配置成利用预先构建的医学知识图谱确定与标注结果匹配的目标ICD中文表达;其中,医学知识图谱中记录有与构成临床中文表达的各组分对应的医学知识。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器执行时能够实现如第一方面中任一实现方式描述的用于匹配医学表达的方法。
第四方面,本申请实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行时能够实现如第一方面中任一实现方式描述的用于匹配医学表达的方法。
本申请实施例提供的用于匹配医学表达的方法、装置、电子设备及计算机可读存储介质,首先,获取医生对患者病历诊断得出的临床中文表达,该临床中文表达为医生根据其表述风格书写得到的疾病中文名称;然后,利用预设的BIO表示法对构成临床中文表达的各组分进行标注,得到标注结果;最后,利用预先构建的医学知识图谱确定与标注结果匹配的目标ICD中文表达,该医学知识图谱中记录有与构成临床中文表达的各组分对应的医学知识。
本申请通过使用BIO表示法对构成临床中文表达中各组分进行标注,使得机器可以准确的理解该临床中文表达的各个部分,进而通过记录有与构成临床中文表达的各组分对应的医学知识的医学知识图谱确定出匹配的目标ICD中文表达,基于组分与组分之间的准确匹配,使匹配结果的准确率得到了提升,进而尽可能的降低因匹配错误导致的收费错误等问题对效率的影响。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性系统架构;
图2为本申请实施例提供的一种用于匹配医学表达的方法的流程图;
图3为本申请实施例提供的另一种用于匹配医学表达的方法的流程图;
图4为本申请实施例提供的又一种用于匹配医学表达的方法的流程图;
图5为本申请实施例提供的在一应用场景下的用于匹配医学表达的方法的流程示意图;
图6为本申请实施例提供的一种用于匹配医学表达的装置的结构框图;
图7为本申请实施例提供的一种适用于执行用于匹配医学表达的方法的电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的用于匹配医学表达的方法、装置、电子设备及计算机可读存储介质的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103和服务器105上可以安装有各种用于实现两者之间进行信息通讯的应用,例如ICD中文表达匹配类应用、数据处理类应用、即时通讯类应用等。
终端设备101、102、103和服务器105可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等;当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中,其可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块,在此不做具体限定。当服务器105为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器;服务器为软件时,可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块,在此不做具体限定。
服务器105通过内置的各种应用可以提供各种服务,以可以提供为输入的临床中文表达提供匹配的ICD中文表达服务的ICD中文表达匹配类应用为例,服务器105在运行该ICD中文表达匹配类应用时可实现如下效果:首先,通过网络104接收到医生对患者病历诊断得出的临床中文表达,该临床中文表达为医生根据其表述风格书写得到的疾病中文名称;然后,利用预设的BIO表示法对构成临床中文表达的各组分进行标注,得到标注结果;最后,利用预先构建的医学知识图谱确定与标注结果匹配的目标ICD中文表达,该医学知识图谱中记录有与构成临床中文表达的各组分对应的医学知识。进一步的,服务器105可以根据确定出的目标ICD中文表达生成诊断和收费标准单据。
需要指出的是,临床中文表达除可以从终端设备101、102、103通过网络104获取到之外,也可以通过各种方式预先存储在服务器105本地。因此,当服务器105检测到本地已经存储有这些数据时(例如开始处理之前留存的待处理ICD中文表达匹配任务),可选择直接从本地获取这些数据,在此种情况下,示例性系统架构100也可以不包括终端设备101、102、103和网络104。
本申请后续各实施例所提供的用于匹配医学表达的方法一般由服务器105来执行,相应地,用于匹配医学表达的装置一般也设置于服务器105中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
请参考图2,图2为本申请实施例提供的一种用于匹配医学表达的方法的流程图,其中流程200包括以下步骤:
步骤201:获取医生对患者病历诊断得出的临床中文表达;
本步骤旨在由用于匹配医学表达的方法的执行主体(例如图1所示的服务器105)获取医生对患者病历诊断得出的临床中文表达。其中,该临床中文表达为该医生根据其表述风格书写得到的疾病中文名称,因此针对同一种症状的疾病不同表示习惯的医生往往会给出不同的临床中文表达。
具体的,该临床中文表达除可以接收自医生的直接输入之外,还可以由上述执行主体基于计算机视觉技术识别自患者的诊疗单,可根据实际情况灵活选择,此处不做具体限定。
步骤202:利用预设的BIO表示法对构成临床中文表达的各组分进行标注,得到标注结果;
在步骤201的基础上,本步骤旨在由上述执行主体通过对获取到的临床中文表达进行处理,以便于根据经处理后的临床中文表达确定目标ICD中文表达。为实现这一目的,本步骤具体使用了BIO表示法来处理该临床中文表达。
BIO表示法序列标注下一种具体的联合标注方法,联合标注方法是指所有的分段被标注为同样的标签,以便于基于标签识别出相同的分段。简单来说,BIO表示法可将待标注或待表示的名词或名词短语标注为“B-X”、“I-X”和“O”(可能没有)的组合,其中,B-X”表示此元素所在的片段属于X类型并且此元素在此片段的开头,“I-X”表示此元素所在的片段属于X类型并且此元素在此片段的中间位置,“O”表示不属于任何类型。以单个名词为例,BIO表示法会将该名词的首个(中文)字符标注为B、非首个中文字符标注为I,其余部分表示为O;若针对包含多个部分的名词短语,则需要将每个部分都进行上述的标注,并用O标注各部分的连接部分。
应当理解的是,医学上用于描述疾病的中文表达通常都包含多种组分,即无论是不标准的临床中文表达还是标准的ICD中文表达,实际是都是一个由多个名词组成的名词短句,而非单独的一个名词,以“支气管恶性肿瘤”为例,其实际上是由限定部分的“支气管”和限定病理的“恶性”以及限定临床表现的“肿瘤”共同组成的,通常情况下会至少包括部位组分和临床表现组分,视情况还可以包括病理组分、病因组分中的至少一项,某些特殊情况下还可能出现一些无法归类的其它组分。
由于临床中文表达中通常由多个不同的组分构成,因此将通过BIO表示法对其中的不同组分进行区别标注,即每个组分均会被标注出B和I的部分,而O的部分将出现在每个组分内的多余连接词或不同组分之间的连接词。为区别不同组分中的B和I,可以通过多种方式,例如根据组分类型为B和I附加相应的角标、编号等等。以临床中文表达“支气管恶性的肿瘤”可被标注为“Bpos Ipos Ipos Bpat Ipat O Bcm Icm”,其中,下角标pos是部位的英文全称“position”的缩写,下角标pat是病理的英文全称pathology的缩写,下角标cm则是临床表现的英文全称clinical manifestation的缩写。
上述标注过程也可以将其封装为一个预训练模型来完成,例如使用LSTM(LongShort-Term Memory,长短期记忆网络)+CRF(Conditional Random Field,条件随机场)预训练模型,以实现较高的标注效果。
步骤203:利用预先构建的医学知识图谱确定与标注结果匹配的目标ICD中文表达。
其中,医学知识图谱中记录有与构成临床中文表达的各组分对应的医学知识,例如包括人体部位子图、临床表现子图和病理子图、病因子图中的至少一项。其中,医学知识图谱可通过OCR识别、专业数据库抓取、医学专家二次验校等方式构建得到。
在步骤202的基础上,本步骤旨在由上述执行主体利用医学知识图谱来确定与标注结果匹配的目标ICD中文表达,即充分借助医学知识图谱中记录的医学知识来依次对比构成临床中文表达的各组分的其它表示方式,从而找到拥有共性表达的ICD中文表达。
应当理解的是,目标ICD中文表达中不应包含与标注结果中包含的组分类型不同的表达,即应仅包含与实际组分相同类型的医学表达,但在部位组分上可包含部分的上位概念,例如部位“支气管”属于“支气管平滑肌”的上位概念,这是因为ICD中文表达数量有限且固定,不如临床中文表达更加灵活和具体,因此仅可以允许上位概念以包含下位概念的方式建立一定程度上的匹配关系。
本申请实施例提供的用于匹配医学表达的方法,通过使用BIO表示法对构成临床中文表达中各组分进行标注,使得机器可以准确的理解该临床中文表达的各个部分,进而通过记录有与构成临床中文表达的各组分对应的医学知识的医学知识图谱确定出匹配的目标ICD中文表达,基于组分与组分之间的准确匹配,使匹配结果的准确率得到了提升,进而尽可能的降低因匹配错误导致的收费错误等问题对效率的影响。
请参考图3,图3为本申请实施例提供的另一种用于匹配医学表达的方法的流程图,其中流程300包括以下步骤:
步骤301:获取医生对患者病历诊断得出的临床中文表达;
步骤302:利用预设的知识增强语义表示模型识别出构成临床中文表达的各组分实体;
本步骤旨在由上述执行主体识别出构成临床中文表达的各组分实体。可具体选用知识增强语义表示模型中的Ernie模型,该模型对实体概念知识的学习来学习真实世界的完整概念的语义表示,以及对训练语料的扩展尤其是论坛对话语料的引入来增强模型的语义表示能力。而医学表达中的每个组分通常都可以作为医学知识图谱中的一个实体,因此Ernie模型在处理可认为由多个实体构成的临床中文表达时将拥有较好的效果。
以临床中文表达“支气管恶性的肿瘤”为例,可识别出部位实体-支气管、病理实体-恶性、临床表现实体-肿瘤。
步骤303:对不同的组分实体的首个中文字符标注为不同的B;
承接上例,部位实体的首个中文字符可以被标注为Bpos、病理实体中的首个中文字符可被标注为Bpat,以及临床表现实体中的首个中文字符可被标注为Bcm,即此处给出了一种通过附加与组分类型相应的英文缩写下角标的方式来区别不同的组分实体中的首个中文字符。
步骤304:对不同的组分实体的非首个中文字符标注为不同的I;
承接上例,部位实体中的非首个中文字符可被标注为Ipos Ipos、病理实体中的非首个中文字符可被标注为Ipat,以及临床表现实体中的非首个中文字符可被标注为Icm。即此处给出了一种通过附加与组分类型相应的英文缩写下角标的方式来区别不同的组分实体中的非首个中文字符。
步骤305:对连接不同的组分实体的中文字符标注为O,得到标注结果;
承接上例,病理实体与临床表现实体之间的“的”连接词将被标注为O,进一步的,若一个临床中文表达中共存在多个诸如“的”的连接词,还可以按照顺序分别标注为O1、O2等,此处不做具体限定。
针对流程200中的步骤202,本实施例通过步骤302-步骤305提供了一种具体的实现方式,即首先利用Ernie模型识别出临床中文表达中包含的各组分实体,然后再对每个组分实体按照BIO表示法进行标注,并考虑区别不同组分实体在标注时的区分因素,最终得到了一个便于机器识别进行同类型实体比对的标注结果。用于不同组分识别的模型通常也被归属于NER(Named entity recognition,命名实体识别)模型。
步骤306:确定标注结果中包含的各组分的实际匹配顺序;
在步骤305得到了标注结果的基础上,本步骤旨在由上述执行主体确定标注结果中包含的各组分的实际匹配顺序,即在依次匹配的方式下确定哪个组分先进行匹配、哪个组分后进行匹配。匹配顺序可根据实际情况自行按需调整,例如先进行部位实体的匹配、再进行临床表现实体的匹配、最后进行病理实体的匹配。
应当理解的是,依次进行的匹配在一定程度上可通过逐层递进的匹配避免无效匹配,而在要求匹配效率的场景下,也可以采用并行的匹配方式来提升匹配效率。
步骤307:按照匹配顺序依次在预先构建的医学知识图谱中查询对应组分所属类型的医学表达;
在步骤306的基础上,本步骤旨在由上述执行主体按照匹配顺序依次在预先构建的医学知识图谱中查询对应组分所属类型的医学表达,以便根据查询出的医学表达在确定对应的候选ICD中文表达。
步骤308:将包含有与每个组分均属于同类型的医学表达的ICD中文表达,确定为与标注结果匹配的目标ICD中文表达。
在步骤307的基础上,本步骤旨在由上述执行主体将包含有与每个组分均属于同类型的医学表达的ICD中文表达,确定为与标注结果匹配的目标ICD中文表达,其中,部位的同类型的医学表达包含标注结果的实际部位的上级部位,而诸如病理、病因和临床表现等类型的医学表达不存在像部位一样的多层上下位关系,因此病理、病因和临床表现等同类型的医学表达应具有一致性。
针对流程200中的步骤203,本实施例通过步骤306-步骤308给出了一种具体的实现方式,即首先确定在实际应用场景下合适的各组分匹配顺序,接下来按照确定出的匹配顺序将各实体依次结合医学知识图谱进行匹配,以最终通过逐层匹配得到匹配的目标ICD中文表达,从而尽可能的提升了准确性。
应当理解的是,上述实施例通过步骤302-步骤305给出的组分标注方案和通过步骤306-步骤308给出的匹配方案之间,并不存在依赖和因果关系,两部分具体的优选实现方案完全可以分别与上一实施例形成单独的实施例,本实施例仅作为同时存在两部分优选实施方案的优选实施例。
在上述任意实施例的基础上,为避免因不同医生书写和表述风格造成的匹配遗漏,还可以将构成临床中文表达的各组分分别进行同义表达或同义词替换,得到相似临床中文表达,以将相似临床中文表达也作为要进行组分标注的输入,从而通过增加输入的方式来避免匹配遗漏。
在上述任意实施例的基础上,为尽可能的加速得到匹配的目标ICD中文表达的过程,还可以统计预设时长内出现的临床中文表达和对应的目标ICD中文表达,得到统计结果,然后根据统计结果生成不同临床中文表达与不同ICD中文表达之间的对应关系组,以便于在接收到传入的新临床中文表达的时,可将根据对应关系组确定出的与新临床中文表达对应的实际ICD中文表达作为参考结果输出。应当理解的是,相同统计周期内相同对应关系的出现频率越高,说明匹配准确度越高。
请参考图4,图4为本申请实施例提供的另一种用于匹配医学表达的方法的流程图。如图4所示的流程图大致可按照执行的先后顺序分为多个部分:
一、对输入的临床中文表达进行拓展:
首先,获取输入的临床中文表达的英文名称、同义词、曾用名等信息;然后,通过NLU(Natural Language Understanding,自然语言理解)对输入的临床中文表达进行解析以得到其中包含的各组分;接着,基于确定出的各组分采用包括且不限于顺序调整、特定名词(黑名单名词)替换、同义词替换在内的处理方式构造出多个拓展中文表达。
二、确定与拓展中文表达对应的ICD候选集:
首先,根据预设的多条拒绝策略依次判断各ICD中文表达是否满足拒绝条件;然后,将所有拒绝策略均不满足的ICD中文表达作为候选ICD中文表达,同时判断被因满足任一决绝策略的拓展中文表达是否能够通过组分重构的方式得到某个ICD中文表达,如果能够得到也将其作为候选ICD中文表达。
其中拒绝策略可以包括:属于同性质的不同部位、属于同病不同性质、A病不伴B病和A病、A性不伴B病和A病伴B病、同部位不同性质、含否定词的诊断术语等。
三、候选ICD中文表达的匹配程度计算:
两两计算临床中文表达与候选的每一个候选ICD中文表达之间的匹配得分,并按照得分高低得到匹配程度排序表,并根据实际需求输入排名前N的ICD中文表达。
为加深理解,本申请还结合一个具体应用场景,给出了一种具体的实现方案,请参见如图5所示的流程示意图:
1)服务器接收到医生传入的一个临床中文表达—“支气管平滑肌瘤”;
2)服务器将“支气管平滑肌瘤”按照BIO表示法标注为“Bpos Ipos Ipos IposIpos Bcm”;
3)服务器根据标注结果“Bpos Ipos Ipos Ipos Ipos Bcm”确定出其中包含具体为“支气管平滑肌”的部位实体和具体为“瘤”的临床表现实体;
4)服务器通过预设的医学知识图谱中的部位子图找到“支气管平滑肌”的上下位医学知识,包括“支气管”、“支气管平滑肌”、“支气管软骨”、“阔韧带平滑肌”等;
5)服务器分别“呼吸道”、“支气管”、“支气管平滑肌”、“支气管软骨”、“阔韧带平滑肌”作为关键词检索ICD中文表达库,发现仅存在包含“支气管”的ICD中文表达—“支气管肿瘤”和“支气管恶性肿瘤”;
6)服务器通过预设的医学知识图谱中的临床表现子图确定不包含除“瘤”外的上位概念;
7)服务器以“瘤”作为关键词检索ICD中文表达库,得到了包括“支气管肿瘤”和“支气管恶性肿瘤”以及“阔韧带平滑肌”等在内的多个ICD中文表达;
8)服务器在候选的ICD中文表达中:“支气管肿瘤”和“支气管恶性肿瘤”以及“阔韧带平滑肌瘤”,经判断“阔韧带平滑肌瘤”因部位错误被排除、“支气管恶性肿瘤”因病理错误被排除,而“支气管肿瘤”将因为部位属于允许的上位概念、病理相同被确定为目标ICD中文表达。
进一步参考图6,作为对上述各图所示方法的实现,本申请提供了一种用于匹配医学表达的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图6所示,本实施例的用于匹配医学表达的装置600可以包括:临床中文表达获取单元601、BIO标注单元602、ICD中文表达确定单元603。其中,临床中文表达获取单元601,被配置成获取医生对患者病历诊断得出的临床中文表达;其中,临床中文表达为医生根据其表述风格书写得到的疾病中文名称;BIO标注单元602,被配置成利用预设的BIO表示法对构成临床中文表达的各组分进行标注,得到标注结果;ICD中文表达确定单元603,被配置成利用预先构建的医学知识图谱确定与标注结果匹配的目标ICD中文表达;其中,医学知识图谱中记录有与构成临床中文表达的各组分对应的医学知识。
在本实施例中,用于匹配医学表达的装置600中:临床中文表达获取单元601、BIO标注单元602、ICD中文表达确定单元603的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤201-203的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,BIO标注单元602可以被进一步配置成:
利用预设的知识增强语义表示模型识别出构成临床中文表达的各组分实体;
对不同的组分实体的首个中文字符标注为不同的B;
对不同的组分实体的非首个中文字符标注为不同的I;
对连接不同的组分实体的中文字符标注为O,得到标注结果。
在本实施例的一些可选的实现方式中,构成临床中文表达的各组分包括:部位、临床表现和病理、病因中的至少一项,对应的,医学知识图谱包括人体部位子图、临床表现子图和病理子图、病因子图中的至少一项。
在本实施例的一些可选的实现方式中,ICD中文表达确定单元603可以被进一步配置成:
确定对标注结果中包含的各组分的实际匹配顺序;
按照匹配顺序依次在预先构建的医学知识图谱中查询对应组分所属类型的医学表达;
将包含有与每个组分均属于同类型的医学表达的ICD中文表达,确定为与标注结果匹配的目标ICD中文表达;其中,部位的同类型的医学表达包含标注结果的实际部位的上级部位。
在本实施例的一些可选的实现方式中,用于匹配医学表达的装置600还可以包括:
相似临床中文表达获取单元,被配置成在利用预设的BIO表示法对构成临床中文表达的各组分进行标注之前,将构成临床中文表达的各组分分别进行同义表达或同义词替换,得到相似临床中文表达。
在本实施例的一些可选的实现方式中,用于匹配医学表达的装置600还可以包括:
统计单元,被配置成统计预设时长内出现的临床中文表达和对应的目标ICD中文表达,得到统计结果;
对应关系组生成单元,被配置成根据统计结果生成不同临床中文表达与不同ICD中文表达之间的对应关系组;
参考结果生成单元,被配置成响应于接收到传入的新临床中文表达,将根据对应关系组确定出的与新临床中文表达对应的实际ICD中文表达作为参考结果。
本实施例作为对应于上述方法实施例的装置实施例存在,本申请实施例提供的用于匹配医学表达的装置,通过使用BIO表示法对构成临床中文表达中各组分进行标注,使得机器可以准确的理解该临床中文表达的各个部分,进而通过记录有与构成临床中文表达的各组分对应的医学知识的医学知识图谱确定出匹配的目标ICD中文表达,基于组分与组分之间的准确匹配,使匹配结果的准确率得到了提升,进而尽可能的降低因匹配错误导致的收费错误等问题对效率的影响。
根据本申请的实施例,本申请还提供了一种电子设备和一种计算机可读存储介质。
图7示出了一种适于用来实现本申请实施例的用于匹配医学表达的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图7所示,该电子设备包括:一个或多个处理器701、存储器702,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图7中以一个处理器701为例。
存储器702即为本申请所提供的非瞬时计算机可读存储介质。其中,存储器存储有可由至少一个处理器执行的指令,以使至少一个处理器执行本申请所提供的用于匹配医学表达的方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的用于匹配医学表达的方法。
存储器702作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的用于匹配医学表达的方法对应的程序指令/模块(例如,附图5所示的临床中文表达获取单元601、BIO标注单元602、ICD中文表达确定单元603)。处理器701通过运行存储在存储器702中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的用于匹配医学表达的方法。
存储器702可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储该电子设备在执行用于匹配医学表达的方法所创建的各类数据等。此外,存储器702可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器702可选包括相对于处理器701远程设置的存储器,这些远程存储器可以通过网络连接至适用于执行用于匹配医学表达的方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
适用于执行用于匹配医学表达的方法的电子设备还可以包括:输入装置703和输出装置704。处理器701、存储器702、输入装置703和输出装置704可以通过总线或者其他方式连接,图7中以通过总线连接为例。
输入装置703可接收输入的数字或字符信息,以及产生适用于执行用于匹配医学表达的方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置704可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决传统物理主机与虚拟专用服务器(VPS,Virtual Private Server)服务中存在的管理难度大,业务扩展性弱的缺陷。
本申请实施例通过使用BIO表示法对构成临床中文表达中各组分进行标注,使得机器可以准确的理解该临床中文表达的各个部分,进而通过记录有与构成临床中文表达的各组分对应的医学知识的医学知识图谱确定出匹配的目标ICD中文表达,基于组分与组分之间的准确匹配,使匹配结果的准确率得到了提升,进而尽可能的降低因匹配错误导致的收费错误等问题对效率的影响。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (14)
1.一种用于匹配医学表达的方法,包括:
获取医生对患者病历诊断得出的临床中文表达;其中,所述临床中文表达为所述医生根据其表述风格书写得到的疾病中文名称;
利用预设的BIO表示法对构成所述临床中文表达的各组分进行标注,得到标注结果;
利用预先构建的医学知识图谱确定与所述标注结果匹配的目标国际疾病分类ICD中文表达;其中,所述医学知识图谱中记录有与构成所述临床中文表达的各组分对应的医学知识。
2.根据权利要求1所述的方法,其中,所述利用预设的BIO表示法对构成所述临床中文表达的各组分进行标注,得到标注结果,包括:
利用预设的知识增强语义表示模型识别出构成所述临床中文表达的各组分实体;
对不同的组分实体的首个中文字符标注为不同的B;
对不同的组分实体的非首个中文字符标注为不同的I;
对连接不同的组分实体的中文字符标注为O,得到所述标注结果。
3.根据权利要求1所述的方法,其中,构成所述临床中文表达的各组分包括:部位、临床表现和病理、病因中的至少一项,对应的,所述医学知识图谱包括人体部位子图、临床表现子图和病理子图、病因子图中的至少一项。
4.根据权利要求3所述的方法,其中,所述利用预先构建的医学知识图谱确定与所述标注结果匹配的目标ICD中文表达,包括:
确定对所述标注结果中包含的各组分的实际匹配顺序;
按照所述匹配顺序依次在预先构建的医学知识图谱中查询对应组分所属类型的医学表达;
将包含有与每个所述组分均属于同类型的医学表达的ICD中文表达,确定为与所述标注结果匹配的目标ICD中文表达;其中,所述部位的同类型的医学表达包含所述标注结果的实际部位的上级部位。
5.根据权利要求1所述的方法,其中,在利用预设的BIO表示法对构成所述临床中文表达的各组分进行标注之前,还包括:
将构成所述临床中文表达的各组分分别进行同义表达或同义词替换,得到相似临床中文表达。
6.根据权利要求1-5任一项所述的方法,还包括:
统计预设时长内出现的临床中文表达和对应的目标ICD中文表达,得到统计结果;
根据所述统计结果生成不同临床中文表达与不同ICD中文表达之间的对应关系组;
响应于接收到传入的新临床中文表达,将根据所述对应关系组确定出的与所述新临床中文表达对应的实际ICD中文表达作为参考结果。
7.一种用于匹配医学表达的装置,包括:
临床中文表达获取单元,被配置成获取医生对患者病历诊断得出的临床中文表达;其中,所述临床中文表达为所述医生根据其表述风格书写得到的疾病中文名称;
BIO标注单元,被配置成利用预设的BIO表示法对构成所述临床中文表达的各组分进行标注,得到标注结果;
ICD中文表达确定单元,被配置成利用预先构建的医学知识图谱确定与所述标注结果匹配的目标国际疾病分类ICD中文表达;其中,所述医学知识图谱中记录有与构成所述临床中文表达的各组分对应的医学知识。
8.根据权利要求7所述的装置,其中,所述BIO标注单元被进一步配置成:
利用预设的知识增强语义表示模型识别出构成所述临床中文表达的各组分实体;
对不同的组分实体的首个中文字符标注为不同的B;
对不同的组分实体的非首个中文字符标注为不同的I;
对连接不同的组分实体的中文字符标注为O,得到所述标注结果。
9.根据权利要求1所述的方法,其中,构成所述临床中文表达的各组分包括:部位、临床表现和病理、病因中的至少一项,对应的,所述医学知识图谱包括人体部位子图、临床表现子图和病理子图、病因子图中的至少一项。
10.根据权利要求9所述的装置,其中,所述ICD中文表达确定单元被进一步配置成:
确定对所述标注结果中包含的各组分的实际匹配顺序;
按照所述匹配顺序依次在预先构建的医学知识图谱中查询对应组分所属类型的医学表达;
将包含有与每个所述组分均属于同类型的医学表达的ICD中文表达,确定为与所述标注结果匹配的目标ICD中文表达;其中,所述部位的同类型的医学表达包含所述标注结果的实际部位的上级部位。
11.根据权利要求7所述的装置,还包括:
相似临床中文表达获取单元,被配置成在利用预设的BIO表示法对构成所述临床中文表达的各组分进行标注之前,将构成所述临床中文表达的各组分分别进行同义表达或同义词替换,得到相似临床中文表达。
12.根据权利要求7-11任一项所述的方法,还包括:
统计单元,被配置成统计预设时长内出现的临床中文表达和对应的目标ICD中文表达,得到统计结果;
对应关系组生成单元,被配置成根据所述统计结果生成不同临床中文表达与不同ICD中文表达之间的对应关系组;
参考结果生成单元,被配置成响应于接收到传入的新临床中文表达,将根据所述对应关系组确定出的与所述新临床中文表达对应的实际ICD中文表达作为参考结果。
13.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的用于匹配医学表达的方法。
14.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-6中任一项所述的用于匹配医学表达的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011383426.1A CN112509692B (zh) | 2020-12-01 | 2020-12-01 | 用于匹配医学表达的方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011383426.1A CN112509692B (zh) | 2020-12-01 | 2020-12-01 | 用于匹配医学表达的方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112509692A true CN112509692A (zh) | 2021-03-16 |
CN112509692B CN112509692B (zh) | 2024-05-28 |
Family
ID=74969064
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011383426.1A Active CN112509692B (zh) | 2020-12-01 | 2020-12-01 | 用于匹配医学表达的方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112509692B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113590842A (zh) * | 2021-08-05 | 2021-11-02 | 思必驰科技股份有限公司 | 医学术语标准化方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180121618A1 (en) * | 2016-11-02 | 2018-05-03 | Cota Inc. | System and method for extracting oncological information of prognostic significance from natural language |
CN109522552A (zh) * | 2018-11-09 | 2019-03-26 | 天津开心生活科技有限公司 | 一种医疗信息的归一化方法、装置、介质及电子设备 |
CN109785959A (zh) * | 2018-12-14 | 2019-05-21 | 平安医疗健康管理股份有限公司 | 一种疾病编码方法和装置 |
CN110427491A (zh) * | 2019-07-04 | 2019-11-08 | 北京爱医生智慧医疗科技有限公司 | 一种基于电子病历的医学知识图谱构建方法及装置 |
US20200176098A1 (en) * | 2018-12-03 | 2020-06-04 | Tempus Labs | Clinical Concept Identification, Extraction, and Prediction System and Related Methods |
CN111382275A (zh) * | 2018-12-28 | 2020-07-07 | 医渡云(北京)技术有限公司 | 医疗知识图谱的构建方法、装置、介质及电子设备 |
CN111445968A (zh) * | 2020-03-16 | 2020-07-24 | 平安国际智慧城市科技股份有限公司 | 电子病历查询方法、装置、计算机设备和存储介质 |
CN111538845A (zh) * | 2020-04-03 | 2020-08-14 | 肾泰网健康科技(南京)有限公司 | 一种构建肾病专科医学知识图谱的方法、模型及系统 |
-
2020
- 2020-12-01 CN CN202011383426.1A patent/CN112509692B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180121618A1 (en) * | 2016-11-02 | 2018-05-03 | Cota Inc. | System and method for extracting oncological information of prognostic significance from natural language |
CN109522552A (zh) * | 2018-11-09 | 2019-03-26 | 天津开心生活科技有限公司 | 一种医疗信息的归一化方法、装置、介质及电子设备 |
US20200176098A1 (en) * | 2018-12-03 | 2020-06-04 | Tempus Labs | Clinical Concept Identification, Extraction, and Prediction System and Related Methods |
CN109785959A (zh) * | 2018-12-14 | 2019-05-21 | 平安医疗健康管理股份有限公司 | 一种疾病编码方法和装置 |
CN111382275A (zh) * | 2018-12-28 | 2020-07-07 | 医渡云(北京)技术有限公司 | 医疗知识图谱的构建方法、装置、介质及电子设备 |
CN110427491A (zh) * | 2019-07-04 | 2019-11-08 | 北京爱医生智慧医疗科技有限公司 | 一种基于电子病历的医学知识图谱构建方法及装置 |
CN111445968A (zh) * | 2020-03-16 | 2020-07-24 | 平安国际智慧城市科技股份有限公司 | 电子病历查询方法、装置、计算机设备和存储介质 |
CN111538845A (zh) * | 2020-04-03 | 2020-08-14 | 肾泰网健康科技(南京)有限公司 | 一种构建肾病专科医学知识图谱的方法、模型及系统 |
Non-Patent Citations (3)
Title |
---|
NAIQIAN ZHANG等: "Ontology Database Construction for Medical Knowledge Base", IEEE XPLORE, 27 December 2019 (2019-12-27) * |
张坤丽;赵旭;关同峰;尚柏羽;李羽蒙;昝红英;: "面向医疗文本的实体及关系标注平台的构建及应用", 中文信息学报, no. 06, 15 June 2020 (2020-06-15) * |
昝红英;刘涛;牛常勇;赵悦淑;张坤丽;穗志方;: "面向儿科疾病的命名实体及实体关系标注语料库构建及应用", 中文信息学报, no. 05, 15 May 2020 (2020-05-15) * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113590842A (zh) * | 2021-08-05 | 2021-11-02 | 思必驰科技股份有限公司 | 医学术语标准化方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112509692B (zh) | 2024-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11151175B2 (en) | On-demand relation extraction from text | |
CN111710412B (zh) | 诊断结果的校验方法、装置及电子设备 | |
US10831762B2 (en) | Extracting and denoising concept mentions using distributed representations of concepts | |
CN109906449B (zh) | 一种查找方法及装置 | |
CN107644011B (zh) | 用于细粒度医疗实体提取的系统和方法 | |
Chen et al. | Automatic ICD-10 coding algorithm using an improved longest common subsequence based on semantic similarity | |
US11244755B1 (en) | Automatic generation of medical imaging reports based on fine grained finding labels | |
US20180068221A1 (en) | System and Method of Advising Human Verification of Machine-Annotated Ground Truth - High Entropy Focus | |
US20160019299A1 (en) | Deep semantic search of electronic medical records | |
US20180068222A1 (en) | System and Method of Advising Human Verification of Machine-Annotated Ground Truth - Low Entropy Focus | |
CN112216359B (zh) | 医疗数据校验方法、装置及电子设备 | |
US20210056113A1 (en) | Utilizing unsumbitted user input data for improved task performance | |
US11847411B2 (en) | Obtaining supported decision trees from text for medical health applications | |
CN112560505A (zh) | 一种对话意图的识别方法、装置、电子设备及存储介质 | |
US11532387B2 (en) | Identifying information in plain text narratives EMRs | |
CN112528001B (zh) | 一种信息查询方法、装置及电子设备 | |
CN111931488B (zh) | 用于验证判断结果准确性的方法、装置、电子设备及介质 | |
CN112528660A (zh) | 处理文本的方法、装置、设备、存储介质和程序产品 | |
WO2020149959A1 (en) | Conversion of natural language query | |
CN112599213B (zh) | 一种分类编码确定方法、装置、设备及存储介质 | |
US20240053307A1 (en) | Identifying Repetitive Portions of Clinical Notes and Generating Summaries Pertinent to Treatment of a Patient Based on the Identified Repetitive Portions | |
US11763081B2 (en) | Extracting fine grain labels from medical imaging reports | |
US11837343B2 (en) | Identifying repetitive portions of clinical notes and generating summaries pertinent to treatment of a patient based on the identified repetitive portions | |
WO2022227171A1 (zh) | 关键信息提取方法、装置、电子设备及介质 | |
CN113823420B (zh) | 智能问诊的处理方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |