CN110032728B - 疾病名称标准化的转换方法和装置 - Google Patents

疾病名称标准化的转换方法和装置 Download PDF

Info

Publication number
CN110032728B
CN110032728B CN201910103210.6A CN201910103210A CN110032728B CN 110032728 B CN110032728 B CN 110032728B CN 201910103210 A CN201910103210 A CN 201910103210A CN 110032728 B CN110032728 B CN 110032728B
Authority
CN
China
Prior art keywords
disease
name
similarity
spoken language
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910103210.6A
Other languages
English (en)
Other versions
CN110032728A (zh
Inventor
周国鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Advanced New Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Advanced New Technologies Co Ltd filed Critical Advanced New Technologies Co Ltd
Priority to CN201910103210.6A priority Critical patent/CN110032728B/zh
Publication of CN110032728A publication Critical patent/CN110032728A/zh
Application granted granted Critical
Publication of CN110032728B publication Critical patent/CN110032728B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

说明书披露一种疾病名称标准化的转换方法和装置。该方法包括:基于疾病口语名称对应的就诊信息为所述疾病口语名称生成对应的就诊特征;基于候选标准名称对应的就诊信息为每个候选标准名称生成对应的就诊特征;根据所述疾病口语名称对应的就诊特征、各候选标准名称对应的就诊特征以及所述疾病口语名称和各候选标准名称的相似度特征计算所述疾病口语名称和各候选标准名称的匹配度;当存在匹配度满足预定匹配条件的候选标准名称时,将该候选标准名称确定为所述疾病口语名称的标准化转换结果。

Description

疾病名称标准化的转换方法和装置
技术领域
本说明书涉及人工智能领域,尤其涉及一种疾病名称标准化的转换方法和装置。
背景技术
随着互联网技术的快速发展,保险理赔业务也从线下的人工理赔逐步过渡到线上的智能理赔。在健康险等与疾病相关的智能理赔场景中,用户上报的疾病名称往往与国际上通用的国际疾病分类(International Classification of Diseases,ICD)中的疾病名称不一致,导致智能理赔效率低下、理赔结果准确率低下等问题。
发明内容
有鉴于此,本说明书提供一种疾病名称标准化的转换方法和装置。
具体地,本说明书是通过如下技术方案实现的:
一种疾病名称标准化的转换方法,包括:
基于疾病口语名称对应的就诊信息为所述疾病口语名称生成对应的就诊特征;
基于候选标准名称对应的就诊信息为每个候选标准名称生成对应的就诊特征;
根据所述疾病口语名称对应的就诊特征、各候选标准名称对应的就诊特征以及所述疾病口语名称和各候选标准名称的相似度特征计算所述疾病口语名称和各候选标准名称的匹配度;
当存在匹配度满足预定匹配条件的候选标准名称时,将该候选标准名称确定为所述疾病口语名称的标准化转换结果。
一种疾病名称标准化的转换装置,包括:
第一特征生成单元,基于疾病口语名称对应的就诊信息为所述疾病口语名称生成对应的就诊特征;
第二特征生成单元,基于候选标准名称对应的就诊信息为每个候选标准名称生成对应的就诊特征;
匹配度计算单元,根据所述疾病口语名称对应的就诊特征、各候选标准名称对应的就诊特征以及所述疾病口语名称和各候选标准名称的相似度特征计算所述疾病口语名称和各候选标准名称的匹配度;
名称转换单元,当存在匹配度满足预定匹配条件的候选标准名称时,将该候选标准名称确定为所述疾病口语名称的标准化转换结果。
一种疾病名称标准化的转换装置,包括:
处理器;
用于存储机器可执行指令的存储器;
其中,通过读取并执行所述存储器存储的与疾病名称标准化的转换逻辑对应的机器可执行指令,所述处理器被促使:
基于疾病口语名称对应的就诊信息为所述疾病口语名称生成对应的就诊特征;
基于候选标准名称对应的就诊信息为每个候选标准名称生成对应的就诊特征;
根据所述疾病口语名称对应的就诊特征、各候选标准名称对应的就诊特征以及所述疾病口语名称和各候选标准名称的相似度特征计算所述疾病口语名称和各候选标准名称的匹配度;
当存在匹配度满足预定匹配条件的候选标准名称时,将该候选标准名称确定为所述疾病口语名称的标准化转换结果。
由以上描述可以看出,本说明书提供的疾病名称标准化的转换方案,可综合疾病口语名称和候选标准名称的就诊特征以及二者的相似度特征为所述疾病口语名称确定标准化转换结果,从而提高疾病口语名称标准化转换的准确度。
附图说明
图1是本说明书一示例性实施例示出的一种疾病名称标准化的转换方法的流程示意图。
图2是本说明书一示例性实施例示出的另一种疾病名称标准化的转换方法的流程示意图。
图3是本说明书一示例性实施例示出的一种候选标准名称的确定方法的流程示意图。
图4是本说明书一示例性实施例示出的一种用于疾病名称标准化的转换装置的一结构示意图。
图5是本说明书一示例性实施例示出的一种疾病名称标准化的转换装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。
在本说明书使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
本说明书提供一种疾病名称标准化的转换方案,可为疾病口语名称和候选标准名称生成各自对应的就诊特征,然后根据疾病口语名称和各候选标准名称各自对应的就诊特征以及疾病口语名称和各候选标准名称的相似度特征计算所述疾病口语名称和各候选标准名称的匹配度,并可将匹配度满足预定匹配条件的候选标准名称确定为所述疾病口语名称的标准化转换结果。采用本说明书提供的上述疾病名称标准化的转换方案,可综合疾病口语名称和候选标准名称的就诊特征以及二者的相似度特征为所述疾病口语名称确定标准化转换结果,从而提高疾病口语名称标准化转换的准确度。
图1和图2是本说明书一示例性实施例示出的疾病名称标准化的转换方法的流程示意图。
请参考图1和图2,所述疾病名称标准化的转换方法可包括以下步骤:
步骤102,基于疾病口语名称对应的就诊信息为所述疾病口语名称生成对应的就诊特征。
在本实施例中,所述疾病口语名称通常是患者上报病史时提供的疾病名称,该疾病名称可能是国际疾病分类中的疾病标准名称,也可能不是国际疾病分类中的疾病标准名称。
举例来说,患者上报的疾病口语名称“感冒”和“头疼”都不是国际疾病分类中的疾病标准名称,需将其转换为国际疾病分类中的疾病标准名称,例如“流行性感冒”等。
在本实施例中,所述就诊信息可包括:患者年龄分布信息、患者地域分布信息、患者性别分布信息以及药品信息中的一种或多种。
针对同一个疾病口语名称,可获取历史上上报过该疾病的患者的个人信息以及对应该疾病的药品信息,然后可对所述个人信息和所述药品信息进行汇总。其中,所述个人信息可包括年龄、地域、性别等。药品信息可为药品名称。
举例来说,针对疾病口语名称“感冒”,假设历史上共有100个患者上报过该疾病口语名称,则可获取这100个患者的个人信息,然后可对年龄、地域和性别进行汇总。
例如,汇总结果是年龄分布为20-50岁,地域分布为广东省、福建省,性别分布男性80%,女性20%。
还可获取这100个患者上报的对应“感冒”的药品名称,并可汇总这些药品名称。所述药品名称通常为患者就诊时医生开具的药品的名称。
例如,可对这100个患者上报的药品名称进行去重处理,得到汇总结果“复方氨酚烷胺片”、“复方布洛伪麻缓释片”、“扑尔伪麻片”等20种药品。
在本实施例中,可基于汇总之后的就诊信息为所述疾病口语名称生成对应的就诊特征,所述就诊特征的可以表示为向量(d0-sex,d0-age,d0-area,d0-medi)。
其中,d0代表疾病口语名称;
sex代表患者性别分布,其取值可以为0或1,其中,0可代表患者是女性居多,1可代表患者是男性居多..;
age代表患者年龄分布,其取值可以为一个或多个数值区间;
area代表患者地区分布,其取值可以为离散的地区代码;
medi代表药品信息,其取值可以为汇总后的药品名称对应的药品向量。所述药品向量可以是一个0/1向量,也可以是对0/1向量进行嵌入处理之后得到的低维向量。
其中,所述0/1向量是采用一个很长的向量来表示药品,该向量的维度是药品名称的总数量,每个维度对应唯一一个药品。若某药品存在,则该药品名称所在维度的元素值是1;若某药品不存在,则该药品名称所在维度的元素值是0。
假设,一共有1000万种药品,则药品的0/1向量有1000万维,每个维度对应唯一一个药品。仍以前述疾病口语名称“感冒”所对应的20种药品为例,该1000万维的0/1向量中,这20种药品对应维度的元素值是1,其他维度的元素值都是0,即该1000万维的0/1向量中有20个元素的元素值是1,其他剩余元素的元素值都是0。
当然,在其他例子中,也可选择其他就诊信息生成就诊特征,例如患者姓名、患者病例等;也可采用其他方式生成就诊特征向量,例如从上报疾病口语名称的患者中随机抽取部分患者的个人信息和药品信息,以生成就诊特征向量,无需对所有上报疾病口语名称的患者的个人信息和药品信息进行汇总等,本说明书对此不作特殊限制。
步骤104,基于候选标准名称对应的就诊信息为每个候选标准名称生成对应的就诊特征。
在本实施例中,所述候选标准名称是国际疾病分类中记载的疾病标准名称。用于匹配疾病口语名称的所述候选标准名称可包括国际疾病分类中的所有疾病标准名称,也可仅包括国际疾病分类中的部分疾病标准名称,例如,可对国际疾病分类中记载的所有疾病标准名称进行初步筛选,得到一部分用于匹配疾病口语名称的疾病标准名称,并称之为候选标准名称。
与前述疾病口语名称类似,针对同一个候选标准名称,可获取历史上上报过对应疾病的患者的个人信息以及对应该疾病的药品信息,然后可对所述个人信息和所述药品信息进行汇总。其中,所述个人信息可包括年龄、地域、性别等。药品信息可为药品名称。
值得注意的是,历史上上报过对应疾病的患者可包括历史上上报过该候选标准名称的患者,也可包括历史上上报过后续被认定为是该候选标准名称的疾病口语名称的患者。
举例来说,假设所述候选标准名称为“流行性感冒”,则在生成“流行性感冒”的就诊特征时,一方面可获取历史上上报过“流行性感冒”的患者的个人信息和药品信息;另一方面,假设疾病口语名称“感冒”已被认定为疾病名称标准化的转换结果是疾病标准名称“流行性感冒”,则也可获取历史上上报过“感冒”的患者的个人信息和药品信息。
在本实施例中,所述候选标准名称的就诊特征的生成过程可以参考前述步骤102中疾病口语名称的就诊特征的生成过程,本说明书在此不再一一赘述。
步骤106,根据所述疾病口语名称对应的就诊特征、各候选标准名称对应的就诊特征以及所述疾病口语名称和各候选标准名称的相似度特征计算所述疾病口语名称和各候选标准名称的匹配度。
在本实施例中,疾病口语名称和候选标准名称的相似度特征可以为疾病口语名称和候选标准名称在不同维度下的相似度所组成的相似度向量。
其中,所述不同维度下的相似度可包括:编辑距离相似度f1、拼音相似度f2、五笔编码相似度f3、TF/IDF相似度f4、语义相似度f5、历史疾病相似度f6和关联用户的历史疾病相似度f7中的一种或多种。
假设,所述不同维度下的相似度为f1至f7,则疾病口语名称和候选标准名称的相似度特征可为向量(f1,f2,f3,f4,f5,f6,f7)。
在本实施例中,可将疾病口语名称对应的就诊特征、候选标准名称对应的就诊特征和上述相似度特征作为输入,输入已训练的匹配模型,输出所述候选标准名称与所述疾病口语名称的匹配度。
其中,所述匹配度通常是一个实数值。
所述匹配模型可以为WDL模型(Wide&Deep Learning)等,本说明书对此不作特殊限制。
步骤108,当存在匹配度满足预定匹配条件的候选标准名称时,将该候选标准名称确定为所述疾病口语名称的标准化转换结果。
在本实施例中,所述匹配条件也可在上述匹配模型训练时确定。例如,所述匹配条件可以为匹配度最大,且大于阈值等。
在本实施例中,当存在匹配度满足上述匹配条件的候选标准名称时,可将该候选标准名称确定为所述疾病口语名称的标准化转换结果。
当不存在匹配度满足上述匹配条件的候选标准名称时,无法确定所述疾病口语名称的标准化转换结果,进而可以采用人工介入等方式确定所述疾病口语名称的标准化转换结果。
由以上描述可以看出,本说明书提供的疾病名称标准化的转换方案,可综合疾病口语名称和候选标准名称的就诊特征以及二者的相似度特征为所述疾病口语名称确定标准化转换结果,从而提高疾病口语名称标准化转换的准确度。
下面分别从候选标准名称的确定、匹配模型的训练两个方面来具体描述对应的实现过程。
一、候选标准名称的确定
请参考图3,候选标准名称的确定过程可包括以下步骤:
步骤302,计算疾病口语名称与各疾病标准名称在若干维度下的相似度。
在本实施例中,可计算所述疾病口语名称和国际疾病分类中各疾病标准名称在若干维度下的相似度,然后可根据相似度计算结果从国际疾病分类中筛选出部分疾病标准名称作为候选标准名称。
请参考前述图1所示实施例中的步骤106,上述不同维度下的相似度可包括:编辑距离相似度f1、拼音相似度f2、五笔编码相似度f3、TF/IDF相似度f4、语义相似度f5、历史疾病相似度f6和关联用户的历史疾病相似度f7中的一种或多种。
1、编辑距离相似度f1
在本实施例中,可采用编辑距离算法(Levenshtein Distance)来计算疾病口语名称和疾病标准名称的编辑距离相似度。一般而言,编辑距离越小,代表疾病口语名称和疾病标准名称越相似。
2、拼音相似度f2
在本实施例中,可将疾病口语名称中的每个汉字都转换为拼音,得到疾病口语名称对应的汉语拼音,为便于区分,可称之为口语拼音。类似的,也可将疾病标准名称中的每个汉字都转换为拼音,得到疾病标准名称对应的汉语拼音,可称之为标准拼音。
然后,可计算所述口语拼音和所述标准拼音之间的simhash值,然后可基于该simhash值计算所述口语拼音和所述标准拼音之间的Hamming距离(汉明距离)作为所述疾病口语名称和所述疾病标准名称的拼音相似度。
一般而言,拼音相似度越小,代表疾病口语名称和疾病标准名称的发音越相近。
3、五笔编码相似度f3
在本实施例中,可将疾病口语名称中的每个汉字都转换为五笔编码,然后基于各个汉字的五笔编码生成与所述疾病口语名称对应的五笔编码向量。类似的,也可将疾病标准名称中的每个汉字转换为五笔编码,并生成疾病标准名称对应的五笔编码向量。
然后,可计算疾病口语名称对应的五笔编码向量和疾病标准名称对应的五笔编码向量之间的余弦距离,作为所述疾病口语名称和所述疾病标准名称的五笔编码相似度。
一般而言,五笔编码相似度越大,代表疾病口语名称和疾病标准名称的字形越相近。
4、TF/IDF相似度f4
在本实施例中,可对疾病口语名称进行分词处理,以将所述疾病口语名称划分为一个或多个分词,然后可计算每个分词的TF/IDF(term frequency–inverse documentfrequency,词频/逆向文档频率)值,例如,计算每个分词在所有疾病名称(可包括疾病口语名称和疾病标准名称)分词中的TF/IDF值。类似的,可计算疾病标准名称的每个分词的TF/IDF值。
在本实施例中,TF/IDF相似度可有效衡量疾病名称中各个词语的重要程度,从而区别对待疾病名称中的各个词语,提高相似度计算结果的准确性。例如,疾病名称“风热感冒疾病”中的词语“风热”的重要性要远大于词语“疾病”。
一般而言,TF/IDF相似度越高,代表疾病口语名称和疾病标准名称越相近。
5、语义相似度f5
在本实施例中,可从药品相似度和上下文相似度两个方面来考虑疾病口语名称和疾病标准名称的语义相似度。
其中,药品相似度可指疾病口语名称对应的药品向量与疾病标准名称对应的药品向量之间的余弦相似度。其中,所述药品向量的生成方法可参考前述步骤102的药品向量的生成方法,本说明书在此不再一一赘述。
上下文相似度可指疾病口语名称对应的上下文向量与疾病标准名称对应的上下文向量之间的余弦相似度。所述上下文向量可基于疾病名称对应的上下文信息生成。
所述上下文信息可包括:处方信息、诊断信息、病症描述信息、出院小结信息、医院信息、科室信息、患者信息中的一种或多种。
以上下文信息是病症描述信息为例,可获取历史上上报所述疾病口语名称的患者的病症描述信息,所述病症描述信息通常为一段文本,然后可将该文本中的词语转换为词向量,得到该文本对应的文本向量作为所述疾病口语名称对应的上下文向量。
其中,所述词向量可采用word2vec算法、cw2vec算法等算法生成。所述文本向量可对该文本包含的词语的词向量进行拼接得到,也可以采用LSTM(Long Short-Term Memory,长短期记忆网络)等模型对该文本包含的词语的词向量进行汇总得到,本说明书对此不作特殊限制。
在其他例子中,当上下文信息包括多种信息时,可对各种信息进行文字上的拼接,然后再采用上述方式生成对应的上下文向量。
类似的,也可生成疾病标准名称对应的上下文向量。
值得注意的是,在计算向量相似度时,除余弦相似度之外,也可采用欧式距离、曼哈顿距离等计算方法,本说明书对此不作特殊限制。
在本实施例中,在计算得到疾病口语名称和疾病标准名称的药品相似度和上下文相似度之后,可计算药品相似度和上下文相似度的和值或者均值等作为疾病口语名称和疾病标准名称的语义相似度。
在本实施例中,语义相似度充分利用了疾病的医院信息、病症信息、患者信息以及药品信息等信息,可从语义方面准确计算疾病口语名称和疾病标准名称的相似度。一般而言,语义相似度越接近,代表疾病口语名称和疾病标准名称的越相近。
6、历史疾病相似度f6
考虑到患有同一疾病的患者的病史可能会有一部分相似性,在本实施例中,可计算疾病口语名称和疾病标准名称的历史疾病相似度。所述历史疾病通常为历史上上报过相应疾病名称的患者所患过的疾病。
以疾病口语名称为例,可获取历史上上报所述疾病口语名称的患者的历史疾病,然后可汇总各患者的历史疾病生成历史疾病向量。
举例来说,假设历史上上报某疾病口语名称的患者为张三和李四。除该疾病外,张三还曾患有疾病1和疾病2,李四还患有疾病2和疾病3。对张三和李四历史上曾患有的疾病进行汇总可得到疾病1、疾病2和疾病3这三种疾病。然后,可生成对应这三种疾病的历史疾病向量。
所述历史疾病向量可以是一个0/1向量,也可以是对0/1向量进行嵌入处理之后得到的低维向量。
与药品向量类似,所述历史疾病的0/1向量也是采用一个很长的向量来表示历史疾病,该向量的维度是疾病总数量,每个维度对应唯一一个疾病。若患过某疾病,则该疾病所在维度的元素值是1;若未患过某疾病,则该疾病所在维度的元素值是0。
仍以疾病1、疾病2和疾病3为例,对应的历史疾病向量中有三个分别与疾病1-疾病3对应的元素值为1,其他元素值均为0。
类似的,也可生成疾病标准名称对应的历史疾病向量。
然后,可计算疾病口语名称对应的历史疾病向量和疾病标准名称对应的历史疾病向量之间的余弦相似度,作为所述疾病口语名称和所述疾病标准名称之间的历史疾病相似度。
在本实施例中,历史疾病相似度越大,代表疾病口语名称和疾病标准名称的越相近。
7、关联用户的历史疾病相似度f7
患有遗传性疾病和传染性疾病的患者在生活中可能会存在一定交集。例如,患有“流行性感冒”的患者极有可能会把“流行性感冒传染给家人”,患有“血友病”的患者极有可能会把“血友病”遗传给儿子等。
在本实施例中,考虑到上述情况,可计算疾病口语名称和疾病标准名称的关联用户历史疾病相似度。
所述关联用户可指与患者存在预定关联关系的用户,所述预定关联关系可包括:夫妻关系、父子关系、父女关系、母子关系、母女关系等法律规定的直系亲属关系,也可包括旁系亲属关系、好友关系等,本说明书对此不作特殊限制。
在本实施例中,以疾病口语名称为例,可先确定历史上上报该疾病口语名称的各患者的关联用户,得到关联用户集合,所述关联用户集合中可包括一个或多个关联用户。然后,可汇总所述关联用户集合中各关联用户的历史疾病信息,以生成所述疾病口语名称对应的关联用户历史疾病向量。
类似的,也可确定历史上上报疾病标准名称的患者的关联用户集,然后汇总该关联用户集中各关联用户的历史疾病信息,以生成所述疾病标准名称对应的关联用户历史疾病向量。
其中,历史疾病向量的生成过程可参考前述历史疾病相似度中历史疾病向量的生成过程,本说明书在此不再一一赘述。
然后,可计算疾病口语名称对应的关联用户历史疾病向量和疾病标准名称对应的关联用户历史疾病向量之间的余弦相似度,作为所述疾病口语名称和所述疾病标准名称之间的关联用户历史疾病相似度。
在本实施例中,关联用户历史疾病相似度越大,代表疾病口语名称和疾病标准名称的越相近。
步骤304,汇总各维度下相似度满足预定相似度条件的疾病标准名称,得到候选标准名称。
基于前述步骤302,在计算得到所述疾病口语名称在若干维度下的相似度之后,针对每个维度,可按照相似度从大到小的顺序对各疾病标准名称进行排序,并提取该维度下相似度排列在前N位的疾病标准名称。然后,可对各个维度下提取出的疾病标准名称进行汇总,得到候选标准名称。
其中,N的取值可预先设置,例如5、8等。
Figure BDA0001966123100000131
表1
请参考表1的示例,假设疾病口语名称是“感冒”,在f1-f7维度下与“感冒”之间的相似度满足预定相似度条件的疾病标准名称如表1所示,则在本步骤中,可对表1中示出的疾病标准名称进行汇总,得到疾病标准名称1-疾病标准名称7,并可将疾病标准名称1-疾病标准名称7确定为候选标准名称。
由以上描述可以看出,本实施例可基于多个维度下的相似度为疾病口语名称确定候选标准名称,综合考虑同音字、音节相似字、形似字等发音和字形方面的相似情况,并且还可充分利用疾病语义、患者历史疾病、患者关联用户的历史疾病等相似情况,大大提高了候选标准名称的确定准确率。
另一方面,本说明书记载的疾病名称标准化的转换方案可将上述若干维度下的相似度作为匹配模型的输入,实现在疾病名称标准化转换时综合考虑同音字、音节相似字、形似字等发音和字形方面的相似情况,并且还可充分利用疾病语义、患者历史疾病、患者关联用户的历史疾病等信息,对于疾病口语名称在患者个人信息存在先验条件的情况下可准确找到对应的疾病标准名称,对遗传病、传染病等具有群体效应的疾病也可准确找到对应的疾病标准名称。
二、匹配模型的训练
在本实施例中,可基于历史上已经打标的疾病口语名称和疾病标准名称对匹配模型进行训练,以确定匹配模型的模型参数以及前述匹配条件。
其中,对匹配模型的训练过程可参考前述图1和图2所示实施例中记载的技术方案,本说明书在此不再一一赘述。
值得注意的是,在采用本说明书记载的方案对匹配模型进行训练之前,可先生成疾病训练集,所述疾病训练集中的每条数据可对应一个疾病口语名称,另外可包括该疾病口语名称所对应的一些信息,例如,患者个人信息、药品信息、上下文信息等,若所述疾病口语名称存在已确定的疾病标准名称时,也可包括所述疾病标准名称。
生成疾病训练集之后,后续可从该疾病训练集中提取信息以进行匹配模型的训练,以及后续疾病口语名称标准化转换结果的确定,便于信息汇总,提高执行效率。
与前述疾病名称标准化的转换方法的实施例相对应,本说明书还提供了疾病名称标准化的转换装置的实施例。
本说明书疾病名称标准化的转换装置的实施例可以应用在服务器上。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在服务器的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图4所示,为本说明书疾病名称标准化的转换装置所在服务器的一种硬件结构图,除了图4所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的服务器通常根据该服务器的实际功能,还可以包括其他硬件,对此不再赘述。
图5是本说明书一示例性实施例示出的一种疾病名称标准化的转换装置的框图。
请参考图5,所述疾病名称标准化的转换装置400可以应用在前述图4所示的服务器中,包括有:第一特征生成单元401、第二特征生成单元402、匹配度计算单元403以及名称转换单元404。
其中,第一特征生成单元401,基于疾病口语名称对应的就诊信息为所述疾病口语名称生成对应的就诊特征;
第二特征生成单元402,基于候选标准名称对应的就诊信息为每个候选标准名称生成对应的就诊特征;
匹配度计算单元403,根据所述疾病口语名称对应的就诊特征、各候选标准名称对应的就诊特征以及所述疾病口语名称和各候选标准名称的相似度特征计算所述疾病口语名称和各候选标准名称的匹配度;
名称转换单元404,当存在匹配度满足预定匹配条件的候选标准名称时,将该候选标准名称确定为所述疾病口语名称的标准化转换结果。
可选的,所述候选标准名称的确定过程包括:
计算所述疾病口语名称与各疾病标准名称在若干维度下的相似度;
汇总各维度下相似度满足预定相似度条件的疾病标准名称,得到候选标准名称。
可选的,所述若干维度下的相似度包括以下一种或多种:
编辑距离相似度、拼音相似度、五笔编码相似度、TF/IDF相似度、语义相似度、历史疾病相似度和关联用户的历史疾病相似度。
可选的,所述语义相似度的计算过程包括:
获取所述疾病口语名称和所述疾病标准名称各自对应的药品信息;
根据所述药品信息计算所述疾病口语名称和所述疾病标准名称的药品相似度;
获取所述疾病口语名称和所述疾病标准名称各自对应的上下文信息;
根据所述上下文信息计算所述疾病口语名称和所述疾病标准名称的上下文相似度;
综合所述药品相似度和所述上下文相似度,得到所述疾病口语名称和所述疾病标准名称的语义相似度。
可选的,所述上下文信息包括以下一种或多种:
处方信息、诊断信息、病症描述信息、出院小结信息、医院信息、科室信息、患者信息。
可选的,所述历史疾病相似度的计算过程包括:
获取上报所述疾病口语名称的患者的第一历史疾病信息;
获取上报所述疾病标准名称的患者的第二历史疾病信息;
计算所述第一历史疾病信息和所述第二历史疾病信息的相似度,作为所述疾病口语名称和所述疾病标准名称的历史疾病相似度。
可选的,所述关联用户的历史疾病相似度的计算过程包括:
获取上报所述疾病口语名称的患者的第一关联用户集;
获取上报所述疾病标准名称的患者的第二关联用户集;
计算所述第一关联用户集中各用户的历史疾病信息和所述第二关联用户集中各用户的历史疾病信息的相似度,作为所述疾病口语名称和所述疾病标准名称的关联用户的历史疾病相似度。
可选的,所述相似度特征是所述若干维度下的相似度组成的相似度向量。
可选的,所述就诊信息包括以下一种或多种:
患者年龄分布信息、患者地域分布信息、患者性别分布信息以及药品信息。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
与前述疾病名称标准化的转换方法的实施例相对应,本说明书还提供一种疾病名称标准化的转换装置,该装置包括:处理器以及用于存储机器可执行指令的存储器。其中,处理器和存储器通常借由内部总线相互连接。在其他可能的实现方式中,所述设备还可能包括外部接口,以能够与其他设备或者部件进行通信。
在本实施例中,通过读取并执行所述存储器存储的与疾病名称标准化的转换逻辑对应的机器可执行指令,所述处理器被促使:
基于疾病口语名称对应的就诊信息为所述疾病口语名称生成对应的就诊特征;
基于候选标准名称对应的就诊信息为每个候选标准名称生成对应的就诊特征;
根据所述疾病口语名称对应的就诊特征、各候选标准名称对应的就诊特征以及所述疾病口语名称和各候选标准名称的相似度特征计算所述疾病口语名称和各候选标准名称的匹配度;
当存在匹配度满足预定匹配条件的候选标准名称时,将该候选标准名称确定为所述疾病口语名称的标准化转换结果。
可选的,在确定候选标准名称时,所述处理器被促使:
计算所述疾病口语名称与各疾病标准名称在若干维度下的相似度;
汇总各维度下相似度满足预定相似度条件的疾病标准名称,得到候选标准名称。
可选的,所述若干维度下的相似度包括以下一种或多种:
编辑距离相似度、拼音相似度、五笔编码相似度、TF/IDF相似度、语义相似度、历史疾病相似度和关联用户的历史疾病相似度。
可选的,在计算语义相似度时,所述处理器被促使:
获取所述疾病口语名称和所述疾病标准名称各自对应的药品信息;
根据所述药品信息计算所述疾病口语名称和所述疾病标准名称的药品相似度;
获取所述疾病口语名称和所述疾病标准名称各自对应的上下文信息;
根据所述上下文信息计算所述疾病口语名称和所述疾病标准名称的上下文相似度;
综合所述药品相似度和所述上下文相似度,得到所述疾病口语名称和所述疾病标准名称的语义相似度。
可选的,所述上下文信息包括以下一种或多种:
处方信息、诊断信息、病症描述信息、出院小结信息、医院信息、科室信息、患者信息。
可选的,在计算历史疾病相似度时,所述处理器被促使:
获取上报所述疾病口语名称的患者的第一历史疾病信息;
获取上报所述疾病标准名称的患者的第二历史疾病信息;
计算所述第一历史疾病信息和所述第二历史疾病信息的相似度,作为所述疾病口语名称和所述疾病标准名称的历史疾病相似度。
可选的,在计算关联用户的历史疾病相似度时,所述处理器被促使:
获取上报所述疾病口语名称的患者的第一关联用户集;
获取上报所述疾病标准名称的患者的第二关联用户集;
计算所述第一关联用户集中各用户的历史疾病信息和所述第二关联用户集中各用户的历史疾病信息的相似度,作为所述疾病口语名称和所述疾病标准名称的关联用户的历史疾病相似度。
可选的,所述相似度特征是所述若干维度下的相似度组成的相似度向量。
可选的,所述就诊信息包括以下一种或多种:
患者年龄分布信息、患者地域分布信息、患者性别分布信息以及药品信息。
与前述疾病名称标准化的转换方法的实施例相对应,本说明书还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现以下步骤:
基于疾病口语名称对应的就诊信息为所述疾病口语名称生成对应的就诊特征;
基于候选标准名称对应的就诊信息为每个候选标准名称生成对应的就诊特征;
根据所述疾病口语名称对应的就诊特征、各候选标准名称对应的就诊特征以及所述疾病口语名称和各候选标准名称的相似度特征计算所述疾病口语名称和各候选标准名称的匹配度;
当存在匹配度满足预定匹配条件的候选标准名称时,将该候选标准名称确定为所述疾病口语名称的标准化转换结果。
可选的,所述候选标准名称的确定过程包括:
计算所述疾病口语名称与各疾病标准名称在若干维度下的相似度;
汇总各维度下相似度满足预定相似度条件的疾病标准名称,得到候选标准名称。
可选的,所述若干维度下的相似度包括以下一种或多种:
编辑距离相似度、拼音相似度、五笔编码相似度、TF/IDF相似度、语义相似度、历史疾病相似度和关联用户的历史疾病相似度。
可选的,所述语义相似度的计算过程包括:
获取所述疾病口语名称和所述疾病标准名称各自对应的药品信息;
根据所述药品信息计算所述疾病口语名称和所述疾病标准名称的药品相似度;
获取所述疾病口语名称和所述疾病标准名称各自对应的上下文信息;
根据所述上下文信息计算所述疾病口语名称和所述疾病标准名称的上下文相似度;
综合所述药品相似度和所述上下文相似度,得到所述疾病口语名称和所述疾病标准名称的语义相似度。
可选的,所述上下文信息包括以下一种或多种:
处方信息、诊断信息、病症描述信息、出院小结信息、医院信息、科室信息、患者信息。
可选的,所述历史疾病相似度的计算过程包括:
获取上报所述疾病口语名称的患者的第一历史疾病信息;
获取上报所述疾病标准名称的患者的第二历史疾病信息;
计算所述第一历史疾病信息和所述第二历史疾病信息的相似度,作为所述疾病口语名称和所述疾病标准名称的历史疾病相似度。
可选的,所述关联用户的历史疾病相似度的计算过程包括:
获取上报所述疾病口语名称的患者的第一关联用户集;
获取上报所述疾病标准名称的患者的第二关联用户集;
计算所述第一关联用户集中各用户的历史疾病信息和所述第二关联用户集中各用户的历史疾病信息的相似度,作为所述疾病口语名称和所述疾病标准名称的关联用户的历史疾病相似度。
可选的,所述相似度特征是所述若干维度下的相似度组成的相似度向量。
可选的,所述就诊信息包括以下一种或多种:
患者年龄分布信息、患者地域分布信息、患者性别分布信息以及药品信息。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述仅为本说明书的较佳实施例而已,并不用以限制本说明书,凡在本说明书的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书保护的范围之内。

Claims (17)

1.一种疾病名称标准化的转换方法,包括:
基于疾病口语名称对应的就诊信息为所述疾病口语名称生成对应的就诊特征;
基于候选标准名称对应的就诊信息为每个候选标准名称生成对应的就诊特征;
根据所述疾病口语名称对应的就诊特征、各候选标准名称对应的就诊特征以及所述疾病口语名称和各候选标准名称的相似度特征计算所述疾病口语名称和各候选标准名称的匹配度;
当存在匹配度满足预定匹配条件的候选标准名称时,将该候选标准名称确定为所述疾病口语名称的标准化转换结果;
其中,所述根据所述疾病口语名称对应的就诊特征、各候选标准名称对应的就诊特征以及所述疾病口语名称和各候选标准名称的相似度特征计算所述疾病口语名称和各候选标准名称的匹配度,包括:
将疾病口语名称对应的就诊特征、候选标准名称对应的就诊特征和上述相似度特征作为输入,输入已训练的匹配模型,输出所述候选标准名称与所述疾病口语名称的匹配度;
所述就诊信息包括以下一种或多种:
患者年龄分布信息、患者地域分布信息、患者性别分布信息以及药品信息。
2.根据权利要求1所述的方法,所述候选标准名称的确定过程包括:
计算所述疾病口语名称与各疾病标准名称在若干维度下的相似度;
汇总各维度下相似度满足预定相似度条件的疾病标准名称,得到候选标准名称。
3.根据权利要求2所述的方法,所述若干维度下的相似度包括以下一种或多种:
编辑距离相似度、拼音相似度、五笔编码相似度、TF/IDF相似度、语义相似度、历史疾病相似度和关联用户的历史疾病相似度。
4.根据权利要求3所述的方法,所述语义相似度的计算过程包括:
获取所述疾病口语名称和所述疾病标准名称各自对应的药品信息;
根据所述药品信息计算所述疾病口语名称和所述疾病标准名称的药品相似度;
获取所述疾病口语名称和所述疾病标准名称各自对应的上下文信息;
根据所述上下文信息计算所述疾病口语名称和所述疾病标准名称的上下文相似度;
综合所述药品相似度和所述上下文相似度,得到所述疾病口语名称和所述疾病标准名称的语义相似度。
5.根据权利要求4所述的方法,所述上下文信息包括以下一种或多种:
处方信息、诊断信息、病症描述信息、出院小结信息、医院信息、科室信息、患者信息。
6.根据权利要求3所述的方法,所述历史疾病相似度的计算过程包括:
获取上报所述疾病口语名称的患者的第一历史疾病信息;
获取上报所述疾病标准名称的患者的第二历史疾病信息;
计算所述第一历史疾病信息和所述第二历史疾病信息的相似度,作为所述疾病口语名称和所述疾病标准名称的历史疾病相似度。
7.根据权利要求3所述的方法,所述关联用户的历史疾病相似度的计算过程包括:
获取上报所述疾病口语名称的患者的第一关联用户集;
获取上报所述疾病标准名称的患者的第二关联用户集;
计算所述第一关联用户集中各用户的历史疾病信息和所述第二关联用户集中各用户的历史疾病信息的相似度,作为所述疾病口语名称和所述疾病标准名称的关联用户的历史疾病相似度。
8.根据权利要求2所述的方法,
所述相似度特征是所述若干维度下的相似度组成的相似度向量。
9.一种疾病名称标准化的转换装置,包括:
第一特征生成单元,基于疾病口语名称对应的就诊信息为所述疾病口语名称生成对应的就诊特征;
第二特征生成单元,基于候选标准名称对应的就诊信息为每个候选标准名称生成对应的就诊特征;
匹配度计算单元,根据所述疾病口语名称对应的就诊特征、各候选标准名称对应的就诊特征以及所述疾病口语名称和各候选标准名称的相似度特征计算所述疾病口语名称和各候选标准名称的匹配度;
名称转换单元,当存在匹配度满足预定匹配条件的候选标准名称时,将该候选标准名称确定为所述疾病口语名称的标准化转换结果;
其中,所述根据所述疾病口语名称对应的就诊特征、各候选标准名称对应的就诊特征以及所述疾病口语名称和各候选标准名称的相似度特征计算所述疾病口语名称和各候选标准名称的匹配度,包括:
将疾病口语名称对应的就诊特征、候选标准名称对应的就诊特征和上述相似度特征作为输入,输入已训练的匹配模型,输出所述候选标准名称与所述疾病口语名称的匹配度;
所述就诊信息包括以下一种或多种:
患者年龄分布信息、患者地域分布信息、患者性别分布信息以及药品信息。
10.根据权利要求9所述的装置,所述候选标准名称的确定过程包括:
计算所述疾病口语名称与各疾病标准名称在若干维度下的相似度;
汇总各维度下相似度满足预定相似度条件的疾病标准名称,得到候选标准名称。
11.根据权利要求10所述的装置,所述若干维度下的相似度包括以下一种或多种:
编辑距离相似度、拼音相似度、五笔编码相似度、TF/IDF相似度、语义相似度、历史疾病相似度和关联用户的历史疾病相似度。
12.根据权利要求11所述的装置,所述语义相似度的计算过程包括:
获取所述疾病口语名称和所述疾病标准名称各自对应的药品信息;
根据所述药品信息计算所述疾病口语名称和所述疾病标准名称的药品相似度;
获取所述疾病口语名称和所述疾病标准名称各自对应的上下文信息;
根据所述上下文信息计算所述疾病口语名称和所述疾病标准名称的上下文相似度;
综合所述药品相似度和所述上下文相似度,得到所述疾病口语名称和所述疾病标准名称的语义相似度。
13.根据权利要求12所述的装置,所述上下文信息包括以下一种或多种:
处方信息、诊断信息、病症描述信息、出院小结信息、医院信息、科室信息、患者信息。
14.根据权利要求11所述的装置,所述历史疾病相似度的计算过程包括:
获取上报所述疾病口语名称的患者的第一历史疾病信息;
获取上报所述疾病标准名称的患者的第二历史疾病信息;
计算所述第一历史疾病信息和所述第二历史疾病信息的相似度,作为所述疾病口语名称和所述疾病标准名称的历史疾病相似度。
15.根据权利要求11所述的装置,所述关联用户的历史疾病相似度的计算过程包括:
获取上报所述疾病口语名称的患者的第一关联用户集;
获取上报所述疾病标准名称的患者的第二关联用户集;
计算所述第一关联用户集中各用户的历史疾病信息和所述第二关联用户集中各用户的历史疾病信息的相似度,作为所述疾病口语名称和所述疾病标准名称的关联用户的历史疾病相似度。
16.根据权利要求10所述的装置,
所述相似度特征是所述若干维度下的相似度组成的相似度向量。
17.一种疾病名称标准化的转换装置,包括:
处理器;
用于存储机器可执行指令的存储器;
其中,通过读取并执行所述存储器存储的与疾病名称标准化的转换逻辑对应的机器可执行指令,所述处理器被促使:
基于疾病口语名称对应的就诊信息为所述疾病口语名称生成对应的就诊特征;
基于候选标准名称对应的就诊信息为每个候选标准名称生成对应的就诊特征;
根据所述疾病口语名称对应的就诊特征、各候选标准名称对应的就诊特征以及所述疾病口语名称和各候选标准名称的相似度特征计算所述疾病口语名称和各候选标准名称的匹配度;
当存在匹配度满足预定匹配条件的候选标准名称时,将该候选标准名称确定为所述疾病口语名称的标准化转换结果;
其中,所述根据所述疾病口语名称对应的就诊特征、各候选标准名称对应的就诊特征以及所述疾病口语名称和各候选标准名称的相似度特征计算所述疾病口语名称和各候选标准名称的匹配度,包括:
将疾病口语名称对应的就诊特征、候选标准名称对应的就诊特征和上述相似度特征作为输入,输入已训练的匹配模型,输出所述候选标准名称与所述疾病口语名称的匹配度;
所述就诊信息包括以下一种或多种:
患者年龄分布信息、患者地域分布信息、患者性别分布信息以及药品信息。
CN201910103210.6A 2019-02-01 2019-02-01 疾病名称标准化的转换方法和装置 Active CN110032728B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910103210.6A CN110032728B (zh) 2019-02-01 2019-02-01 疾病名称标准化的转换方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910103210.6A CN110032728B (zh) 2019-02-01 2019-02-01 疾病名称标准化的转换方法和装置

Publications (2)

Publication Number Publication Date
CN110032728A CN110032728A (zh) 2019-07-19
CN110032728B true CN110032728B (zh) 2023-04-07

Family

ID=67235500

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910103210.6A Active CN110032728B (zh) 2019-02-01 2019-02-01 疾病名称标准化的转换方法和装置

Country Status (1)

Country Link
CN (1) CN110032728B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110674266A (zh) * 2019-08-15 2020-01-10 阿里巴巴集团控股有限公司 健康保障项目中的答案处理方法以及装置
CN112613319A (zh) * 2019-09-18 2021-04-06 杭州联保致新科技有限公司 一种车辆配件名称自动标准化方法和装置
CN110781646B (zh) * 2019-10-15 2023-08-22 泰康保险集团股份有限公司 名称标准化方法、装置、介质及电子设备
CN110931090A (zh) * 2019-11-26 2020-03-27 太平金融科技服务(上海)有限公司 疾病数据处理方法、装置、计算机设备和存储介质
CN111428477B (zh) * 2020-03-06 2023-10-17 讯飞医疗科技股份有限公司 诊断名标准化方法、装置、电子设备和存储介质
CN111564210A (zh) * 2020-04-01 2020-08-21 心医国际数字医疗系统(大连)有限公司 智能导诊方法、装置、电子设备及存储介质
CN111710431B (zh) * 2020-06-17 2023-12-22 讯飞医疗科技股份有限公司 一种识别同义诊断名称的方法、装置、设备及存储介质
CN111739601B (zh) * 2020-06-28 2022-03-29 山东健康医疗大数据有限公司 非标准疾病名称的归一化方法、装置及可读介质
CN113793668B (zh) * 2021-09-17 2024-07-23 平安科技(深圳)有限公司 基于人工智能的症状标准化方法、装置、电子设备及介质
CN113990513A (zh) * 2021-10-27 2022-01-28 吾征智能技术(北京)有限公司 一种基于症状特征的疾病分类的系统、设备及介质
CN114386397A (zh) * 2022-01-18 2022-04-22 平安健康保险股份有限公司 非标准疾病名称的疾病编码匹配方法、装置及计算机设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106844308B (zh) * 2017-01-20 2020-04-03 天津艾登科技有限公司 一种使用语义识别进行自动化疾病编码转换的方法
CN106933806A (zh) * 2017-03-15 2017-07-07 北京大数医达科技有限公司 医疗同义词的确定方法和装置
CN108021553A (zh) * 2017-09-30 2018-05-11 北京颐圣智能科技有限公司 疾病术语的词处理方法、装置及计算机设备

Also Published As

Publication number Publication date
CN110032728A (zh) 2019-07-19

Similar Documents

Publication Publication Date Title
CN110032728B (zh) 疾病名称标准化的转换方法和装置
Manzini et al. Black is to criminal as caucasian is to police: Detecting and removing multiclass bias in word embeddings
US11301637B2 (en) Methods, devices, and systems for constructing intelligent knowledge base
CN109670179B (zh) 基于迭代膨胀卷积神经网络的病历文本命名实体识别方法
EP3985559A1 (en) Entity semantics relationship classification
CN110770850B (zh) 在实体之间学习和应用背景相似性
CN111798941A (zh) 用于生成临床查询的预测系统
CN111709233A (zh) 基于多注意力卷积神经网络的智能导诊方法及系统
US11900518B2 (en) Interactive systems and methods
US11468989B2 (en) Machine-aided dialog system and medical condition inquiry apparatus and method
CN110838359B (zh) 基于对话机器人的分诊方法、装置、存储介质及机器人
Sanders et al. Phonological distance measures
CN112885478B (zh) 医疗文献的检索方法、装置、电子设备及存储介质
CN115017893A (zh) 校正通过深度学习生成的内容
CN110263167B (zh) 医疗实体分类模型生成方法、装置、设备和可读存储介质
WO2021174923A1 (zh) 概念词序列生成方法、装置、计算机设备及存储介质
CN110188357A (zh) 对象的行业识别方法及装置
CN113724830A (zh) 基于人工智能的用药风险检测方法及相关设备
WO2014130287A1 (en) Method and system for propagating labels to patient encounter data
WO2022227171A1 (zh) 关键信息提取方法、装置、电子设备及介质
CN112308703B (zh) 用户分群方法、装置、设备及存储介质
CN113761899A (zh) 一种医疗文本生成方法、装置、设备及存储介质
CN110837843A (zh) 信息分类方法、装置、计算机设备及存储介质
CN111512395A (zh) 学习并应用实体之间的背景相似性
US20240070544A1 (en) Model generation apparatus, document generation apparatus, model generation method, document generation method, and program

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40010914

Country of ref document: HK

TA01 Transfer of patent application right

Effective date of registration: 20200925

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200925

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant