WO2022041730A1

WO2022041730A1 - 医疗领域意图识别方法、装置、设备及存储介质

Info

Publication number: WO2022041730A1
Application number: PCT/CN2021/084659
Authority: WO
Inventors: 原丽娜
Original assignee: 康键信息技术（深圳）有限公司
Priority date: 2020-08-28
Filing date: 2021-03-31
Publication date: 2022-03-03
Also published as: CN112035635A

Abstract

一种医疗领域意图识别方法、装置、设备及存储介质，应用于智慧医疗领域中，用于提高医疗领域意图识别结果的准确度。该方法包括：从终端获取初始问题语句；调用预置的识别模型对初始问题语句进行实体识别，得到实体识别结果；根据预置的医疗实体同义词表对多个粗粒度实体标签进行实体链接，得到链接后的实体标签；根据预置的意图识别模型、实体识别结果和链接后的实体标签对初始问题语句进行意图识别，得到候选医疗意图；根据候选医疗意图生成知识图谱查询语句；基于知识图谱查询语句在预置的医疗知识图谱进行知识图谱查询，得到知识图谱查询结果，根据知识图谱查询结果生成对应的目标话术并发送至终端。

Description

医疗领域意图识别方法、装置、设备及存储介质

本申请要求于2020年8月28日提交中国专利局、申请号为202010884353.8、发明名称为“医疗领域意图识别方法、装置、设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在申请中。

技术领域

本申请涉及医疗数据领域，尤其涉及一种医疗领域意图识别方法、装置、设备及存储介质。

背景技术

随着计算机技术在医疗领域的应用，在线问诊方式逐步打破了传统就医局限，为用户带来便利且高效的医疗体验，用户可足不出户满足自己的就医需求，免去路途遥远、挂号排队等问题的困扰，同时节约了医疗资源，提高了问诊效率。随着自然语言处理技术的发展，在线问诊系统逐步向着智能化的方向发展，如在问诊系统中引入智能问答引擎，可在问诊过程中替代医生回答用户问题，同时可为医生提供辅助的决策支持，使得问诊过程更加高效。

传统的医疗问答系统是以大量人工校对的问题答案作为知识库，基于文本相似度的方式，匹配和用户问题相似度最高的问题答案反馈给用户。发明人意识到，由于就诊过程中患病群体、疾病症状的描述方式、以及相应的治疗方式等具有多样性和特殊性，固定的问答知识无法覆盖，并且无法形成推理机制，加上维护知识库需要大量的人工成本，因此基于模板的医疗问答系统采用规则匹配或者句式匹配的方式进行意图识别，无法对多样的问题描述形式进行全覆盖，对医疗领域意图的识别准确度低。

发明内容

本申请提供了一种医疗领域意图识别方法、装置、设备及存储介质，解决了对医疗领域意图的识别准确度低的问题。

为实现上述目的，本申请第一方面提供了一种医疗领域意图识别方法，包括：从终端获取初始问题语句，所述初始问题语句为目标用户在医疗智能问答系统中输入的问题语句；调用预置的识别模型对所述初始问题语句进行实体识别，得到实体识别结果，所述实体识别结果包括多个粗粒度实体标签和多个实体关系；根据预置的医疗实体同义词表对所述多个粗粒度实体标签进行实体链接，得到链接后的实体标签；根据预置的意图识别模型、所述实体识别结果和所述链接后的实体标签对所述初始问题语句进行意图识别，得到候选医疗意图；根据所述候选医疗意图生成知识图谱查询语句；基于所述知识图谱查询语句在预置的医疗知识图谱进行知识图谱查询，得到知识图谱查询结果，根据所述知识图谱查询结果生成对应的目标话术并发送至所述终端。

本申请第二方面提供了一种医疗领域意图识别设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现如下步骤：从终端获取初始问题语句，所述初始问题语句为目标用户在医疗智能问答系统中输入的问题语句；调用预置的识别模型对所述初始问题语句进行实体识别，得到实体识别结果，所述实体识别结果包括多个粗粒度实体标签和多个实体关系；根据预置的医疗实体同义词表对所述多个粗粒度实体标签进行实体链接，得到链接后的实体标签；根据预置的意图识别模型、所述实体识别结果和所述链接后的实体标签对所述初始问题语句进行意图识别，得到候选医疗意图；根据所述候选医疗意图生成知识图谱查询语句；基于所述知识图谱查询语句在预置的医疗知识图谱进行知识图谱查询，得到知识图谱查询结果，根据所述知识图谱查询结果生成对应的目标话术并发送至所述终端。

本申请第三方面提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机指令，当所述计算机指令在计算机上运行时，使得计算机执行如下步骤：从终端获取初始问题语句，所述初始问题语句为目标用户在医疗智能问答系统中输入的问题语句；调用预置的识别模型对所述初始问题语句进行实体识别，得到实体识别结果，所述实体识别结果包括多个粗粒度实体标签和多个实体关系；根据预置的医疗实体同义词表对所述多个粗粒度实体标签进行实体链接，得到链接后的实体标签；根据预置的意图识别模型、所述实体识别结果和所述链接后的实体标签对所述初始问题语句进行意图识别，得到候选医疗意图；根据所述候选医疗意图生成知识图谱查询语句；基于所述知识图谱查询语句在预置的医疗知识图谱进行知识图谱查询，得到知识图谱查询结果，根据所述知识图谱查询结果生成对应的目标话术并发送至所述终端。

本申请第四方面提供了一种医疗领域意图识别装置，包括：语句获取模块，用于从终端获取初始问题语句，所述初始问题语句为目标用户在医疗智能问答系统中输入的问题语句；实体识别模块，用于调用预置的识别模型对所述初始问题语句进行实体识别，得到实体识别结果，所述实体识别结果包括多个粗粒度实体标签和多个实体关系；实体链接模块，用于根据预置的医疗实体同义词表对所述多个粗粒度实体标签进行实体链接，得到链接后的实体标签；意图识别模块，用于根据预置的意图识别模型、所述实体识别结果和所述链接后的实体标签对所述初始问题语句进行意图识别，得到候选医疗意图；语句生成模块，用于根据所述候选医疗意图生成知识图谱查询语句；图谱查询模块，用于基于所述知识图谱查询语句在预置的医疗知识图谱进行知识图谱查询，得到知识图谱查询结果，根据所述知识图谱查询结果生成对应的目标话术并发送至所述终端。

本申请提供的技术方案中，从终端获取初始问题语句，初始问题语句为目标用户在医疗智能问答系统中输入的问题语句；调用预置的识别模型对初始问题语句进行实体识别，得到实体识别结果，实体识别结果包括多个粗粒度实体标签和多个实体关系；根据预置的医疗实体同义词表对多个粗粒度实体标签进行实体链接，得到链接后的实体标签；根据预置的意图识别模型、实体识别结果和链接后的实体标签对初始问题语句进行意图识别，得到候选医疗意图；根据候选医疗意图生成知识图谱查询语句；基于知识图谱查询语句在预置的医疗知识图谱进行知识图谱查询，得到知识图谱查询结果，根据知识图谱查询结果生成对应的目标话术并发送至终端。本申请实施例，采用融合多维度特征的深度学习模型分开进行实体识别和关系抽取，同时采用粗粒度实体识对细粒度实体识别结果进行优化，减少了实体抽取过程中的错误传递和冗余信息的干扰，提高了实体识别结果的准确度，进而提高了医疗领域意图识别结果的准确度。

附图说明

图1为本申请实施例中医疗领域意图识别方法的一个实施例示意图；

图2为本申请实施例中医疗领域意图识别方法的另一个实施例示意图；

图3为本申请实施例中医疗领域意图识别装置的一个实施例示意图；

图4为本申请实施例中医疗领域意图识别装置的另一个实施例示意图；

图5为本申请实施例中医疗领域意图识别设备的一个实施例示意图。

具体实施方式

本申请提供了一种医疗领域意图识别方法、装置、设备及存储介质，用于减少实体抽取过程中的错误传递和冗余信息的干扰，提高实体识别结果的准确度，进而提高医疗领域意图识别结果的准确度。

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例进行描述。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”或“具有”及其任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

请参阅图1，本申请实施例提供的医疗领域意图识别方法的流程图，具体包括：

101、从终端获取初始问题语句，初始问题语句为目标用户在医疗智能问答系统中输入的问题语句。

服务器从终端获取初始问题语句，该初始问题语句为目标用户在医疗智能问答系统中输入的问题语句。初始问题语句是用户想要了解的医学知识问题，例如，“打完头孢能喝酒吗？”、“肌肉酸痛应该去哪个科室问诊？”本实施例对初始问题语句的是咨询领域不做限定，只要和医疗相关即可。

可以理解的是，本申请的执行主体可以为医疗领域意图识别装置，还可以是服务器，具体此处不做限定。本申请实施例以服务器为执行主体为例进行说明。

102、调用预置的识别模型对初始问题语句进行实体识别，得到实体识别结果，实体识别结果包括多个粗粒度实体标签和多个实体关系。

具体的，服务器调用第一预置识别模型对初始问题语句进行实体识别，得到多个粗粒度实体标签；调用第二预置识别模型对初始问题语句进行关系抽取，得到多个实体关系；根据多个粗粒度实体标签和多个实体关系生成实体识别结果。

其中，服务器可以调用第二预置识别模型的BILSTM层提取初始问题语句的上下文关系，得到多个时序向量，时序向量用于指示上下文关系；将多个时序向量输入到第二预置识别模型的注意力Attention层，生成多个句子特征向量，句子特征向量用于指示实体关系；其中，Attention层是先计算每个时序向量的权重，然后将所有时序向量的加权和作为特征向量，然后进行softmax分类。

可选的，服务器调用第一预置识别模型对初始问题语句进行实体识别，得到多个粗粒度实体标签，具体包括：

服务器调用第一预置识别模型对初始问题语句按照细粒度进行实体识别，得到多个细粒度实体标签；服务器调用第一预置识别模型对多个细粒度实体标签按照粗粒度进行实体识别，得到多个粗粒度实体标签。

本实施例，采用融合多维度特征的深度学习模型分开进行实体识别和关系抽取，减少错误传递和冗余信息的干扰，同时采用粗粒度实体识对细粒度实体识别结果进行优化，可进一步提高识别准确度。

103、根据预置的医疗实体同义词表对多个粗粒度实体标签进行实体链接，得到链接后的实体标签。

服务器根据预置的医疗实体同义词表对多个粗粒度实体标签进行实体链接，得到链接后的实体标签。具体的，服务器在预置的医疗实体同义词表中查找多个粗粒度实体标签对应的多个标准的医疗术语，每一个粗粒度实体标签对应一个标准的医疗术语，粗粒度实体标签与标准的医疗术语为同义词；服务器对多个粗粒度实体标签进行融合，得到多个融合的粗粒度实体标签；服务器对多个融合的粗粒度实体标签和多个标准的医疗术语进行实体链接操作，生成链接后的实体标签。

本实施例主要是对一些用户表达较口语化的医学词，进行实体链接操作，以链接到标准的医学术语上，例如，用户描述“打了胎后”，对应的医学术语为“人流后”，将“打了胎后”链接到“人流后”，又例如，用户描述“小腹部胀痛”需要链接到“下腹胀痛”的标准术语上；“怀孕34+”和“怀孕40+”都对应有标准的医疗数据“孕晚期”，因此，将“怀孕34+”和“怀孕40+”都链接到“孕晚期”上。

需要说明的是，在进行实体链接之前，还可以对粗粒度实体标签进行融合，得到融合的粗粒度实体标签，例如，“怀孕34+”和“怀孕40+”都属于孕晚期，“怀孕34+”和“怀孕40+”可以融合为“怀孕34至40周”，“怀孕34至40周”即为融合的粗粒度实体标签，然后再将融合的粗粒度实体标签于标准的医学术语进行链接。

104、根据预置的意图识别模型、实体识别结果和链接后的实体标签对初始问题语句进行意图识别，得到候选医疗意图。

服务器根据预置的意图识别模型、实体识别结果和链接后的实体标签对初始问题语句进行意图识别，得到候选医疗意图。

其中，意图识别模型为深度学习模型，由输入层、BERT词向量层、BiLSTM层、Attention层和Softmax分类层组成；由于问题意图与实体、实体标签关联较大，因此本实施例中将实体识别结果和链接后的实体标签也作为意图识别模型的输入，本实施例将初始问题语句、识别结果和链接后的实体标签联合作为输入层的句子输入。

其中，BERT词向量层将输入的句子生成词向量，BERT词向量层的输出作为BiLSTM层的输入；将BiLSTM层的全连接输出作为Attention层的输入；对Attention层的输出采用Softmax分类器进行最终的意图标签分类，得到候选医疗意图，其中，意图类型包括：原因、解释、并发症、传播方式、治疗方法、相关检查、疾病诊断、注意事项、功效、副作用/危害、操作方法、使用/服用方法、用法用量、饮食建议、是否等。

本实施例，采用深度学习模型进行用户意图识别，减少了模板数量，提高了对真实对话中的问答情况的覆盖率和准确度，并降低了维护成本。

105、根据候选医疗意图生成知识图谱查询语句。

服务器根据候选医疗意图生成知识图谱查询语句。

本实施例中，结合初始问题语句的实体识别结果和意图识别结果，进行知识图谱的查询映射，生成知识图谱查询语句，其中，查询对象可以是实体间的关系，也可以是实体的属性。

106、基于知识图谱查询语句在预置的医疗知识图谱进行知识图谱查询，得到知识图谱查询结果，根据知识图谱查询结果生成对应的目标话术并发送至终端。

具体的，服务器基于知识图谱查询语句在预置的医疗知识图谱进行查询，得到知识图谱查询结果，知识图谱查询结果包括目标实体的关系、目标实体的属性和多个实体；根据目标实体的关系和目标实体的属性生成对应的目标话术，并将目标话术发送至终端。。

对于不同的知识图谱查询结果，即不查询不同的实体类型，实体类型包括实体的关系、实体的属性和实体，具体过程如下：

若知识图谱查询结果为查询目标实体的关系，即知识图谱查询语句查询目标实体的关系。例如，当用户的初始问题语句是“肝硬化有哪些并发症？”时，实体识别结果为“肝硬化：疾病”，意图识别结果为“并发症”，对应的知识图谱查询语句为“match(n:Disease)-[r:Complication]-(m:Symptom)where n.name＝“肝硬化”return m.name”，将连接肝硬化并发症关系的标签为症状的节点的name属性组合，生成目标话术“肝硬化并发症有肝功能受损、门脉高压、消化道出血、肝性脑病、腹膜炎等。”，将目标话术发送至终端。

若知识图谱查询结果为查询目标实体的属性，即知识图谱查询语句查询目标实体的属性。例如，当用户的初始问题语句是“贝特类降脂药有什么副作用？”，实体抽取结果为“贝特类降脂药：药品”，意图识别结果为“副作用/危害”，对应的图谱查询语句为“match(n:Drug)where n.name＝“贝特类降脂药”return n.harm”，那么根据贝特类降脂药的副作用属性生成目标话术“贝特类降脂药不良反应为胃肠道不适、皮疹、脱发、头痛、性欲减退等。”，并将目标话术发送至终端；

若知识图谱查询结果为查询多个实体，例如，用户的初始问题语句是“孕期屁股痛需要注意哪些？”，实体抽取结果为“孕期：特殊时期，屁股痛：症状”，意图识别结果为“注意事项”，对应的图谱查询语句为：“match(n:SpecialPeriod{name:“孕期”})-[:MultiConditionRestriction]->(p:SpanNode),(m:Symptom{name:“屁股痛”})-[:MultiConditionRestriction]->(p:SpanNode)return p.attention”，确定与孕期和屁股痛都有关系的空白节点的注意事项属性值，并根据注意事项属性值生成目标话术“孕妇屁股痛可以用热毛巾、热水袋对疼痛处进行热敷，约半小时，疼痛感可以减轻不少”，并将目标话术发送至终端。

可以理解的是，服务器结合实体类型进行知识图谱查询语句转换，制定个性化话术将结果反馈给用户使用的终端，能够在线上问诊应用中为医生提供辅助的决策支持，使得问诊过程更高效。

本申请实施例，采用融合多维度特征的深度学习模型分开进行实体识别和关系抽取，同时采用粗粒度实体识对细粒度实体识别结果进行优化，减少了实体抽取过程中的错误传递和冗余信息的干扰，提高了实体识别结果的准确度，进而提高了医疗领域意图识别结果的准确度。并且本方案可应用于智慧医疗领域中，从而推动智慧城市的建设。

请参阅图2，本申请实施例提供的医疗领域意图识别方法的另一个流程图，具体包括：

201、构建预置的医疗知识图谱。

服务器构建预置的医疗知识图谱。具体包括：

(1)服务器获取多个数据源，多个数据源包括结构化医疗数据、半结构化医疗数据和线上医疗问诊对话数据。

其中，结构化医疗数据主要来源于业务中已有的存储与关系型数据库中疾病、药品和检查检验相关数据，半结构化医疗数据主要来源于维基百科的医疗数据、百度百科的医疗数据，数据清晰后存为半结构化数据。上述结构化半结构化数据文本内容较长且专业性较高，不易于用户理解，因此本实施例中在构建医疗知识图谱时，将医生校对后的线上问诊对话中产生的问题答案知识(即线上医疗问诊对话数据)也作为数据源之一，本申请的方案更倾向于模拟真实问诊场景对话，优化了用户问诊体验。

(2)、服务器对多个数据源进行实体抽取，得到多个实体和多个实体关系，并设置多个实体对应的实体属性和多个实体关系对应的关系属性。

本实施例采用自顶向下方式进行图谱构建，即采用基于深度学习模型的实体识别和关系抽取方法针对结构化医疗数据和半结构化医疗数据进行实体识别和关系抽取，添加到知识图谱中。

可选的，步骤(2)具体包括：

服务器采用基于深度学习模型对结构化医疗数据进行实体识别和关系抽取；服务器采用基于深度学习模型对半结构化医疗数据进行实体识别和关系的抽取；服务器生成多个实体和多个实体关系；服务器分别为每个实体设置相应的属性，得到多个实体属性，对每个实体关系设置相应的属性，得到多个实体关系属性。

其中，多个实体包括科室、疾病、症状、药品、治疗手段、食品和保健品，实体关系包括就诊科室、相关症状、适宜药品和并发症。不同类型的实体或关系，可以设置不相应的属性，例如，实体“疾病”对应有“解释”、“病因”、“发病率”等属性，实体“药品”对应有“规格”、“功效”、“禁忌”等属性，实体关系“并发症”对应有“休克”“感染”等。

(3)、服务器根据多个实体、多个实体对应的实体属性、多个实体关系和多个实体关系对应的关系属性，采取预置的深度学习模型构建初始知识图谱。

(4)、服务器对初始知识图谱进行实体对齐和关系融合，生成预置的医疗知识图谱。

其中，实体对齐和关系融合的目的是发现并合并在不同数据源中具有不同实体名称却代表同一概念和事物的多源异构实体，将实体的属性和关系合并。实体对齐采用的是常采用的基于属性相似评分的实体对齐方法，为现有技术，具体此处不做赘述。

202、从终端获取初始问题语句，初始问题语句为目标用户在医疗智能问答系统中输入的问题语句。

203、调用第一预置识别模型对初始问题语句进行实体识别，得到多个粗粒度实体标签。

具体的，服务器调用第一预置识别模型对初始问题语句按照细粒度进行实体识别，得到多个细粒度实体标签；服务器调用第一预置识别模型对多个细粒度实体标签按照粗粒度进行实体识别，得到多个粗粒度实体标签。

可选的，服务器调用第一预置识别模型对初始问题语句按照细粒度进行实体识别，得到多个细粒度实体标签的过程具体包括：

服务器按照细粒度对初始问题提取多个特征维度向量，多个特征维度向量包括词向量、词标签向量、词位置向量和词性特征向量；服务器将多个特征维度向量输入到第一预置识别模型的BiLSTM层中，得到BiLSTM层输出的多个中间向量；服务器将多个中间向量输入到第一预置识别模型的CRF层中，生成多个细粒度实体标签。

其中，词标签向量为经过BIOES编码后的词标签，词位置特征向量为jieba分词工具切词后的字的位置向量，词性特征向量为jieba分词工具进行词性标注后的字的词性向量。

需要说明的是，中文词语没有明确的边界信息，并且相同的字组成不同顺序的词的语义有所差别，如“产妇肚子痛应立即到妇产科就医”中的“产妇”和“妇产科”，前者标签为“人群”，后者标签为“科室”，因此可以将词的位置信息作为一个有效特征。词性是词语的重要属性，可以表达更加抽象的词语特征，进一步发现语句的结构联系，并且实体标签如“疾病”、“症状”、“人群”等都是名词，词性与命名实体有着强关联联系，所以在模型中加入词性信息可以进一步提高实体识别的性能。实验对比发现加入词位置和词性特征后，预置识别模型的识别准确度提升5个百分点。

可选的，服务器调用第一预置识别模型对多个细粒度实体标签按照粗粒度进行实体识别，得到多个粗粒度实体标签过程具体包括：

服务器调用第一预置识别模型按照粗粒度对多个细粒度实体标签进行识别，得到多个狭义实体特征和多个限定实体特征，多个狭义实体特征包括症状、疾病、部位、医学、检查和治疗，多个限定实体特征包括时间、频率、程度、否定词、描述和数值；服务器将多个狭义实体特征和多个限定实体特征按照预置规则进行组合，生成多个广义实体特征，多个广义实体特征包括广义症状、广义检查、广义治疗和广义药物；服务器将多个广义实体特征确定为多个粗粒度实体标签。

例如，用户问题语句为“医生您好，我最近头从早痛到晚，请问是什么原因呢？”，按照细粒度实体识别得到“头”为身体部位，“痛”是描述性用语，“早”是时间，“晚”是时间，按照粗粒度实体识别规则将“头从早痛到晚”识别为广义症状。

204、调用第二预置识别模型对初始问题语句进行关系抽取，得到多个实体关系。

服务器调用第二预置识别模型对初始问题语句进行关系抽取，得到多个实体关系。其中，服务器可以调用第二预置识别模型的BILSTM层提取初始问题语句的上下文关系，得到多个时序向量，时序向量用于指示上下文关系；将多个时序向量输入到第二预置识别模型的注意力Attention层，生成多个句子特征向量，句子特征向量用于指示实体关系；其中，Attention层是先计算每个时序向量的权重，然后将所有时序向量的加权和作为特征向量，然后进行softmax分类。

205、根据多个粗粒度实体标签和多个实体关系生成实体识别结果。

服务器根据多个粗粒度实体标签和多个实体关系生成实体识别结果。

本实施例，服务器采用融合多维度特征的深度学习模型分开进行实体识别和关系抽取，减少错误传递和冗余信息的干扰，同时采用粗粒度实体识对细粒度实体识别结果进行优化，可进一步提高识别准确度。

206、根据预置的医疗实体同义词表对多个粗粒度实体标签进行实体链接，得到链接后的实体标签。

可以理解的是，对于不同数据源的相同实体，要进行实体归一和实体融合操作，维护医疗实体的同义词表，以构建一个去冗余去冲突的医疗知识图谱，保证问答系统有较高质量的数据支撑。

207、根据预置的意图识别模型、实体识别结果和链接后的实体标签对初始问题语句进行意图识别，得到候选医疗意图。

208、根据候选医疗意图生成知识图谱查询语句。

服务器根据候选医疗意图生成知识图谱查询语句。

209、基于知识图谱查询语句在预置的医疗知识图谱进行知识图谱查询，得到知识图谱查询结果，根据知识图谱查询结果生成对应的目标话术并发送至终端。

上面对本申请实施例中医疗领域意图识别方法进行了描述，下面对本申请实施例中医疗领域意图识别装置进行描述，请参阅图3，本申请实施例中医疗领域意图识别装置的一个实施例包括：

语句获取模块301，用于从终端获取初始问题语句，所述初始问题语句为目标用户在医疗智能问答系统中输入的问题语句；

实体识别模块302，用于调用预置的识别模型对所述初始问题语句进行实体识别，得到实体识别结果，所述实体识别结果包括多个粗粒度实体标签和多个实体关系；

实体链接模块303，用于根据预置的医疗实体同义词表对所述多个粗粒度实体标签进行实体链接，得到链接后的实体标签；

意图识别模块304，用于根据预置的意图识别模型、所述实体识别结果和所述链接后的实体标签对所述初始问题语句进行意图识别，得到候选医疗意图；

语句生成模块305，用于根据所述候选医疗意图生成知识图谱查询语句；

图谱查询模块306，用于基于所述知识图谱查询语句在预置的医疗知识图谱进行知识图谱查询，得到知识图谱查询结果，根据所述知识图谱查询结果生成对应的目标话术并发送至所述终端。

请参阅图4，本申请实施例中医疗领域意图识别装置的另一个实施例包括：

可选的，实体识别模块302包括：

实体识别单元3021，用于调用第一预置识别模型对所述初始问题语句进行实体识别，得到多个粗粒度实体标签；

关系抽取单元3022，用于调用第二预置识别模型对所述初始问题语句进行关系抽取，得到多个实体关系；

生成单元3023，用于根据所述多个粗粒度实体标签和所述多个实体关系生成实体识别结果。

可选的，实体识别单元3021包括：

第一识别子单元30211，用于调用第一预置识别模型对所述初始问题语句按照细粒度进行实体识别，得到多个细粒度实体标签；

第二识别子单元30212，用于调用第一预置识别模型对所述多个细粒度实体标签按照粗粒度进行实体识别，得到多个粗粒度实体标签。

可选的，第一识别子单元30211具体用于：

按照细粒度对所述初始问题提取多个特征维度向量，所述多个特征维度向量包括词向量、词标签向量、词位置向量和词性特征向量；将所述多个特征维度向量输入到第一预置识别模型的BiLSTM层中，得到BiLSTM层输出的多个中间向量；将所述多个中间向量输入到第一预置识别模型的CRF层中，生成多个细粒度实体标签。

可选的，第二识别子单元30212具体用于：

调用第一预置识别模型按照粗粒度对所述多个细粒度实体标签进行识别，得到多个狭义实体特征和多个限定实体特征，所述多个狭义实体特征包括症状、疾病、部位、医学、检查和治疗，所述多个限定实体特征包括时间、频率、程度、否定词、描述和数值；将所述多个狭义实体特征和所述多个限定实体特征按照预置规则进行组合，生成多个广义实体特征，所述多个广义实体特征包括广义症状、广义检查、广义治疗和广义药物；将多个广义实体特征确定为多个粗粒度实体标签。

可选的，实体链接模块303具体用于：

在预置的医疗实体同义词表中查找多个粗粒度实体标签对应的多个标准的医疗术语，每一个粗粒度实体标签对应一个标准的医疗术语，所述粗粒度实体标签与所述标准的医疗术语为同义词；对所述多个粗粒度实体标签进行融合，得到多个融合的粗粒度实体标签；对所述多个融合的粗粒度实体标签和所述多个标准的医疗术语进行实体链接操作，生成链接后的实体标签。

可选的，图谱查询模块306具体用于：

基于所述知识图谱查询语句在预置的医疗知识图谱进行查询，得到知识图谱查询结果，所述知识图谱查询结果包括目标实体的关系、目标实体的属性和多个实体；根据所述目标实体的关系和目标实体的属性生成对应的目标话术，并将所述目标话术发送至终端。

上面图3至图4从模块化功能实体的角度对本申请实施例中的医疗领域意图识别装置进行详细描述，下面从硬件处理的角度对本申请实施例中医疗领域意图识别设备进行详细描述。

图5是本申请实施例提供的一种医疗领域意图识别设备的结构示意图，该医疗领域意图识别设备500可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(central processing units，CPU)510(例如，一个或一个以上处理器)和存储器520，一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中，存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对医疗领域意图识别设备500中的一系列指令操作。更进一步地，处理器510可以设置为与存储介质530通信，在医疗领域意图识别设备500上执行存储介质530中的一系列指令操作。

医疗领域意图识别设备500还可以包括一个或一个以上电源540，一个或一个以上有线或无线网络接口550，一个或一个以上输入输出接口560，和/或，一个或一个以上操作系统531，例如Windows Serve，Mac OS X，Unix，Linux，FreeBSD等等。本领域技术人员可以理解，图5示出的医疗领域意图识别设备结构并不构成对医疗领域意图识别设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

本申请还提供一种医疗领域意图识别设备，包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互连；所述至少一个处理器调用所述存储器中的所述指令，以使得所述医疗领域意图识别设备执行上述医疗领域意图识别方法中的步骤。

本申请还提供一种计算机可读存储介质，该计算机可读存储介质可以为非易失性计算机可读存储介质，也可以为易失性计算机可读存储介质。计算机可读存储介质存储有计算机指令，当所述计算机指令在计算机上运行时，使得计算机执行如下步骤：

从终端获取初始问题语句，所述初始问题语句为目标用户在医疗智能问答系统中输入的问题语句；

调用预置的识别模型对所述初始问题语句进行实体识别，得到实体识别结果，所述实体识别结果包括多个粗粒度实体标签和多个实体关系；

根据预置的医疗实体同义词表对所述多个粗粒度实体标签进行实体链接，得到链接后的实体标签；

根据预置的意图识别模型、所述实体识别结果和所述链接后的实体标签对所述初始问题语句进行意图识别，得到候选医疗意图；

根据所述候选医疗意图生成知识图谱查询语句；

基于所述知识图谱查询语句在预置的医疗知识图谱进行知识图谱查询，得到知识图谱查询结果，根据所述知识图谱查询结果生成对应的目标话术并发送至所述终端。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

一种医疗领域意图识别方法，包括：

从终端获取初始问题语句，所述初始问题语句为目标用户在医疗智能问答系统中输入的问题语句；

调用预置的识别模型对所述初始问题语句进行实体识别，得到实体识别结果，所述实体识别结果包括多个粗粒度实体标签和多个实体关系；

根据预置的医疗实体同义词表对所述多个粗粒度实体标签进行实体链接，得到链接后的实体标签；

根据预置的意图识别模型、所述实体识别结果和所述链接后的实体标签对所述初始问题语句进行意图识别，得到候选医疗意图；

根据所述候选医疗意图生成知识图谱查询语句；

基于所述知识图谱查询语句在预置的医疗知识图谱进行知识图谱查询，得到知识图谱查询结果，根据所述知识图谱查询结果生成对应的目标话术并发送至所述终端。
根据权利要求1所述的医疗领域意图识别方法，其中，所述调用预置的识别模型对所述初始问题语句进行实体识别，得到实体识别结果，所述实体识别结果包括多个粗粒度实体标签和多个实体关系，包括：

调用第一预置识别模型对所述初始问题语句进行实体识别，得到多个粗粒度实体标签；

调用第二预置识别模型对所述初始问题语句进行关系抽取，得到多个实体关系；

根据所述多个粗粒度实体标签和所述多个实体关系生成实体识别结果。
根据权利要求2所述的医疗领域意图识别方法，其中，所述调用第一预置识别模型对所述初始问题语句进行实体识别，得到多个粗粒度实体标签，包括：

调用第一预置识别模型对所述初始问题语句按照细粒度进行实体识别，得到多个细粒度实体标签；

调用第一预置识别模型对所述多个细粒度实体标签按照粗粒度进行实体识别，得到多个粗粒度实体标签。
根据权利要求3所述的医疗领域意图识别方法，其中，所述调用第一预置识别模型对所述初始问题语句按照细粒度进行实体识别，得到多个细粒度实体标签，包括：

按照细粒度对所述初始问题提取多个特征维度向量，所述多个特征维度向量包括词向量、词标签向量、词位置向量和词性特征向量；

将所述多个特征维度向量输入到第一预置识别模型的BiLSTM层中，得到BiLSTM层输出的多个中间向量；

将所述多个中间向量输入到第一预置识别模型的CRF层中，生成多个细粒度实体标签。
根据权利要求3所述的医疗领域意图识别方法，其中，所述调用第一预置识别模型对所述多个细粒度实体标签按照粗粒度进行实体识别，得到多个粗粒度实体标签，包括：

调用第一预置识别模型按照粗粒度对所述多个细粒度实体标签进行识别，得到多个狭义实体特征和多个限定实体特征，所述多个狭义实体特征包括症状、疾病、部位、医学、检查和治疗，所述多个限定实体特征包括时间、频率、程度、否定词、描述和数值；

将所述多个狭义实体特征和所述多个限定实体特征按照预置规则进行组合，生成多个广义实体特征，所述多个广义实体特征包括广义症状、广义检查、广义治疗和广义药物；

将多个广义实体特征确定为多个粗粒度实体标签。
根据权利要求1所述的医疗领域意图识别方法，其中，所述根据预置的医疗实体同义词表对所述多个粗粒度实体标签进行实体链接，得到链接后的实体标签，包括：

在预置的医疗实体同义词表中查找多个粗粒度实体标签对应的多个标准的医疗术语，每一个粗粒度实体标签对应一个标准的医疗术语，所述粗粒度实体标签与所述标准的医疗术语为同义词；

对所述多个粗粒度实体标签进行融合，得到多个融合的粗粒度实体标签；

对所述多个融合的粗粒度实体标签和所述多个标准的医疗术语进行实体链接操作，生成链接后的实体标签。
根据权利要求1-6中任一项所述的医疗领域意图识别方法，其中，所述基于所述知识图谱查询语句在预置的医疗知识图谱进行知识图谱查询，得到知识图谱查询结果，根据所述知识图谱查询结果生成对应的目标话术并发送至所述终端，包括：

基于所述知识图谱查询语句在预置的医疗知识图谱进行查询，得到知识图谱查询结果，所述知识图谱查询结果包括目标实体的关系、目标实体的属性和多个实体；

根据所述目标实体的关系和目标实体的属性生成对应的目标话术，并将所述目标话术发送至终端。
一种医疗领域意图识别设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现如下步骤：

从终端获取初始问题语句，所述初始问题语句为目标用户在医疗智能问答系统中输入的问题语句；

调用预置的识别模型对所述初始问题语句进行实体识别，得到实体识别结果，所述实体识别结果包括多个粗粒度实体标签和多个实体关系；

根据预置的医疗实体同义词表对所述多个粗粒度实体标签进行实体链接，得到链接后的实体标签；

根据预置的意图识别模型、所述实体识别结果和所述链接后的实体标签对所述初始问题语句进行意图识别，得到候选医疗意图；

根据所述候选医疗意图生成知识图谱查询语句；

基于所述知识图谱查询语句在预置的医疗知识图谱进行知识图谱查询，得到知识图谱查询结果，根据所述知识图谱查询结果生成对应的目标话术并发送至所述终端。
根据权利要求8所述的医疗领域意图识别设备，所述处理器执行所述计算机程序时还实现以下步骤：

调用第一预置识别模型对所述初始问题语句进行实体识别，得到多个粗粒度实体标签；

调用第二预置识别模型对所述初始问题语句进行关系抽取，得到多个实体关系；

根据所述多个粗粒度实体标签和所述多个实体关系生成实体识别结果。
根据权利要求9所述的医疗领域意图识别设备，所述处理器执行所述计算机程序时还实现以下步骤：

调用第一预置识别模型对所述初始问题语句按照细粒度进行实体识别，得到多个细粒度实体标签；

调用第一预置识别模型对所述多个细粒度实体标签按照粗粒度进行实体识别，得到多个粗粒度实体标签。
根据权利要求10所述的医疗领域意图识别设备，所述处理器执行所述计算机程序时还实现以下步骤：

按照细粒度对所述初始问题提取多个特征维度向量，所述多个特征维度向量包括词向量、词标签向量、词位置向量和词性特征向量；

将所述多个特征维度向量输入到第一预置识别模型的BiLSTM层中，得到BiLSTM层输出的多个中间向量；

将所述多个中间向量输入到第一预置识别模型的CRF层中，生成多个细粒度实体标签。
根据权利要求10所述的医疗领域意图识别设备，所述处理器执行所述计算机程序时还实现以下步骤：

调用第一预置识别模型按照粗粒度对所述多个细粒度实体标签进行识别，得到多个狭义实体特征和多个限定实体特征，所述多个狭义实体特征包括症状、疾病、部位、医学、检查和治疗，所述多个限定实体特征包括时间、频率、程度、否定词、描述和数值；

将所述多个狭义实体特征和所述多个限定实体特征按照预置规则进行组合，生成多个广义实体特征，所述多个广义实体特征包括广义症状、广义检查、广义治疗和广义药物；

将多个广义实体特征确定为多个粗粒度实体标签。
根据权利要求8所述的医疗领域意图识别设备，所述处理器执行所述计算机程序时还实现以下步骤：

在预置的医疗实体同义词表中查找多个粗粒度实体标签对应的多个标准的医疗术语，每一个粗粒度实体标签对应一个标准的医疗术语，所述粗粒度实体标签与所述标准的医疗术语为同义词；

对所述多个粗粒度实体标签进行融合，得到多个融合的粗粒度实体标签；

对所述多个融合的粗粒度实体标签和所述多个标准的医疗术语进行实体链接操作，生成链接后的实体标签。
根据权利要求8-13中任一项所述的医疗领域意图识别设备，所述处理器执行所述计算机程序时还实现以下步骤：

基于所述知识图谱查询语句在预置的医疗知识图谱进行查询，得到知识图谱查询结果，所述知识图谱查询结果包括目标实体的关系、目标实体的属性和多个实体；

根据所述目标实体的关系和目标实体的属性生成对应的目标话术，并将所述目标话术发送至终端。
一种计算机可读存储介质，所述计算机可读存储介质中存储计算机指令，当所述计算机指令在计算机上运行时，使得计算机执行如下步骤：

从终端获取初始问题语句，所述初始问题语句为目标用户在医疗智能问答系统中输入的问题语句；

调用预置的识别模型对所述初始问题语句进行实体识别，得到实体识别结果，所述实体识别结果包括多个粗粒度实体标签和多个实体关系；

根据预置的医疗实体同义词表对所述多个粗粒度实体标签进行实体链接，得到链接后的实体标签；

根据预置的意图识别模型、所述实体识别结果和所述链接后的实体标签对所述初始问题语句进行意图识别，得到候选医疗意图；

根据所述候选医疗意图生成知识图谱查询语句；

基于所述知识图谱查询语句在预置的医疗知识图谱进行知识图谱查询，得到知识图谱查询结果，根据所述知识图谱查询结果生成对应的目标话术并发送至所述终端。
根据权利要求15所述的计算机可读存储介质，当所述计算机指令在计算机上运行时，使得计算机还执行以下步骤：

调用第一预置识别模型对所述初始问题语句进行实体识别，得到多个粗粒度实体标签；

调用第二预置识别模型对所述初始问题语句进行关系抽取，得到多个实体关系；

根据所述多个粗粒度实体标签和所述多个实体关系生成实体识别结果。
根据权利要求16所述的计算机可读存储介质，当所述计算机指令在计算机上运行时，使得计算机还执行以下步骤：

调用第一预置识别模型对所述初始问题语句按照细粒度进行实体识别，得到多个细粒度实体标签；

调用第一预置识别模型对所述多个细粒度实体标签按照粗粒度进行实体识别，得到多个粗粒度实体标签。
根据权利要求17所述的计算机可读存储介质，当所述计算机指令在计算机上运行时，使得计算机还执行以下步骤：

按照细粒度对所述初始问题提取多个特征维度向量，所述多个特征维度向量包括词向量、词标签向量、词位置向量和词性特征向量；

将所述多个特征维度向量输入到第一预置识别模型的BiLSTM层中，得到BiLSTM层输出的多个中间向量；

将所述多个中间向量输入到第一预置识别模型的CRF层中，生成多个细粒度实体标签。
根据权利要求17所述的计算机可读存储介质，当所述计算机指令在计算机上运行时，使得计算机还执行以下步骤：

调用第一预置识别模型按照粗粒度对所述多个细粒度实体标签进行识别，得到多个狭义实体特征和多个限定实体特征，所述多个狭义实体特征包括症状、疾病、部位、医学、检查和治疗，所述多个限定实体特征包括时间、频率、程度、否定词、描述和数值；

将所述多个狭义实体特征和所述多个限定实体特征按照预置规则进行组合，生成多个广义实体特征，所述多个广义实体特征包括广义症状、广义检查、广义治疗和广义药物；

将多个广义实体特征确定为多个粗粒度实体标签。
一种医疗领域意图识别装置，所述医疗领域意图识别装置包括：

语句获取模块，用于从终端获取初始问题语句，所述初始问题语句为目标用户在医疗智能问答系统中输入的问题语句；

实体识别模块，用于调用预置的识别模型对所述初始问题语句进行实体识别，得到实体识别结果，所述实体识别结果包括多个粗粒度实体标签和多个实体关系；

实体链接模块，用于根据预置的医疗实体同义词表对所述多个粗粒度实体标签进行实体链接，得到链接后的实体标签；

意图识别模块，用于根据预置的意图识别模型、所述实体识别结果和所述链接后的实体标签对所述初始问题语句进行意图识别，得到候选医疗意图；

语句生成模块，用于根据所述候选医疗意图生成知识图谱查询语句；

图谱查询模块，用于基于所述知识图谱查询语句在预置的医疗知识图谱进行知识图谱查询，得到知识图谱查询结果，根据所述知识图谱查询结果生成对应的目标话术并发送至所述终端。