CN112214588B - 多意图识别方法、装置、电子设备及存储介质 - Google Patents

多意图识别方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112214588B
CN112214588B CN202011106729.9A CN202011106729A CN112214588B CN 112214588 B CN112214588 B CN 112214588B CN 202011106729 A CN202011106729 A CN 202011106729A CN 112214588 B CN112214588 B CN 112214588B
Authority
CN
China
Prior art keywords
intents
query
target
thread
entity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011106729.9A
Other languages
English (en)
Other versions
CN112214588A (zh
Inventor
杨志专
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Saiante Technology Service Co Ltd
Original Assignee
Shenzhen Saiante Technology Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Saiante Technology Service Co Ltd filed Critical Shenzhen Saiante Technology Service Co Ltd
Priority to CN202011106729.9A priority Critical patent/CN112214588B/zh
Publication of CN112214588A publication Critical patent/CN112214588A/zh
Application granted granted Critical
Publication of CN112214588B publication Critical patent/CN112214588B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及智慧医疗,提供一种多意图识别方法、装置、电子设备及存储介质。该方法能够识别查询语句所属的目标类型,确定与目标类型对应的闲置线程作为目标线程,确定与目标类型对应的目标实体识别模型,基于目标实体识别模型,调用目标线程识别查询语句,得到查询实体,当查询实体有多个时,识别查询语句,得到多个意图,检测多个意图是否存在依赖性,当多个意图存在依赖性时,确定多个意图的优先级,根据优先级及多个意图确定响应语句。本发明不仅能够准确识别出多个意图,还能够提高多意图识别效率。此外,本发明还涉及区块链技术,所述响应语句可存储于区块链中。

Description

多意图识别方法、装置、电子设备及存储介质
技术领域
本发明涉及智慧医疗技术领域,尤其涉及一种多意图识别方法、装置、电子设备及存储介质。
背景技术
随着人工智能的发展,聊天机器人在医疗智能助手、医疗辅助诊所、医院管理辅助决策等领域上被广泛应用。目前,在人机交互过程中,存在多意图识别的问题,例如,用户一次性向聊天机器人发送多个问题,通常通过将多意图识别问题转化为多标签分类问题,当训练出的分类模型的语料数量不足或者语料质量较低时,将无法准确识别出问句中的多个意图,此外,这种方式的多意图识别效率低下。
发明内容
鉴于以上内容,有必要提供一种多意图识别方法、装置、电子设备及存储介质,不仅能够准确识别出多个意图,还能够提高多意图识别效率。
一方面,本发明提出一种多意图识别方法,所述多意图识别方法包括:
当接收到用户输入的查询语句时,识别所述查询语句所属的目标类型;
从预设线程池中确定与所述目标类型对应的闲置线程作为目标线程,并从预设模型库中确定与所述目标类型对应的目标实体识别模型;
基于所述目标实体识别模型,调用所述目标线程识别所述查询语句,得到所述查询语句的查询实体;
当所述查询实体有多个时,识别所述查询语句,得到所述查询语句的多个意图;
检测所述多个意图是否存在依赖性;
当所述多个意图存在依赖性时,确定所述多个意图的优先级,并根据所述优先级及所述多个意图确定所述查询语句的响应语句。
根据本发明优选实施例,所述识别所述查询语句所属的目标类型包括:
对所述查询语句进行分词处理,得到所述查询语句的多个分词;
将所述多个分词输入至预先训练好的分类模型中,得到所述目标类型。
根据本发明优选实施例,所述基于所述目标实体识别模型,调用所述目标线程识别所述查询语句,得到所述查询语句的查询实体包括:
调用所述目标线程对所述多个分词进行词向量嵌入处理,得到所述多个分词的分词向量;
将所述分词向量输入至预先配置的双向长短期记忆网络进行训练,得到所述双向长短期记忆网络的输出结果;
利用预先训练好的第一层叠条件随机场网络对所述输出结果进行处理,得到所述查询实体。
根据本发明优选实施例,所述识别所述查询语句,得到所述查询语句的多个意图包括:
对所述多个分词进行向量化处理,得到输入向量;
将所述输入向量输入至所述双向长短期记忆网络中,得到第一向量;
利用所述第一层叠条件随机场网络对所述第一向量进行处理,得到第二向量;
获取所述查询实体的实体向量,并将所述第二向量及所述实体向量输入至预先训练好的第二层叠条件随机场网络,得到所述多个意图。
根据本发明优选实施例,所述从预设线程池中确定与所述目标类型对应的闲置线程作为目标线程包括:
确定与所述目标类型对应的线程标识;
从所述预设线程池中获取带有所述线程标识的所有线程;
从所述所有线程中获取处于闲置状态的线程作为所述目标线程;或者
当所述所有线程都处于非闲置状态时,获取所述所有线程中每个线程的待处理请求,确定每个线程中的所述待处理请求的请求数量,并选取请求数量最小的线程作为所述目标线程。
根据本发明优选实施例,所述检测所述多个意图是否存在依赖性包括:
遍历所述多个意图,并从关联库中获取与遍历到的意图相关联的关联意图;
检测所述多个意图是否包含所述关联意图;
当检测到所述多个意图包含所述关联意图时,确定所述遍历到的意图与所述关联意图具有依赖性。
根据本发明优选实施例,所述确定所述多个意图的优先级,并根据所述优先级及所述多个意图确定所述查询语句的响应语句包括:
从所述关联库中获取所述多个意图的依赖关系,并根据所述依赖关系确定所述多个意图的优先级;
按照所述优先级从高至低依次获取所述多个意图的意图结果;
融合所述意图结果,得到所述响应语句。
另一方面,本发明还提出一种多意图识别装置,所述多意图识别装置包括:
识别单元,用于当接收到用户输入的查询语句时,识别所述查询语句所属的目标类型;
确定单元,用于从预设线程池中确定与所述目标类型对应的闲置线程作为目标线程,并从预设模型库中确定与所述目标类型对应的目标实体识别模型;
所述识别单元,还用于基于所述目标实体识别模型,调用所述目标线程识别所述查询语句,得到所述查询语句的查询实体;
所述识别单元,还用于当所述查询实体有多个时,识别所述查询语句,得到所述查询语句的多个意图;
检测单元,用于检测所述多个意图是否存在依赖性;
所述确定单元,还用于当所述多个意图存在依赖性时,确定所述多个意图的优先级,并根据所述优先级及所述多个意图确定所述查询语句的响应语句。
另一方面,本发明还提出一种电子设备,所述电子设备包括:
存储器,存储计算机可读指令;及
处理器,执行所述存储器中存储的计算机可读指令以实现所述多意图识别方法。
另一方面,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可读指令,所述计算机可读指令被电子设备中的处理器执行以实现所述多意图识别方法。
由以上技术方案可以看出,本发明通过调用与所述目标类型对应的且处于闲置状态的目标线程识别所述查询语句的实体,提高所述查询实体的识别效率,进而提高多意图的识别效率,同时,利用与所述目标类型对应的目标实体识别模型识别所述查询语句,能够准确地识别出所述查询语句中的查询实体,进一步地通过识别出的查询实体能够准确识别出所述查询语句中的多个意图,此外,对所述多个意图进行依赖性检测,能够准确生成与所述查询语句对应的响应语句。本发明还应用于智慧医疗场景中,从而推动智慧城市的建设。
附图说明
图1是本发明多意图识别方法的较佳实施例的流程图。
图1a是本发明确定目标线程的一实施例的流程图。
图1b是本发明确定查询实体的一实施例的流程图。
图1c是本发明确定多个意图的一实施例的流程图。
图1d是本发明确定响应语句的一实施例的流程图。
图2是本发明多意图识别装置的较佳实施例的功能模块图。
图3是本发明实现多意图识别方法的较佳实施例的电子设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
如图1所示,是本发明多意图识别方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
所述多意图识别方法应用于智慧医疗场景中,从而推动智慧城市的建设。所述多意图识别方法应用于一个或者多个电子设备中,所述电子设备是一种能够按照事先设定或存储的计算机可读指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述电子设备可以是任何一种可与用户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant,PDA)、游戏机、交互式网络电视(Internet Protocol Television,IPTV)、智能穿戴式设备等。
所述电子设备可以包括网络设备和/或用户设备。其中,所述网络设备包括,但不限于单个网络电子设备、多个网络电子设备组成的电子设备组或基于云计算(CloudComputing)的由大量主机或网络电子设备构成的云。
所述电子设备所处的网络包括,但不限于:互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network,VPN)等。
S10,当接收到用户输入的查询语句时,识别所述查询语句所属的目标类型。
在本发明的至少一个实施例中,所述查询语句可以由医护人员输入,也可以由患者输入,还可以由医护监管人员输入,本发明对所述查询语句的输入用户不作限制。例如,所述查询语句可以是“头晕了怎么治?阿莫西林能吃吗?”。
在本发明的至少一个实施例中,所述目标类型可以是任务类型中的一种或者多种类型,所述任务类型可以包括,但不限于:医疗任务、管理任务、天气任务、订票任务及通用任务等。
在本发明的至少一个实施例中,所述电子设备识别所述查询语句所属的目标类型包括:
对所述查询语句进行分词处理,得到所述查询语句的多个分词;
将所述多个分词输入至预先训练好的分类模型中,得到所述目标类型。
其中,所述预先训练好的分类模型是通过分类算法对训练数据进行训练得到的。例如,所述分类算法包括,但不限于:支持向量机分类算法(Support Vector Machine,SVM),卷积神经网络(Convolutional Neural Network,CNN),循环神经网络(RecurrentNeural Network,RNN),长短期记忆网络(LSTM,Long Short-Term Memory)等。
通过上述实施方式,提高所述查询语句所属的目标类型的识别准确率。
S11,从预设线程池中确定与所述目标类型对应的闲置线程作为目标线程,并从预设模型库中确定与所述目标类型对应的目标实体识别模型。
在本发明的至少一个实施例中,所述预设线程池中存储多个预先建立的线程,进一步地,所述目标线程是指与所述目标类型对应的且处于闲置状态的线程。
在本发明的至少一个实施例中,所述预设模型库中存储与所述任务类型对应的命名实体识别模型,所述目标实体识别模型用于识别与所述目标类型对应的查询语句。
参见图1a,图1a是本发明确定目标线程的一实施例的流程图。在本发明的至少一个实施例中,所述电子设备从预设线程池中确定与所述目标类型对应的闲置线程作为目标线程包括:
S110,确定与所述目标类型对应的线程标识。
其中,所述线程标识可以是yiliaorenwu,所述线程标识还可以是guanlirenwu。每个目标类型对应一个线程标识。
S111,从所述预设线程池中获取带有所述线程标识的所有线程。
其中,所述所有线程用于处理与所述目标类型对应的请求。
S112,从所述所有线程中获取处于闲置状态的线程作为所述目标线程。
其中,所述目标线程是指带有所述线程标识的处于闲置状态的线程。
S113,当所述所有线程都处于非闲置状态时,获取所述所有线程中每个线程的待处理请求,确定每个线程中的所述待处理请求的请求数量,并选取请求数量最小的线程作为所述目标线程。
通过上述实施方式,在所述所有线程都处于非闲置状态时,仍然能够获取到所述目标线程。
在本发明的至少一个实施例中,所述电子设备从预设模型库中确定与所述目标类型对应的目标实体识别模型包括:
确定与所述目标类型对应的模型标识;
从所述预设模型库中获取与所述模型标识对应的模型作为所述目标实体识别模型。
通过模型标识与模型的映射关系,能够准确确定出所述目标实体识别模型。
S12,基于所述目标实体识别模型,调用所述目标线程识别所述查询语句,得到所述查询语句的查询实体。
在本发明的至少一个实施例中,所述查询实体可以包括,但不限于:症状实体、药品实体等。
参见图1b,图1b是本发明确定查询实体的一实施例的流程图。在本发明的至少一个实施例中,所述电子设备基于所述目标实体识别模型,调用所述目标线程识别所述查询语句,得到所述查询语句的查询实体包括:
S120,调用所述目标线程对所述多个分词进行词向量嵌入处理,得到所述多个分词的分词向量。
通过所述目标线程对所述多个分词进行词向量嵌入处理,能够提高所述分词向量的确定效率。
S121,将所述分词向量输入至预先配置的双向长短期记忆网络进行训练,得到所述双向长短期记忆网络的输出结果。
其中,所述双向长短期记忆网络中的参数是根据应用场景预先设置的。
S122,利用预先训练好的第一层叠条件随机场网络对所述输出结果进行处理,得到所述查询实体。
通过调用与所述目标类型对应的且处于闲置状态的目标线程识别所述查询语句的实体,提高所述查询实体的识别效率,进而提高多意图的识别效率,同时,由于所述目标实体识别模型是针对实体如时间、地点、疾病名称等的标注,因此能够准确地识别出所述查询语句中的查询实体。
S13,当所述查询实体有多个时,识别所述查询语句,得到所述查询语句的多个意图。
在本发明的至少一个实施例中,所述多个意图包括疾病诊断意图、用药意图等。
参见图1c,图1c是本发明确定多个意图的一实施例的流程图。在本发明的至少一个实施例中,所述电子设备识别所述查询语句,得到所述查询语句的多个意图包括:
S130,对所述多个分词进行向量化处理,得到输入向量。
本实施例中,所述电子设备调用所述目标线程对所述多个分词进行向量化处理,能够提高向量化处理的效率。
S131,将所述输入向量输入至所述双向长短期记忆网络中,得到第一向量。
S132,利用所述第一层叠条件随机场网络对所述第一向量进行处理,得到第二向量。
S133,获取所述查询实体的实体向量,并将所述第二向量及所述实体向量输入至预先训练好的第二层叠条件随机场网络,得到所述多个意图。
其中,所述第二层叠条件随机场网络的参数设置与所述第一层叠条件随机场网络的参数设置不同。
由于上述实施方式是针对不同意图所对应的短文本的标注,因此能够准确确定出所述多个意图。
由于上述实施方法是采用了多个模型的联合训练与推理,可以同时完成多实体识别、多意图识别,将实体识别模型输出结果作为意图识别模型的特征向量之一,从而优化增强意图识别模型的预测结果。
在其他实施例中,当所述查询实体有且唯一时,确定所述查询语句具有单一意图。
S14,检测所述多个意图是否存在依赖性。
在本发明的至少一个实施例中,所述依赖性是指任意意图的数据结果依赖于另一个意图的数据结果。
在本发明的至少一个实施例中,所述电子设备检测所述多个意图是否存在依赖性包括:
遍历所述多个意图,并从关联库中获取与遍历到的意图相关联的关联意图;
检测所述多个意图是否包含所述关联意图;
当检测到所述多个意图包含所述关联意图时,确定所述遍历到的意图与所述关联意图具有依赖性。
其中,所述关联库中存储意图与被依赖意图的映射关系。
S15,当所述多个意图存在依赖性时,确定所述多个意图的优先级,并根据所述优先级及所述多个意图确定所述查询语句的响应语句。
需要强调的是,为进一步保证上述响应语句的私密和安全性,上述响应语句还可以存储于一区块链的节点。
参见图1d,图1d是本发明确定响应语句的一实施例的流程图。在本发明的至少一个实施例中,所述电子设备确定所述多个意图的优先级,并根据所述优先级及所述多个意图确定所述查询语句的响应语句包括:
S150,从所述关联库中获取所述多个意图的依赖关系,并根据所述依赖关系确定所述多个意图的优先级。
其中,当其中一个意图被依赖于另一个意图时,所述另一个意图的优先级高于所述其他一个意图。
S151,按照所述优先级从高至低依次获取所述多个意图的意图结果。
其中,所述意图结果是指与所述多个意图对应的多个结果。
S152,融合所述意图结果,得到所述响应语句。
本实施例中,所述电子设备根据所述优先级融合所述意图结果,得到所述响应结果。
通过上述实施方式,由于所述多个意图中存在意图依赖于另一意图,因此,根据所述多个意图的依赖关系确定所述多个意图的优先级,进而通过所述优先级能够准确生成与所述查询语句对应的响应语句。
在本发明的至少一个实施例中,在根据所述优先级及所述多个意图确定所述查询语句的响应语句后,所述方法还包括:
获取所述查询语句的语句编号,并根据所述语句编号及所述响应语句生成提示信息;
获取预先设定的展示形式,并以所述展示形式展示所述提示信息。
通过上述实施方式,能够根据用户需求以相应形式展示所述提示信息。
由以上技术方案可以看出,本发明通过调用与所述目标类型对应的且处于闲置状态的目标线程识别所述查询语句的实体,提高所述查询实体的识别效率,进而提高多意图的识别效率,同时,利用与所述目标类型对应的目标实体识别模型识别所述查询语句,能够准确地识别出所述查询语句中的查询实体,进一步地通过识别出的查询实体能够准确识别出所述查询语句中的多个意图,此外,对所述多个意图进行依赖性检测,能够准确生成与所述查询语句对应的响应语句。本发明还应用于智慧医疗场景中,从而推动智慧城市的建设。
如图2所示,是本发明多意图识别装置的较佳实施例的功能模块图。所述多意图识别装置11包括识别单元110、确定单元111、检测单元112、生成单元113及展示单元114。本发明所称的模块/单元是指一种能够被处理器13所获取,并且能够完成固定功能的一系列计算机可读指令段,其存储在存储器12中。在本实施例中,关于各模块/单元的功能将在后续的实施例中详述。
当接收到用户输入的查询语句时,识别单元110识别所述查询语句所属的目标类型。
在本发明的至少一个实施例中,所述查询语句可以由医护人员输入,也可以由患者输入,还可以由医护监管人员输入,本发明对所述查询语句的输入用户不作限制。例如,所述查询语句可以是“头晕了怎么治?阿莫西林能吃吗?”。
在本发明的至少一个实施例中,所述目标类型可以是任务类型中的一种或者多种类型,所述任务类型可以包括,但不限于:医疗任务、管理任务、天气任务、订票任务及通用任务等。
在本发明的至少一个实施例中,所述识别单元110识别所述查询语句所属的目标类型包括:
对所述查询语句进行分词处理,得到所述查询语句的多个分词;
将所述多个分词输入至预先训练好的分类模型中,得到所述目标类型。
其中,所述预先训练好的分类模型是通过分类算法对训练数据进行训练得到的。例如,所述分类算法包括,但不限于:支持向量机分类算法(Support Vector Machine,SVM),卷积神经网络(Convolutional Neural Network,CNN),循环神经网络(RecurrentNeural Network,RNN),长短期记忆网络(LSTM,Long Short-Term Memory)等。
通过上述实施方式,提高所述查询语句所属的目标类型的识别准确率。
确定单元111从预设线程池中确定与所述目标类型对应的闲置线程作为目标线程,并从预设模型库中确定与所述目标类型对应的目标实体识别模型。
在本发明的至少一个实施例中,所述预设线程池中存储多个预先建立的线程,进一步地,所述目标线程是指与所述目标类型对应的且处于闲置状态的线程。
在本发明的至少一个实施例中,所述预设模型库中存储与所述任务类型对应的命名实体识别模型,所述目标实体识别模型用于识别与所述目标类型对应的查询语句。
在本发明的至少一个实施例中,所述确定单元111从预设线程池中确定与所述目标类型对应的闲置线程作为目标线程包括:
确定与所述目标类型对应的线程标识。
其中,所述线程标识可以是yiliaorenwu,所述线程标识还可以是guanlirenwu。每个目标类型对应一个线程标识。
从所述预设线程池中获取带有所述线程标识的所有线程。
其中,所述所有线程用于处理与所述目标类型对应的请求。
从所述所有线程中获取处于闲置状态的线程作为所述目标线程。
其中,所述目标线程是指带有所述线程标识的处于闲置状态的线程。
当所述所有线程都处于非闲置状态时,获取所述所有线程中每个线程的待处理请求,确定每个线程中的所述待处理请求的请求数量,并选取请求数量最小的线程作为所述目标线程。
通过上述实施方式,在所述所有线程都处于非闲置状态时,仍然能够获取到所述目标线程。
在本发明的至少一个实施例中,所述确定单元111从预设模型库中确定与所述目标类型对应的目标实体识别模型包括:
确定与所述目标类型对应的模型标识;
从所述预设模型库中获取与所述模型标识对应的模型作为所述目标实体识别模型。
通过模型标识与模型的映射关系,能够准确确定出所述目标实体识别模型。
所述识别单元110基于所述目标实体识别模型,调用所述目标线程识别所述查询语句,得到所述查询语句的查询实体。
在本发明的至少一个实施例中,所述查询实体可以包括,但不限于:症状实体、药品实体等。
在本发明的至少一个实施例中,所述识别单元110基于所述目标实体识别模型,调用所述目标线程识别所述查询语句,得到所述查询语句的查询实体包括:
调用所述目标线程对所述多个分词进行词向量嵌入处理,得到所述多个分词的分词向量。
通过所述目标线程对所述多个分词进行词向量嵌入处理,能够提高所述分词向量的确定效率。
将所述分词向量输入至预先配置的双向长短期记忆网络进行训练,得到所述双向长短期记忆网络的输出结果。
其中,所述双向长短期记忆网络中的参数是根据应用场景预先设置的。
利用预先训练好的第一层叠条件随机场网络对所述输出结果进行处理,得到所述查询实体。
通过调用与所述目标类型对应的且处于闲置状态的目标线程识别所述查询语句的实体,提高所述查询实体的识别效率,进而提高多意图的识别效率,同时,由于所述目标实体识别模型是针对实体如时间、地点、疾病名称等的标注,因此能够准确地识别出所述查询语句中的查询实体。
当所述查询实体有多个时,所述识别单元110识别所述查询语句,得到所述查询语句的多个意图。
在本发明的至少一个实施例中,所述多个意图包括疾病诊断意图、用药意图等。
在本发明的至少一个实施例中,所述识别单元110识别所述查询语句,得到所述查询语句的多个意图包括:
对所述多个分词进行向量化处理,得到输入向量。
本实施例中,所述电子设备调用所述目标线程对所述多个分词进行向量化处理,能够提高向量化处理的效率。
将所述输入向量输入至所述双向长短期记忆网络中,得到第一向量。
利用所述第一层叠条件随机场网络对所述第一向量进行处理,得到第二向量。
获取所述查询实体的实体向量,并将所述第二向量及所述实体向量输入至预先训练好的第二层叠条件随机场网络,得到所述多个意图。
其中,所述第二层叠条件随机场网络的参数设置与所述第一层叠条件随机场网络的参数设置不同。
由于上述实施方式是针对不同意图所对应的短文本的标注,因此能够准确确定出所述多个意图。
由于上述实施方法是采用了多个模型的联合训练与推理,可以同时完成多实体识别、多意图识别,将实体识别模型输出结果作为意图识别模型的特征向量之一,从而优化增强意图识别模型的预测结果。
在其他实施例中,当所述查询实体有且唯一时,确定所述查询语句具有单一意图。
检测单元112检测所述多个意图是否存在依赖性。
在本发明的至少一个实施例中,所述依赖性是指任意意图的数据结果依赖于另一个意图的数据结果。
在本发明的至少一个实施例中,所述检测单元112检测所述多个意图是否存在依赖性包括:
遍历所述多个意图,并从关联库中获取与遍历到的意图相关联的关联意图;
检测所述多个意图是否包含所述关联意图;
当检测到所述多个意图包含所述关联意图时,确定所述遍历到的意图与所述关联意图具有依赖性。
其中,所述关联库中存储意图与被依赖意图的映射关系。
当所述多个意图存在依赖性时,所述确定单元111确定所述多个意图的优先级,并根据所述优先级及所述多个意图确定所述查询语句的响应语句。
需要强调的是,为进一步保证上述响应语句的私密和安全性,上述响应语句还可以存储于一区块链的节点。
在本发明的至少一个实施例中,所述确定单元111确定所述多个意图的优先级,并根据所述优先级及所述多个意图确定所述查询语句的响应语句包括:
从所述关联库中获取所述多个意图的依赖关系,并根据所述依赖关系确定所述多个意图的优先级。
其中,当其中一个意图被依赖于另一个意图时,所述另一个意图的优先级高于所述其他一个意图。
按照所述优先级从高至低依次获取所述多个意图的意图结果。
其中,所述意图结果是指与所述多个意图对应的多个结果。
融合所述意图结果,得到所述响应语句。
本实施例中,所述确定单元111根据所述优先级融合所述意图结果,得到所述响应结果。
通过上述实施方式,由于所述多个意图中存在意图依赖于另一意图,因此,根据所述多个意图的依赖关系确定所述多个意图的优先级,进而通过所述优先级能够准确生成与所述查询语句对应的响应语句。
在本发明的至少一个实施例中,在根据所述优先级及所述多个意图确定所述查询语句的响应语句后,所述方法还包括:
生成单元113获取所述查询语句的语句编号,并根据所述语句编号及所述响应语句生成提示信息;
展示单元114获取预先设定的展示形式,并以所述展示形式展示所述提示信息。
通过上述实施方式,能够根据用户需求以相应形式展示所述提示信息。
由以上技术方案可以看出,本发明通过调用与所述目标类型对应的且处于闲置状态的目标线程识别所述查询语句的实体,提高所述查询实体的识别效率,进而提高多意图的识别效率,同时,利用与所述目标类型对应的目标实体识别模型识别所述查询语句,能够准确地识别出所述查询语句中的查询实体,进一步地通过识别出的查询实体能够准确识别出所述查询语句中的多个意图,此外,对所述多个意图进行依赖性检测,能够准确生成与所述查询语句对应的响应语句。本发明还应用于智慧医疗场景中,从而推动智慧城市的建设。
如图3所示,是本发明实现多意图识别方法的较佳实施例的电子设备的结构示意图。
在本发明的一个实施例中,所述电子设备1包括,但不限于,存储器12、处理器13,以及存储在所述存储器12中并可在所述处理器13上运行的计算机可读指令,例如多意图识别程序。
本领域技术人员可以理解,所述示意图仅仅是电子设备1的示例,并不构成对电子设备1的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述电子设备1还可以包括输入输出设备、网络接入设备、总线等。
所述处理器13可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器13是所述电子设备1的运算核心和控制中心,利用各种接口和线路连接整个电子设备1的各个部分,及执行所述电子设备1的操作系统以及安装的各类应用程序、程序代码等。
示例性的,所述计算机可读指令可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器12中,并由所述处理器13执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该计算机可读指令段用于描述所述计算机可读指令在所述电子设备1中的执行过程。例如,所述计算机可读指令可以被分割成识别单元110、确定单元111、检测单元112、生成单元113及展示单元114。
所述存储器12可用于存储所述计算机可读指令和/或模块,所述处理器13通过运行或执行存储在所述存储器12内的计算机可读指令和/或模块,以及调用存储在存储器12内的数据,实现所述电子设备1的各种功能。所述存储器12可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。存储器12可以包括非易失性和易失性存储器,例如:硬盘、内存、插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他存储器件。
所述存储器12可以是电子设备1的外部存储器和/或内部存储器。进一步地,所述存储器12可以是具有实物形式的存储器,如内存条、TF卡(Trans-flash Card)等等。
所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机可读指令来指令相关的硬件来完成,所述的计算机可读指令可存储于一计算机可读存储介质中,该计算机可读指令在被处理器执行时,可实现上述各个方法实施例的步骤。
其中,所述计算机可读指令包括计算机可读指令代码,所述计算机可读指令代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机可读指令代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
结合图1,所述电子设备1中的所述存储器12存储计算机可读指令实现一种多意图识别方法,所述处理器13可执行所述计算机可读指令从而实现:
当接收到用户输入的查询语句时,识别所述查询语句所属的目标类型;
从预设线程池中确定与所述目标类型对应的闲置线程作为目标线程,并从预设模型库中确定与所述目标类型对应的目标实体识别模型;
基于所述目标实体识别模型,调用所述目标线程识别所述查询语句,得到所述查询语句的查询实体;
当所述查询实体有多个时,识别所述查询语句,得到所述查询语句的多个意图;
检测所述多个意图是否存在依赖性;
当所述多个意图存在依赖性时,确定所述多个意图的优先级,并根据所述优先级及所述多个意图确定所述查询语句的响应语句。
具体地,所述处理器13对上述计算机可读指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述计算机可读存储介质上存储有计算机可读指令,其中,所述计算机可读指令被处理器13执行时用以实现以下步骤:
当接收到用户输入的查询语句时,识别所述查询语句所属的目标类型;
从预设线程池中确定与所述目标类型对应的闲置线程作为目标线程,并从预设模型库中确定与所述目标类型对应的目标实体识别模型;
基于所述目标实体识别模型,调用所述目标线程识别所述查询语句,得到所述查询语句的查询实体;
当所述查询实体有多个时,识别所述查询语句,得到所述查询语句的多个意图;
检测所述多个意图是否存在依赖性;
当所述多个意图存在依赖性时,确定所述多个意图的优先级,并根据所述优先级及所述多个意图确定所述查询语句的响应语句。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (8)

1.一种多意图识别方法,其特征在于,所述多意图识别方法包括:
当接收到用户输入的查询语句时,识别所述查询语句所属的目标类型;
从预设线程池中确定与所述目标类型对应的闲置线程作为目标线程,并从预设模型库中确定与所述目标类型对应的目标实体识别模型;
基于所述目标实体识别模型,调用所述目标线程识别所述查询语句,得到所述查询语句的查询实体,包括:调用所述目标线程对所述查询语句的多个分词进行词向量嵌入处理,得到所述多个分词的分词向量;将所述分词向量输入至预先配置的双向长短期记忆网络进行训练,得到所述双向长短期记忆网络的输出结果;利用预先训练好的第一层叠条件随机场网络对所述输出结果进行处理,得到所述查询实体;
当所述查询实体有多个时,识别所述查询语句,得到所述查询语句的多个意图,包括:对所述多个分词进行向量化处理,得到输入向量;将所述输入向量输入至所述双向长短期记忆网络中,得到第一向量;利用所述第一层叠条件随机场网络对所述第一向量进行处理,得到第二向量;获取所述查询实体的实体向量,并将所述第二向量及所述实体向量输入至预先训练好的第二层叠条件随机场网络,得到所述多个意图;
检测所述多个意图是否存在依赖性;
当所述多个意图存在依赖性时,确定所述多个意图的优先级,并根据所述优先级及所述多个意图确定所述查询语句的响应语句。
2.如权利要求1所述的多意图识别方法,其特征在于,所述识别所述查询语句所属的目标类型包括:
对所述查询语句进行分词处理,得到所述查询语句的多个分词;
将所述多个分词输入至预先训练好的分类模型中,得到所述目标类型。
3.如权利要求1所述的多意图识别方法,其特征在于,所述从预设线程池中确定与所述目标类型对应的闲置线程作为目标线程包括:
确定与所述目标类型对应的线程标识;
从所述预设线程池中获取带有所述线程标识的所有线程;
从所述所有线程中获取处于闲置状态的线程作为所述目标线程;或者
当所述所有线程都处于非闲置状态时,获取所述所有线程中每个线程的待处理请求,确定每个线程中的所述待处理请求的请求数量,并选取请求数量最小的线程作为所述目标线程。
4.如权利要求1所述的多意图识别方法,其特征在于,所述检测所述多个意图是否存在依赖性包括:
遍历所述多个意图,并从关联库中获取与遍历到的意图相关联的关联意图;
检测所述多个意图是否包含所述关联意图;
当检测到所述多个意图包含所述关联意图时,确定所述遍历到的意图与所述关联意图具有依赖性。
5.如权利要求4所述的多意图识别方法,其特征在于,所述确定所述多个意图的优先级,并根据所述优先级及所述多个意图确定所述查询语句的响应语句包括:
从所述关联库中获取所述多个意图的依赖关系,并根据所述依赖关系确定所述多个意图的优先级;
按照所述优先级从高至低依次获取所述多个意图的意图结果;
融合所述意图结果,得到所述响应语句。
6.一种多意图识别装置,其特征在于,所述多意图识别装置包括:
识别单元,用于当接收到用户输入的查询语句时,识别所述查询语句所属的目标类型;
确定单元,用于从预设线程池中确定与所述目标类型对应的闲置线程作为目标线程,并从预设模型库中确定与所述目标类型对应的目标实体识别模型;
所述识别单元,还用于基于所述目标实体识别模型,调用所述目标线程识别所述查询语句,得到所述查询语句的查询实体,包括:调用所述目标线程对所述查询语句的多个分词进行词向量嵌入处理,得到所述多个分词的分词向量;将所述分词向量输入至预先配置的双向长短期记忆网络进行训练,得到所述双向长短期记忆网络的输出结果;利用预先训练好的第一层叠条件随机场网络对所述输出结果进行处理,得到所述查询实体;
所述识别单元,还用于当所述查询实体有多个时,识别所述查询语句,得到所述查询语句的多个意图,包括:对所述多个分词进行向量化处理,得到输入向量;将所述输入向量输入至所述双向长短期记忆网络中,得到第一向量;利用所述第一层叠条件随机场网络对所述第一向量进行处理,得到第二向量;获取所述查询实体的实体向量,并将所述第二向量及所述实体向量输入至预先训练好的第二层叠条件随机场网络,得到所述多个意图;
检测单元,用于检测所述多个意图是否存在依赖性;
所述确定单元,还用于当所述多个意图存在依赖性时,确定所述多个意图的优先级,并根据所述优先级及所述多个意图确定所述查询语句的响应语句。
7.一种电子设备,其特征在于,所述电子设备包括:
存储器,存储有计算机可读指令;及
处理器,执行所述存储器中存储的计算机可读指令以实现如权利要求1至5中任意一项所述的多意图识别方法。
8.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有计算机可读指令,所述计算机可读指令被电子设备中的处理器执行以实现如权利要求1至5中任意一项所述的多意图识别方法。
CN202011106729.9A 2020-10-16 2020-10-16 多意图识别方法、装置、电子设备及存储介质 Active CN112214588B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011106729.9A CN112214588B (zh) 2020-10-16 2020-10-16 多意图识别方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011106729.9A CN112214588B (zh) 2020-10-16 2020-10-16 多意图识别方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN112214588A CN112214588A (zh) 2021-01-12
CN112214588B true CN112214588B (zh) 2024-04-02

Family

ID=74055376

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011106729.9A Active CN112214588B (zh) 2020-10-16 2020-10-16 多意图识别方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112214588B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113158692B (zh) * 2021-04-22 2023-09-12 中国平安财产保险股份有限公司 基于语义识别的多意图处理方法、系统、设备及存储介质
CN113157890B (zh) * 2021-04-25 2024-06-11 深圳壹账通智能科技有限公司 智能问答方法、装置、电子设备及可读存储介质
CN113590747B (zh) * 2021-07-05 2022-12-06 北京元年科技股份有限公司 用于意图识别的方法以及相应的系统、计算机设备和介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103473400A (zh) * 2013-08-27 2013-12-25 北京航空航天大学 基于层次依赖建模的软件fmea方法
CN109829044A (zh) * 2018-12-28 2019-05-31 北京百度网讯科技有限公司 对话方法、装置及设备
CN110555165A (zh) * 2019-07-23 2019-12-10 平安科技(深圳)有限公司 信息识别方法、装置、计算机设备和存储介质
CN110659366A (zh) * 2019-09-24 2020-01-07 Oppo广东移动通信有限公司 语义解析方法、装置、电子设备以及存储介质
CN110825949A (zh) * 2019-09-19 2020-02-21 平安科技(深圳)有限公司 基于卷积神经网络的信息检索方法、及其相关设备
CN111125331A (zh) * 2019-12-20 2020-05-08 京东方科技集团股份有限公司 语义识别方法、装置、电子设备及计算机可读存储介质
CN111640436A (zh) * 2020-05-15 2020-09-08 北京青牛技术股份有限公司 向坐席提供通话对象的动态客户画像的方法
CN111738016A (zh) * 2020-06-28 2020-10-02 中国平安财产保险股份有限公司 多意图识别方法及相关设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10642913B2 (en) * 2016-12-21 2020-05-05 Accenture Global Solutions Limited Intent and bot based query guidance

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103473400A (zh) * 2013-08-27 2013-12-25 北京航空航天大学 基于层次依赖建模的软件fmea方法
CN109829044A (zh) * 2018-12-28 2019-05-31 北京百度网讯科技有限公司 对话方法、装置及设备
CN110555165A (zh) * 2019-07-23 2019-12-10 平安科技(深圳)有限公司 信息识别方法、装置、计算机设备和存储介质
CN110825949A (zh) * 2019-09-19 2020-02-21 平安科技(深圳)有限公司 基于卷积神经网络的信息检索方法、及其相关设备
CN110659366A (zh) * 2019-09-24 2020-01-07 Oppo广东移动通信有限公司 语义解析方法、装置、电子设备以及存储介质
CN111125331A (zh) * 2019-12-20 2020-05-08 京东方科技集团股份有限公司 语义识别方法、装置、电子设备及计算机可读存储介质
CN111640436A (zh) * 2020-05-15 2020-09-08 北京青牛技术股份有限公司 向坐席提供通话对象的动态客户画像的方法
CN111738016A (zh) * 2020-06-28 2020-10-02 中国平安财产保险股份有限公司 多意图识别方法及相关设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A performance study of general-purpose applications on graphics processors using CUDA;Shuai Che et al.;《Journal of Parallel and Distributed Computing》;1370-1380 *
汽车智能客户服务系统的设计与实现;许力;《中国优秀硕士学位论文全文数据库 工程科技II辑》;C035-295 *

Also Published As

Publication number Publication date
CN112214588A (zh) 2021-01-12

Similar Documents

Publication Publication Date Title
CN111816301B (zh) 医疗问诊辅助方法、装置、电子设备及介质
CN112214588B (zh) 多意图识别方法、装置、电子设备及存储介质
CN111985241B (zh) 医学信息查询方法、装置、电子设备及介质
CN113707303A (zh) 基于知识图谱的医疗问题解答方法、装置、设备及介质
CN112559535B (zh) 基于多线程的异步任务处理方法、装置、设备及介质
CN111666415A (zh) 话题聚类方法、装置、电子设备及存储介质
CN113724830B (zh) 基于人工智能的用药风险检测方法及相关设备
CN111949708A (zh) 基于时序特征提取的多任务预测方法、装置、设备及介质
CN114360711A (zh) 通过句法-语义对准和话语分析进行的基于多案例的推理
CN112860848A (zh) 信息检索方法、装置、设备及介质
CN111986793A (zh) 基于人工智能的导诊处理方法、装置、计算机设备及介质
CN113870974A (zh) 基于人工智能的风险预测方法、装置、电子设备及介质
CN116130072A (zh) 科室推荐方法、装置、设备及存储介质
WO2023040145A1 (zh) 基于人工智能的文本分类方法、装置、电子设备及介质
CN112199494B (zh) 医疗信息搜索方法、装置、电子设备及存储介质
CN113705468B (zh) 基于人工智能的数字图像识别方法及相关设备
CN115222443A (zh) 客户群体划分方法、装置、设备及存储介质
CN113470775B (zh) 信息采集方法、装置、设备及存储介质
CN114418398A (zh) 场景任务开发方法、装置、设备及存储介质
CN111933241B (zh) 医疗数据解析方法、装置、电子设备及存储介质
CN111950707B (zh) 基于行为共现网络的行为预测方法、装置、设备及介质
CN113724899A (zh) 一种基于人工智能的线上问诊方法、装置、设备及介质
US20230186212A1 (en) System, method, electronic device, and storage medium for identifying risk event based on social information
CN116468043A (zh) 嵌套实体识别方法、装置、设备及存储介质
CN113627186B (zh) 基于人工智能的实体关系检测方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
TA01 Transfer of patent application right

Effective date of registration: 20210128

Address after: 518000 Room 201, building A, No. 1, Qian Wan Road, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong (Shenzhen Qianhai business secretary Co., Ltd.)

Applicant after: Shenzhen saiante Technology Service Co.,Ltd.

Address before: 1-34 / F, Qianhai free trade building, 3048 Xinghai Avenue, Mawan, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong 518000

Applicant before: Ping An International Smart City Technology Co.,Ltd.

TA01 Transfer of patent application right
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant