CN110517672A - 用户意图识别方法、用户指令执行方法、系统及设备 - Google Patents

用户意图识别方法、用户指令执行方法、系统及设备 Download PDF

Info

Publication number
CN110517672A
CN110517672A CN201810416493.5A CN201810416493A CN110517672A CN 110517672 A CN110517672 A CN 110517672A CN 201810416493 A CN201810416493 A CN 201810416493A CN 110517672 A CN110517672 A CN 110517672A
Authority
CN
China
Prior art keywords
intention
user
single sentence
information
intent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810416493.5A
Other languages
English (en)
Other versions
CN110517672B (zh
Inventor
黄光远
牛也
徐巍越
丁盘苹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201810416493.5A priority Critical patent/CN110517672B/zh
Publication of CN110517672A publication Critical patent/CN110517672A/zh
Application granted granted Critical
Publication of CN110517672B publication Critical patent/CN110517672B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Machine Translation (AREA)

Abstract

本申请实施例提供一种用户意图识别方法、用户指令执行方法、系统及设备。其中,用户意图识别方法包括:对用户输入单句进行意图识别,得到用户意图;所述用户意图属于非通用类时,获取与所述单句相关的关联信息;根据所述关联信息,将所述用户意图转换为可操作意图。本申请实施例提供的技术方案,无需依赖大规模的对话语料,识别方法简单且具有较高的准确性,易于进行工业应用。

Description

用户意图识别方法、用户指令执行方法、系统及设备
技术领域
本申请涉及计算机技术领域,尤其涉及一种用户意图识别方法、用户指令执行方法、系统及设备。
背景技术
意图识别是人工智能和自然语言处理领域中的一个备受关注的研究方向,主要用于识别用户的行为意图。例如,在问答对话中,提问者每句话都带有一定的意图,应答方则根据对方的意图进行回答。面向问答的意图识别计算可应用在搜索引擎、智能语音助手、聊天机器人、自动客服和专家系统等场景下。特别是在聊天机器人中,意图识别是整个系统的重要组成部分,通过分析用户意图来了解用户想询问的具体内容,再给出相应的答案或做成相应的操作。
目前的意图识别方法需依赖大规模的对话语料进行训练得到一个训练模型;再将实际收集的多轮会话语料作为训练模型的输入得到最终的用户意图;方法复杂,识别准确率不高,且难以进行工业应用。
发明内容
鉴于上述问题,提出了本申请以便提供一种解决上述问题或至少部分地解决上述问题的用户意图识别方法、用户指令执行方法、系统及设备。
于是,在本申请的一个实施例中,提供了一种用户意图识别方法。该方法,包括:
对用户输入单句进行意图识别,得到用户意图;
所述用户意图属于非通用类时,获取与所述单句相关的关联信息;
根据所述关联信息,将所述用户意图转换为可操作意图。
在本申请的另一个实施例中,提供了一种用户意图识别方法。该方法,包括:
对用户输入单句进行意图识别,得到用户意图;
确定所述用户意图是否属于通用类;
所述用户意图属于通用类时,根据所述用户意图执行相应的操作。
在本申请的又一个实施例中,提供了一种用户意图识别方法。该方法,包括:
对用户输入单句进行意图识别,得到用户意图;
所述用户意图属于非通用类时,获取所述单句的上文信息;
根据所述上文信息,将所述用户意图转换为可操作的第一意图;
所述第一意图的执行条件成立时,将所述第一意图作为所述用户的真实意图。
在本申请的又一个实施例中,提供了一种用户意图识别方法。该方法,包括:
接收客户端发送的用户输入单句;
对所述单句进行意图识别,得到用户意图;
所述用户意图属于非通用类时,根据与所述单句相关的关联信息,将所述用户意图转换为可操作意图;
将所述可操作意图反馈至所述客户端,以由所述客户端按照所述可操作意图执行相应的操作。
在本申请的又一个实施例中,提供了一种用户意图识别方法。该方法,包括:
向服务端发送用户输入的单句;
接收服务端反馈的所述用户的可操作意图;
按照所述可操作意图,执行相应的操作;
其中,所述可操作意图是对所述单句进行意图识别得到用户意图;所述用户意图属于非通用类时,根据与所述单句相关的关联信息对所述用户意图进行意图转换后得到。
在本申请的一个实施例中,提供了一种用户意图识别系统。该系统,包括:
服务端,用于接收客户端发送的用户输入单句;对所述单句进行意图识别,得到用户意图;所述用户意图属于非通用类时,根据与所述单句相关的关联信息,将所述用户意图转换为可操作意图;将所述可操作意图反馈至所述客户端,以由所述客户端按照所述可操作意图执行相应的操作;
客户端,用于向服务端发送用户输入的单句;接收服务端反馈的所述用户的可操作意图;按照所述可操作意图,执行相应的操作。
在本申请的一实施例中,提供了一种电子设备。该电子设备包括:第一存储器以及第一处理器;
所述第一存储器,用于存储程序;
所述第一处理器,与所述第一存储器耦合,用于执行所述第一存储器中存储的所述程序,以用于:
对用户输入单句进行意图识别,得到用户意图;
所述用户意图属于非通用类时,获取与所述单句相关的关联信息;
根据所述关联信息,将所述用户意图转换为可操作意图。
在本申请的另一实施例中,提供了一种电子设备。该电子设备包括:第二存储器以及第二处理器;
所述第二存储器,用于存储程序;
所述第二处理器,与所述第二存储器耦合,用于执行所述第二存储器中存储的所述程序,以用于:
对用户输入单句进行意图识别,得到用户意图;
确定所述用户意图是否属于通用类;
所述用户意图属于通用类时,根据所述用户意图执行相应的操作。
在本申请的又一实施例中,提供了一种电子设备。该电子设备包括:
第三存储器以及第三处理器;
所述第三存储器,用于存储程序;
所述第三处理器,与所述第三存储器耦合,用于执行所述第三存储器中存储的所述程序,以用于:
对用户输入单句进行意图识别,得到用户意图;
所述用户意图属于非通用类时,获取所述单句的上文信息;
根据所述上文信息,将所述用户意图转换为可操作的第一意图;
所述第一意图的执行条件成立时,将所述第一意图作为所述用户的真实意图。
在本申请的又一实施例中,提供了一种电子设备。该电子设备包括:第四存储器、第四处理器及第四通信组件;
所述第四存储器,用于存储程序;
所述第四处理器,与所述第四存储器耦合,用于执行所述第四存储器中存储的所述程序,以用于:
对用户输入单句进行意图识别,得到用户意图;
所述用户意图属于非通用类时,根据与所述单句相关的关联信息,将所述用户意图转换为可操作意图;
所述第四通信组件,与所述第四处理耦合,用于:
接收客户端发送的用户输入的所述单句;
将所述可操作意图反馈至所述客户端,以由所述客户端按照所述可操作意图执行相应的操作。
在本申请的又一实施例中,提供了一种电子设备。该电子设备包括:第五存储器、第五处理器及第五通信组件;
所述第五存储器,用于存储程序;
所述第五通信组件,与所述第五处理器耦合,用于:
向服务端发送用户输入的单句;
接收服务端反馈的所述用户的可操作意图;
所述第五处理器,与所述第五存储器耦合,用于执行所述第五存储器中存储的所述程序,以用于:
按照所述可操作意图,执行相应的操作;
其中,所述可操作意图是对所述单句进行意图识别得到用户意图;所述用户意图属于非通用类时,根据与所述单句相关的关联信息对所述用户意图进行意图转换后得到。
本申请实施例提供的技术方案,基于已经较为成熟的单句意图识别算法,仅对用户输入的单句进行意图识别;在识别出的用户意图属于非通用类时,再对用户意图进行意图转换;在识别出的用户意图属于通用类时,即可根据用户意图执行相应的操作;无需依赖大规模的对话语料,识别方法简单且具有较高的准确性,易于进行工业应用。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一实施例提供的用户意图识别方法的流程示意图;
图2为本申请另一实施例提供的用户意图识别方法的流程示意图;
图3为本申请又一实施例提供的用户意图识别方法的流程示意图;
图4为本申请一实施例提供的用户指令执行系统的结构示意图;
图5为本申请一实施例提供的用户指令执行方法的流程示意图;
图6为本申请另一实施例提供的用户指令执行方法的流程示意图;
图7为本申请又一实施例提供的用户意图识别方法的流程示意图;
图8为本申请一实施例提供的用户意图识别装置的结构示意图;
图9为本申请另一实施例提供的用户意图识别装置的结构示意图;
图10为本申请又一实施例提供的用户意图识别装置的结构示意图;
图11为本申请一实施例提供的用户指令执行装置的结构示意图;
图12为本申请另一实施例提供的用户指令执行装置的结构示意图;
图13为本申请一实施例提供的电子设备的结构示意图;
图14为本申请另一实施例提供的电子设备的结构示意图;
图15为本申请又一实施例提供的电子设备的结构示意图;
图16为本申请一实施例提供的服务端设备的结构示意图;
图17为本申请一实施例提供的客户端设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
在本申请的说明书、权利要求书及上述附图中描述的一些流程中,包含了按照特定顺序出现的多个操作,这些操作可以不按照其在本文中出现的顺序来操作或并行操作。操作的序号如101、102等,仅仅是用于区分各个不同的操作,序号本身不代表任何的操作顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序操作或并行操作。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
意图识别就是理解用户的意图,用户想做什么,比如用户输入“今天天气怎么样”的意图是查询天气,用户输入“我要听歌”的意图是音乐播放等等。
现有技术更多的是有关多轮交互意图识别的研究,一般是使用RNN(Recurrentneural Network,循环神经网络),CNN(Convolutional Neural Network,卷积神经网络)等深度神经网络方法,将上下文信息和当前用户输入语句一起作为网络的输入特征,来进行用户的意图识别。
例如,一般的方法是将实际收集的多轮交互会话语料(如“我想点汉堡”,“为你找到双层牛肉汉堡,请问是否下单呢”,“可以啊”这一个完整的交互过程,共包含三轮)作为已训练完成模型的输入,执行已训练完成模型得到最终的意图。随着交互会话语料轮数的增多,该方法的意图识别准确率就会下降。另外,现有技术需依赖庞大的上下文对话语料,且处理过程复杂繁琐,难以进行工业应用。
为解决或部分解决现有技术中存在的问题,本申请提出了一种结合单句意图识别和意图转换的方案,具有较高的准确性,高效且便于进行工业应用。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1示出了本申请一实施例提供的用户意图识别方法的流程示意图。本实施例提供的所述方法适用于服务端或客户端。所述服务端可以是常用服务器、云端、虚拟服务器等,本申请实施例对此不作具体限定。所述客户端可以是集成在终端上的一个具有嵌入式程序的硬件,也可以是安装在终端中的一个应用软件,还可以是嵌入在终端操作系统中的工具软件等,本申请实施例对此不作限定。该终端可以为手机、平板电脑、智能穿戴设备、车载智能设备等任意终端设备。具体的,如图1所示,所述用户意图识别方法包括:
101、对用户输入单句进行意图识别,得到用户意图。
102、所述用户意图属于非通用类时,获取与所述单句相关的关联信息。
103、根据所述关联信息,将所述用户意图转换为可操作意图。
上述101中,用户输入的单句可以是用户编辑的文本信息,也可以是用户发出的语音信息,还可以是用户做出的手势信息等等,本申请实施例对此不作具体限定。
这里需要说明的是:在一些特殊的场景下,用户做出的手势信息也可作为用户输入的单句。例如,机器询问“是否下单”;用户做出“OK”手势时,机器可通过采集用户的图像信息,并通过图像识别获取到用户所要表达的单句为“可以”或“OK”等等。
具体实施时,可使用深度神经网络的CNN、RNN等方法,或者基于相似度计算的WMD(计算句子语义相似性的一种方法,值越小,则这两个句子的意义越相近)方法等等来对单句进行意图识别。其中,深度神经网络及WMD方法均属于已成熟的现有技术,具体实现原理可参见现有技术,此处不再赘述。
举例来说,对单句“今天天气怎么样”进行意图识别后得到的用户意图为天气weather;对单句“我想听歌”进行意图识别后得到的用户意图为music;对单句“加入购物车”进行意图识别后得到用户意图为加入购物车add_cart;对单句“帮我结账吧”进行意图识别后得到的用户意图为下单order;对单句“可以呀”进行意图识别后得到的用户意图为确认confirm;对单句“不要了”进行意图识别后得到的用户意图为拒绝reject等等。
在实际应用中,用户输入的单句比较口语化,机器不容易识别。因此,在对用户输入的单句进行意图识别之前,可先对用户输入的单句进行预处理,如,分词处理等。此处的分词处理等预处理过程可采用现有技术实现,本文不再赘述。通过预处理,可以将文本信息分割为多个字符串,为后续的意图识别作基础分割。
在一种可实现的技术方案中,本申请实施例提出了一种意图分类方案,即将用户意图分为两类,一类是通用类;另一类是非通用类。其中,通用类是表达了用户通用的需求,但并不能直接根据用户意图进行相应操作的类型,比如“确认confirm”、“拒绝reject”等等。非通用类是具有明确的操作指示,能根据用户意图直接进行相应操作的类型,比如,“天气weather”、“加入购物车add_cart”、“music”等等。
具体实施时,可预先定义通用类意图列表,或者非通用类意图列表,或者通用类意图列表和非通用类意图列表同时定义。例如,预先仅定义了非通用类列表,在判断用户意图是否属于通用类时,查找所述非通用类意图列表中是否包含有与所述用户意图相同或相似的意图项,若无,则所述用户意图属于通用类;若有,则所述用户意图属于非通用类。同理,当预先仅定义了通用类意图列表时,查找所述通用类意图列表中是否包含有与所述用户意图相同或相似的意图项,若有,则所述用户意图属于通用类;若无,则所述用户意图属于非通用类。当通用类意图列表和非通用类意图列表都定义时,在通用类意图列表中查找到与所述用户意图相同或相似的意图类时,所述用户意图属于通用类;在非通用类意图列表中查找与所述用户意图相同或相似的意图类时,所述用户意图属于非通用类。
上述102中,与单句相关的关联信息包括但不限于如下至少一种:所述单句的上文信息、用户信息和设备信息。假设,机器询问“是否下单呢”,用户回答“可以啊”;“是否下单呢”即为单句“可以啊”的上文信息。用户信息可具体包括但不限于:用户的历史操作记录、用户喜好信息、用户画像等等。设备信息包括但不限于:设备型号信息、设备定位信息、设备网络连接状态信息等等。
上述103中,根据所述关联信息,将所述用户意图转换为可操作意图可具体采用如下几种方案实现:
方案1、采用意图转换模型实现
即上述103可具体为:将所述关联信息及所述用户意图作为意图转换模型的输入,执行所述意图转换模型得到所述可操作意图。
在一种可实现的技术方案中,意图转换模型可具体为专家系统。专家系统至少包括知识库和推理机。将关联信息及用户意图作为专家系统的输入;推理机根据输入的关联信息及用户意图反复匹配知识库中的规则,以得到可操作意图。这里需要说明的是,专家系统属于现有技术,具体实现可参见现有技术中的相关内容,此处不再赘述。
例如,用户意图为确认Confirm:
假设单句的上文信息为ask_add_cart(“是否要加入购物车呢?”);将“ask_add_cart”及“Confirm”作为专家系统的输入,推理机通过匹配知识库中的规则,得到可操作意图“加入购物车意图”add_cart。
假设单句的上文信息为ask_order(“是否要下单呢?”);将“ask_order”、用户信息及“Confirm”作为专家系统的输入;若用户信息中缺少配送地址,则推理机通过匹配知识库中的规则,得到可操作意图“填写地址”address;若用户信息齐全,则推理机通过匹配知识库中的规则,得到可操作意图“下单意图”order。
其他情况,推理机匹配不到知识库中的规则时得到“意图不明确”,unidentification。
在另一种可实现的技术方案中,所述意图转换模型可具体为意图分类模型。意图分类模型可通过深度学习训练后得到。例如,收集单句作为训练语料,对深度学习模型进行训练得到。具体实施时,可将关联信息与用户意图作为意图分类模型的输入,执行意图分类模型得到转换后的可操作意图。
这里需要说明的是,有关意图分类模型的内容可参见现有技术,本文对此不作赘述。
方案2采用查询预置关联对与可操作意图的对应关系的方式实现
其中,关联对由关联信息与用户意图构成。即上述103可具体为:将所述关联信息与所述用户意图作为关联对,根据预置的关联对与可操作意图的对应关系,获取所述关联对对应的可操作意图。下表1示出了一种关联对与可操作意图的对应关系示例。
表1、关联对与可操作意图的对应关系
方案3、
方案3可简单理解为:根据关联信息中包含的所述单句的上文信息,将所述用户意图转换为可操作的第一意图。确定所述第一意图的执行条件是否成立,并基于确定结果确定是否需再确定第二意图,以由第二意图作为用户意图转换后的可操作意图。
举个例子,假设询问“是否下单”时用户回答“可以”(Confirm),正常转换后的第一意图为下单order,若此时设备发现用户还没设置配送的地址,则说明下单order的执行条件不成立,需确定第二意图填写地址address。若用户信息齐全,则说明下单order的执行条件成立,无需确定第二意图,直接将第一意图作为用户意图转换后的可操作意图。
本方案3相当于将关联信息中除单句的上文信息以外的辅助信息(如用户信息、设备信息)分离出,在意图转换过程中仅基于上文信息。辅助信息作为后续确定第一意图的执行条件是否成立以及确定第二意图的基础。
在一种可实现的技术方案中,采用方案3上述步骤103可包括如下步骤:
1031、根据所述关联信息中包含的所述单句的上文信息,将所述用户意图转换为可操作的第一意图。
其中,步骤1031可采用类似于上述方案1和方案2的方案实现。即本步骤1031可具体为:
将所述上文信息及所述用户意图作为意图转换模型的输入,执行所述意图转换模型得到所述第一意图;或者
所述上文信息与所述用户意图作为关联对,根据预置的关联对与第一意图的对应关系,获取所述关联对对应的所述第一意图。
这里需要说明的是:本步骤1031中所采用的意图转换模型与上述方案1中的意图转换模型是有差别的。本方案步骤1301中所指的意图转换模型较上述方案1中的意图转换模型简单;因上述方案1中意图转换模型中作为输入的参数除包含有上文信息、用户意图外,还包含如用户信息和/或设备信息等辅助信息;而本步骤1031中的意图转换模型的输入参数较为简单,仅包含上文信息及用户意图。方案1中的意图转换模型的输入参数多,其不论采用专家系统还是意图分类模型,实现上均要复杂一些。
另外,本步骤1031中预置的关联对与第一意图的对应关系,也较上述方案2中简单,关联对仅由上文信息与用户意图构成。
1032、所述第一意图的执行条件成立时,将所述第一意图作为所述可操作意图。
其中,第一意图的执行条件是否成立可基于关联信息中包含的辅助信息来确定。所述辅助信息包括但不限于以下至少一种:所述用户的用户信息、设备信息等等。同样的,用户信息可具体包括但不限于:用户的历史操作记录、用户喜好信息、用户画像等等。设备信息包括但不限于:设备型号信息、设备定位信息、设备网络连接状态信息等等。
例如,第一意图为下单order,若此时用户信息中缺少配送地址,则第一意图的执行条件不成立;若用户信息齐全,则第一意图的执行条件成立。
又例如,第一意图为网络订餐,若通过设备信息发现无法获取到设备位置信息,则第一意图的执行条件不成立;否则,第一意图的执行条件成立。
进一步的,采用方案3上述步骤103还包括:
1033、所述第一意图的执行条件不成立时,根据所述关联信息中包含的与所述单句相关的辅助信息,确定第二意图。
其中,该步骤1033可具体包括:根据所述辅助信息,确定有关使所述第一意图的执行条件成立需完成操作的参照信息;根据所述参照信息,确定所述第二意图。
继续上述例子,第一意图下单order的执行条件不成立时,根据用户信息确定出需完成地址填写的操作;根据所述参照信息,确定第二意图为填写配送地址address。
又例如,第一意图网络订餐的执行条件不成立时,根据设备信息确定出需完成允许地址访问设置的操作;根据所述参照信息,确定第二意图为设置允许地址访问。
1034、将所述第二意图作为所述可操作意图。
本申请实施例提供的技术方案,基于已经较为成熟的单句意图识别算法,仅对用户输入的单句进行意图识别;在识别出的用户意图属于非通用类时,再对用户意图进行意图转换;无需依赖大规模的对话语料,识别方法简单且具有较高的准确性,易于进行工业应用。
进一步的,上述实施例提供的所述方法还可包括如下步骤:
104、根据所述可操作意图,执行相应的操作。
确定了可操作意图后,操作与可操作意图相对应的动作,所述动作可以是播放音乐、播放视频、显示图片、加入购物车等等。
图2示出了本申请另一实施例提供的用户意图识别方法的流程示意图。本实施例提供的所述方法适于服务端和客户端。其中,所述服务端可以是常用服务器、云端、虚拟服务器等,本申请实施例对此不作具体限定。所述客户端可以是集成在终端上的一个具有嵌入式程序的硬件,也可以是安装在终端中的一个应用软件,还可以是嵌入在终端操作系统中的工具软件等,本申请实施例对此不作限定。该终端可以为包括手机、平板电脑、智能穿戴设备、智能车载设备等任意终端设备。具体的,如图2所示,所述用户意图识别方法包括:
201、对用户输入单句进行意图识别,得到用户意图。
202、确定所述用户意图是否属于通用类。
203、所述用户意图属于通用类时,根据所述用户意图执行相应的操作。
上述201可参见上述实施例中的相关内容,此处不再赘述,
上述202在具体实施时,可预先定义通用类意图列表,或者非通用类意图列表,或者通用类意图列表和非通用类意图列表同时定义。例如,预先仅定义了非通用类列表,在确定用户意图是否属于通用类时,查找所述非通用类意图列表中是否包含有与所述用户意图相同或相似的意图项,若无,则所述用户意图属于通用类;若有,则所述用户意图属于非通用类。同理,当预先仅定义了通用类意图列表时,查找所述通用类意图列表中是否包含有与所述用户意图相同或相似的意图项,若有,则所述用户意图属于通用类;若无,则所述用户意图属于非通用类。当通用类意图列表和非通用类意图列表都定义时,在通用类意图列表中查找到与所述用户意图相同或相似的意图类时,所述用户意图属于通用类;在非通用类意图列表中查找与所述用户意图相同或相似的意图类时,所述用户意图属于非通用类。
以预置有通用意图列表为例,上述确定用户意图是否属于可操作意图的方法可具体包括:
2021、获取预置的通用意图列表。
2022、查找所述通用意图列表中不包含与所述用户意图相同或相似的意图项时,所述用户意图属于非通用类。
进一步的,本实施例提供的所述方法还可包括如下步骤:
204、所述用户意图属于非通用类时,获取与所述单句相关的关联信息。
205、根据所述关联信息,将所述用户意图转换为可操作意图。
这里需要说明的是:有关上述204和205的内容,可参见上述实施例中的相应内容,此处不再赘述。
本申请实施例提供的技术方案,基于已经较为成熟的单句意图识别算法,仅对用户输入的单句进行意图识别;在识别出的用户意图属于非通用类时,再对用户意图进行意图转换;在识别出的用户意图属于通用类时,即可根据用户意图执行相应的操作;无需依赖大规模的对话语料,识别方法简单且具有较高的准确性,易于进行工业应用。
图3示出了本申请又一实施例提供的用户意图识别方法的流程示意图。本申请实施例提供的所述方法适用于服务端和客户端。其中,所述服务端可以是常用服务器、云端、虚拟服务器等,本申请实施例对此不作具体限定。所述客户端可以是集成在终端上的一个具有嵌入式程序的硬件,也可以是安装在终端中的一个应用软件,还可以是嵌入在终端操作系统中的工具软件等,本申请实施例对此不作限定。该终端可以为包括手机、平板电脑、智能穿戴设备、智能车载设备等任意终端设备。具体的,如图3所示,所述用户意图识别方法包括:
301、对用户输入单句进行意图识别,得到用户意图。
302、所述用户意图属于非通用类时,获取所述单句的上文信息。
303、根据所述上文信息,将所述用户意图转换为可操作的第一意图。
304、所述第一意图的执行条件成立时,将所述第一意图作为所述用户的真实意图。
有关上述301和302的内容,可参见上述实施例中的相应内容,此处不再赘述。
上述303中,“根据上文信息将用户意图转换为可操作的第一意图”可具体为:将所述上文信息及所述用户意图作为意图转换模型的输入,执行所述意图转换模型得到所述第一意图。其中,所述意图转换模型可以是专家系统或意图分类模型,等等,本申请实施例对此不作具体限定。
或者,上述303中“根据上文信息将用户意图转换为可操作的第一意图”可具体为:所述上文信息及所述用户意图作为关联对,根据预置的关联对与可操作意图的对应关系,获取所述关联对对应的所述第一意图。
同样的,有关上述303的更详细信息可参见上述实施例中方案3部分的内容,此处不再赘述。
本申请实施例提供的技术方案,基于已经较为成熟的单句意图识别算法,仅对用户输入的单句进行意图识别;在识别出的用户意图属于非通用类时,再对用户意图进行意图转换;无需依赖大规模的对话语料,识别方法简单且具有较高的准确性,易于进行工业应用。
进一步的,本实施例提供的所述方法还包括:
305、所述第一意图的执行条件不成立时,根据与所述单句相关的辅助信息,确定第二意图。
其中,“根据与所述单句相关的辅助信息,确定第二意图”可包括:
3051、根据所述辅助信息,确定有关使所述第一意图的执行条件成立需完成操作的参照信息;
3052、根据所述参照信息,确定所述第二意图。
具体实施时,所述辅助信息包括但不限于以下至少一种:所述用户的用户信息和/或设备信息。
306、将所述第二意图作为所述用户的真实意图。
进一步的,本实施例提供的所述方法,还包括:
307、根据所述用户的真实意图,执行相应的操作。
这里需要说明的是,有关上述305~307的内容,可参见上述各实施例中的相关内容,此处不再赘述。
本申请还提供了一种用户指令执行方法,在介绍该方法之前,先对本申请提供所述用户指令执行方法所基于的系统架构进行说明。
图4示出了本申请一实施例提供的用户指令执行系统的结构示意图。如图4所示,本实施例提供的所述系统包括:服务端401和客户端402。其中,
服务端401,用于接收客户端发送的用户输入单句;对所述单句进行意图识别,得到用户意图;所述用户意图属于非通用类时,根据与所述单句相关的关联信息,将所述用户意图转换为可操作意图;将所述可操作意图反馈至所述客户端,以由所述客户端按照所述可操作意图执行相应的操作;
客户端402,用于向服务端发送用户输入的单句;接收服务端反馈的所述用户的可操作意图;按照所述可操作意图,执行相应的操作。
进一步的,所述服务端401还用于所述用户意图属于通用类时,将所述用户意图反馈至所述客户端402,以由客户端402按照所述用户意图执行相应的操作。
本申请实施例提供的技术方案,基于已经较为成熟的单句意图识别算法,仅对用户输入的单句进行意图识别;在识别出的用户意图属于非通用类时,再对用户意图进行意图转换;在识别出的用户意图属于通用类时,即可根据用户意图执行相应的操作;无需依赖大规模的对话语料,识别方法简单且具有较高的准确性,易于进行工业应用。
本申请实施例提供的所述用户指令执行系统中各组成单元,如服务端、客户端的具体工作流程及之间的信令交互将在以下各实施例中作进一步的说明。
图5示出了本申请一实施例提供的用户指令执行方法的流程示意图。本申请实施例提供的所述方法适用于服务端。其中,所述服务端可以是常用服务器、云端、虚拟服务器等,本申请实施例对此不作具体限定。如图5所示,本实施例提供的所述方法,包括:
501、接收客户端发送的用户输入单句指令。
502、对所述单句指令进行意图识别,得到用户意图。
503、所述用户意图属于非通用类时,根据与所述单句相关的关联信息,将所述用户意图转换为可操作意图。
504、将所述可操作意图反馈至所述客户端,以由所述客户端按照所述可操作意图执行相应的操作。
上述501中,用户输入的单句指令可以是文本信息指令,也可以是语音指令,还可以是手势指令等等,本申请实施例对此不作具体限定。对于语音指令和手势指令,在进行意图识别之前需对语音指令和手势指令进行预处理,如语音识别或手势识别等。
上述503中“根据所述关联信息,将所述用户意图转换为可操作意图”,可具体为:将所述关联信息及所述用户意图作为意图转换模型的输入,执行所述意图转换模型得到所述可操作意图。
或者,“根据所述关联信息,将所述用户意图转换为可操作意图”,可具体为:所述关联信息及所述用户意图作为关联对,根据预置的关联对与可操作意图的对应关系,获取所述关联对对应的所述可操作意图。
或者,“根据所述关联信息,将所述用户意图转换为可操作意图”可具体包括:
5021、根据所述关联信息中包含的单句的上文信息,将所述用户意图转换为可操作的第一意图。
5022、所述第一意图的执行条件成立时,将所述第一意图作为所述可操作意图。
5023、所述第一意图的执行条件不成立时,根据所述关联信息中包含的与所述单句相关的辅助信息,确定第二意图。
5024、将所述第二意图作为所述可操作意图。
其中,所述辅助信息包括但不限于以下至少一种:所述用户的用户信息、设备信息。
这里需要说明的是:有关上述502和503的更具体内容可参见上述各实施例,此处不再赘述。
本申请实施例提供的技术方案,基于已经较为成熟的单句意图识别算法,仅对用户输入的单句进行意图识别;在识别出的用户意图属于非通用类时,再对用户意图进行意图转换;在识别出的用户意图属于通用类时,即可根据用户意图执行相应的操作;无需依赖大规模的对话语料,识别方法简单且具有较高的准确性,易于进行工业应用。
图6示出了本申请另一实施例提供的用户指令执行方法的流程示意图。本实施例提供的所述方法适用于客户端。其中,所述客户端可以是集成在终端上的一个具有嵌入式程序的硬件,也可以是安装在终端中的一个应用软件,还可以是嵌入在终端操作系统中的工具软件等,本申请实施例对此不作限定。该终端可以为包括手机、平板电脑、智能穿戴设备、智能车载设备等任意终端设备。如图6所示,所述用户指令执行方法,包括:
601、向服务端发送用户输入的单句指令。
602、接收服务端反馈的所述单句指令对应的可操作意图。
603、按照所述可操作意图,执行相应的操作。
其中,所述可操作意图是对所述单句进行意图识别得到用户意图;所述用户意图属于非通用类时,根据与所述单句相关的关联信息对所述用户意图进行意图转换后得到。
这里需要说明的是:有关上述用户意图转换可操作意图的内容可参见上述各实施例中的相关内容,此处不再赘述。
上述603中,客户端的设备类型不同,对应的操作动作可能会不同。例如,客户端的设备类型为智能音箱时,执行的操作可能是播放音乐,上传下单信息并播放“已下单”提示音等等。客户端的设备类型为带有显示屏的机器人时,执行的操作可能是播放音乐,上传下单信息并显示“已下单”确认页面,播放视频等等。
下面以语音交互场景为例,对本申请实施例提供的用户意图识别方法作进一步的说明。图7示出了本申请又一实施例提供的用户意图识别方法的流程示意图。本实施例提供的方法的执行主体可以智能音箱、机器人或者智能车载设备等等任意设备,本申请实施例对此不作具体限定。如图7所示的,所述方法包括:
701、采集用户发出的应答语音。
702、对所述应答语音进行语音识别,得到单句。
703、对所述单句进行意图识别,得到用户意图。
704、确定所述用户意图是否属于通用类,若否,根据所述用户意图执行相应的操作;若是,进入步骤705。
705、获取与所述单句相关的关联信息。
706、根据所述关联信息,将所述用户意图转换为所述可操作意图。
707、根据所述可操作意图执行相应的操作。
有关上述701~707的内容可参见上述各实施例中的相关内容,此处不作赘述。
本申请各实施例示出了一种在工业界可实际操作的用户意图识别方案,主要基于已经较为成熟的单句意图识别算法,并在此基础上对单句意图进行了类的划分,在单句意图为通用类时通过意图转换的方式将其转换为可操作意图,以识别出用户的真实意图的目的。本申请各实施例提供的技术方案不依赖于大规模的对话语料,且无需将多轮交互作为意图识别的入参,方法简单,具有较高准确性并易于工业应用。
为了更好地理解本申请实施例提供的上述方案,下面通过几个具体实例对本申请的实现过程进行说明。
例一
机器询问“是否加入购物车”;用户回答“可以”。
对用户回答的单句“可以”进行意图识别,得到用户意图为确认意图confirm。
确认意图属于通用类,根据上文信息“是否加入购物车”,将确认意图confirm转换为可操作意图“加入购物车”add_cart。
例二
机器询问“是否下单”;用户回答“行”。
对用户回答的单句“行”进行意图识别,得到用户意图为确认意图confirm。
确认意图属于通用类,根据上文信息“是否下单”,将确认意图confirm转换为下单意图order。
若基于用户信息发现用户信息中缺少配送的地址,则下单order的执行条件不成立;此时,根据用户信息确定出使下单order的执行条件成立需补充配送地址操作的参照信息;
根据该参照信息,确定填写地址address;
将确认意图confirm转换为填写地址address。
例三
用户发出语音“我想听**的歌”。
对用户输入的单句“我想听**的歌”进行意图识别,得到用户意图为播放音乐“music”。
播放音乐“music”属于非通用类,相应的,根据播放音乐“music”,查询网络或本地存储的**的歌并播放。
例四
用户发出语音“帮我叫外卖”。
对用户输入的单句“帮我叫外卖”进行意图识别,得到用户意图为点餐意图。
点餐意图为非通用类;相应的,根据点餐意图查询附近热销外卖并告知用户热销外卖信息,等待用户回复。
图8示出了本申请一实施例提供的用户意图识别装置的结构示意图。如图8所示,所述装置包括:
识别模块801,用于对用户输入单句进行意图识别,得到用户意图;
获取模块802,用于所述用户意图属于非通用类时,获取与所述单句相关的关联信息;
转换模块803,用于根据所述关联信息,将所述用户意图转换为可操作意图。
进一步的,所述转换模块803,还用于:
将所述关联信息及所述用户意图作为意图转换模型的输入,执行所述意图转换模型得到所述可操作意图;或者
所述关联信息及所述用户意图作为关联对,根据预置的关联对与可操作意图的对应关系,获取所述关联对对应的所述可操作意图。
具体的,所述所述意图转换模型包括:专家系统或意图分类模型。
进一步的,所述转换模块803,还用于:
根据所述关联信息中包含的所述单句的上文信息,将所述用户意图转换为可操作的第一意图;
所述第一意图的执行条件成立时,将所述第一意图作为所述可操作意图。
再进一步的,所述转换模块803,还用于:所述第一意图的执行条件不成立时,根据所述关联信息中包含的与所述单句相关的辅助信息,确定第二意图;将所述第二意图作为所述可操作意图。
再进一步的,所述转换模块803,还用于:根据所述辅助信息,确定有关使所述第一意图的执行条件成立需完成操作的参照信息;根据所述参照信息,确定所述第二意图。其中,所述辅助信息包括以下至少一种:所述用户的用户信息、设备信息。
进一步的,本申请实施例提供的所述装置还可包括:
执行模块,用于根据所述可操作意图,执行相应的操作。
这里需要说明的是:上述实施例提供的用户意图识别装置可实现上述各方法实施例中描述的技术方案,上述各模块或单元具体实现的原理可参见上述各方法实施例中的相应内容,此处不再赘述。
本申请实施例提供的技术方案,基于已经较为成熟的单句意图识别算法,仅对用户输入的单句进行意图识别;在识别出的用户意图属于非通用类时,再对用户意图进行意图转换;在识别出的用户意图属于通用类时,即可根据用户意图执行相应的操作;无需依赖大规模的对话语料,识别方法简单且具有较高的准确性,易于进行工业应用。
图9示出了本申请另一实施例提供的用户意图识别装置的结构示意图。如图9所示,所述装置包括:
识别模块901,用于对用户输入单句进行意图识别,得到用户意图;
确定模块902,用于确定所述用户意图是否属于通用类;
执行模块903,用于所述用户意图属于通用类时,根据所述用户意图执行相应的操作。
进一步的,所述确定模块902,还用于:获取预置的通用意图列表;查找所述通用意图列表中不包含与所述用户意图相同或相似的意图项时,所述用户意图属于非通用类。
进一步的,本实施例提供的所述装置还包括:
获取模块,用于所述用户意图属于非通用类时,获取与所述单句相关的关联信息;
转换模块,用于根据所述关联信息,将所述用户意图转换为可操作意图。
进一步的,所述关联信息包括以下至少一种:所述单句的上文信息、所述用户的用户信息、设备信息。
这里需要说明的是:上述实施例提供的用户意图识别装置可实现上述各方法实施例中描述的技术方案,上述各模块或单元具体实现的原理可参见上述各方法实施例中的相应内容,此处不再赘述。
本申请实施例提供的技术方案,基于已经较为成熟的单句意图识别算法,仅对用户输入的单句进行意图识别;在识别出的用户意图属于非通用类时,再对用户意图进行意图转换;在识别出的用户意图属于通用类时,即可根据用户意图执行相应的操作;无需依赖大规模的对话语料,识别方法简单且具有较高的准确性,易于进行工业应用。
图10示出了本申请又一实施例提供的用户意图识别装置的结构示意图。如图10所示,所述装置包括:
识别模块1001,用于对用户输入单句进行意图识别,得到用户意图;
获取模块1002,用于所述用户意图属于非通用类时,获取所述单句的上文信息;
转换模块1003,用于根据所述上文信息,将所述用户意图转换为可操作的第一意图;所述第一意图的执行条件成立时,将所述第一意图作为所述用户的真实意图。
进一步的,所述转换模块1003还用于:所述第一意图的执行条件不成立时,根据与所述单句相关的辅助信息,确定第二意图;将所述第二意图作为所述用户的真实意图。
进一步的,所述转换模块1003,还用于:根据所述辅助信息,确定有关使所述第一意图的执行条件成立需完成操作的参照信息;根据所述参照信息,确定所述第二意图。
具体实施时,所述辅助信息包括以下至少一种:所述用户的用户信息和/或设备信息。
进一步的,所述转换模块1003,还用于:
将所述上文信息及所述用户意图作为意图转换模型的输入,执行所述意图转换模型得到所述第一意图;或者
所述上文信息及所述用户意图作为关联对,根据预置的关联对与可操作意图的对应关系,获取所述关联对对应的所述第一意图。
进一步的,所述装置还包括:
执行模块,用于根据所述用户的真实意图,执行相应的操作。
这里需要说明的是:上述实施例提供的用户意图识别装置可实现上述各方法实施例中描述的技术方案,上述各模块或单元具体实现的原理可参见上述各方法实施例中的相应内容,此处不再赘述。
本申请实施例提供的技术方案,基于已经较为成熟的单句意图识别算法,仅对用户输入的单句进行意图识别;在识别出的用户意图属于非通用类时,再对用户意图进行意图转换;在识别出的用户意图属于通用类时,即可根据用户意图执行相应的操作;无需依赖大规模的对话语料,识别方法简单且具有较高的准确性,易于进行工业应用。
图11示出了本申请一实施例提供的用户指令执行装置的结构示意图。如图11所示,所述装置,包括:
接收模块1101,用于接收客户端发送的用户输入单句指令;
识别模块1102,用于对所述单句指令进行意图识别,得到用户意图;
转换模块1103,用于所述用户意图属于非通用类时,根据与所述单句相关的关联信息,将所述用户意图转换为可操作意图;
反馈模块1104,用于将所述可操作意图反馈至所述客户端,以由所述客户端按照所述可操作意图执行相应的操作。
进一步的,所述转换模块1103,还用于:
将所述关联信息及所述用户意图作为意图转换模型的输入,执行所述意图转换模型得到所述可操作意图;或者
所述关联信息及所述用户意图作为关联对,根据预置的关联对与可操作意图的对应关系,获取所述关联对对应的所述可操作意图。
进一步的,所述转换模块1103,还用于:
根据所述关联信息中包含的单句的上文信息,将所述用户意图转换为可操作的第一意图;
所述第一意图的执行条件成立时,将所述第一意图作为所述可操作意图。
再进一步的,所述转换模块1103,还用于:
所述第一意图的执行条件不成立时,根据所述关联信息中包含的与所述单句相关的辅助信息,确定第二意图;
将所述第二意图作为所述可操作意图。
其中,所述辅助信息包括以下至少一种:所述用户的用户信息、设备信息。
这里需要说明的是:上述实施例提供的用户指令执行装置可实现上述各方法实施例中描述的技术方案,上述各模块或单元具体实现的原理可参见上述各方法实施例中的相应内容,此处不再赘述。
本申请实施例提供的技术方案,基于已经较为成熟的单句意图识别算法,仅对用户输入的单句进行意图识别;在识别出的用户意图属于非通用类时,再对用户意图进行意图转换;在识别出的用户意图属于通用类时,即可根据用户意图执行相应的操作;无需依赖大规模的对话语料,识别方法简单且具有较高的准确性,易于进行工业应用。
图12示出了本申请另一实施例提供的用户指令执行装置的结构示意图。如图12所示,所述装置,包括:
发送模块1201,用于向服务端发送用户输入的单句指令;
接收模块1202,用于接收服务端反馈的所述单句指令对应的可操作意图;
执行模块1203,用于按照所述可操作意图,执行相应的操作;
其中,所述可操作意图是对所述单句进行意图识别得到用户意图;所述用户意图属于非通用类时,根据与所述单句相关的关联信息对所述用户意图进行意图转换后得到。
这里需要说明的是:上述实施例提供的用户指令执行装置可实现上述各方法实施例中描述的技术方案,上述各模块或单元具体实现的原理可参见上述各方法实施例中的相应内容,此处不再赘述。
本申请实施例提供的技术方案,基于已经较为成熟的单句意图识别算法,仅对用户输入的单句进行意图识别;在识别出的用户意图属于非通用类时,再对用户意图进行意图转换;无需依赖大规模的对话语料,识别方法简单且具有较高的准确性,易于进行工业应用。
图13示出了本申请一实施例提供的电子设备的结构示意图。如图13所示所述电子设备包括:第一存储器1301以及第一处理器1302;其中,
所述第一存储器1301,用于存储程序;
所述第一处理器1302,与所述第一存储器1301耦合,用于执行所述第一存储器1301中存储的所述程序,以用于:
对用户输入单句进行意图识别,得到用户意图;
所述用户意图属于非通用类时,获取与所述单句相关的关联信息;
根据所述关联信息,将所述用户意图转换为可操作意图。
上述第一存储器1301可被配置为存储各种数据,这些数据的示例包括任何应用程序或方法的指令。第一存储器1301可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
上述第一处理器1302在执行第一存储器1301中的程序时,除了上面的功能之外,还可实现其它功能,具体可参见前面各实施例的描述。
进一步,如图13所示,电子设备还包括:第一通信组件1303、第一显示器1304、第一电源组件1305、第一音频组件1306等其它组件。图13中仅示意性给出部分组件,并不意味着电子设备只包括图13所示组件。
相应地,本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,所述计算机程序被计算机执行时能够实现上述各实施例提供的用户意图识别方法步骤或功能。
图14示出了本申请另一实施例提供的电子设备的结构示意图。如图14所示,所述电子设备包括:第二存储器1401以及第二处理器1402;
所述第二存储器1401,用于存储程序;
所述第二处理器1402,与所述第二存储器1401耦合,用于执行所述第二存储器1401中存储的所述程序,以用于:
对用户输入单句进行意图识别,得到用户意图;
确定所述用户意图是否属于通用类;
所述用户意图属于通用类时,根据所述用户意图执行相应的操作。
上述第二存储器1401可被配置为存储各种数据,这些数据的示例包括任何应用程序或方法的指令。第二存储器1401可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
上述第二处理器1402在执行第二存储器1401中的程序时,除了上面的功能之外,还可实现其它功能,具体可参见前面各实施例的描述。
进一步,如图14所示,电子设备还包括:第二通信组件1403、第二显示器1404、第二电源组件1405、第二音频组件1406等其它组件。图14中仅示意性给出部分组件,并不意味着电子设备只包括图14所示组件。
相应地,本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,所述计算机程序被计算机执行时能够实现上述各实施例提供的用户意图识别方法的步骤或功能。
图15示出了本申请又一实施例提供的电子设备的结构示意图。如图15所示,所述电子设备,包括:第三存储器1501以及第三处理器1502;其中,
所述第三存储器1501,用于存储程序;
所述第三处理器1502,与所述第三存储器1501耦合,用于执行所述第三存储器1501中存储的所述程序,以用于:
对用户输入单句进行意图识别,得到用户意图;
所述用户意图属于非通用类时,获取所述单句的上文信息;
根据所述上文信息,将所述用户意图转换为可操作的第一意图;
所述第一意图的执行条件成立时,将所述第一意图作为所述用户的真实意图。
上述第三存储器1501可被配置为存储各种数据,这些数据的示例包括任何应用程序或方法的指令。第三存储器1501可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
上述第三处理器1502在执行第三存储器1501中的程序时,除了上面的功能之外,还可实现其它功能,具体可参见前面各实施例的描述。
进一步,如图15所示,电子设备还包括:第三通信组件1503、第三显示器1504、第三电源组件1505、第三音频组件1506等其它组件。图15中仅示意性给出部分组件,并不意味着电子设备只包括图15所示组件。
相应地,本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,所述计算机程序被计算机执行时能够实现上述各实施例提供的用户意图识别方法的步骤或功能。
图16示出了本申请一实施例提供的服务端设备的结构示意图。如图16所示,所述服务端设备包括:第四存储器1601、第四处理器1602及第四通信组件1603;其中,
所述第四存储器1601,用于存储程序;
所述第四处理器1602,与所述第四存储器1601耦合,用于执行所述第四存储器1601中存储的所述程序,以用于:
对用户输入单句进行意图识别,得到用户意图;
所述用户意图属于非通用类时,根据与所述单句相关的关联信息,将所述用户意图转换为可操作意图;
所述第四通信组件1603,与所述第四处理器1602耦合,用于:
接收客户端发送的用户输入的所述单句;
将所述可操作意图反馈至所述客户端,以由所述客户端按照所述可操作意图执行相应的操作。
上述第四存储器1601可被配置为存储其它各种数据,这些数据的示例包括应用程序或方法的指令。第四存储器1601可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
上述第四处理器1602在执行第四存储器1601中的程序时,除了上面的功能之外,还可实现其它功能,具体可参见前面各实施例的描述。
进一步,如图16所示,服务端设备还包括:第四显示器1604、第四电源组件1605、第四音频组件1606等其它组件。图16中仅示意性给出部分组件,并不意味着服务端设备只包括图16所示组件。
相应地,本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,所述计算机程序被计算机执行时能够实现上述各实施例提供的用户指令执行方法的步骤或功能。
图17示出了本申请一实施例提供的客户端设备的结构示意图。如图17所示,所述客户端设备包括:第五存储器1701、第五处理器1702及第五通信组件1703。其中,
所述第五存储器1701,用于存储程序;
所述第五通信组件1702,与所述第五处理器1702耦合,用于:
向服务端发送用户输入的单句;
接收服务端反馈的所述用户的可操作意图;
所述第五处理器1702,与所述第五存储器1701耦合,用于执行所述第五存储器1701中存储的所述程序,以用于:
按照所述可操作意图,执行相应的操作;
其中,所述可操作意图是对所述单句进行意图识别得到用户意图;所述用户意图属于非通用类时,根据与所述单句相关的关联信息对所述用户意图进行意图转换后得到。
上述第五存储器1701可被配置为存储各种数据,这些数据的示例包括任何应用程序或方法的指令。第五存储器1701可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
上述第五处理器1702在执行第五存储器1701中的程序时,除了上面的功能之外,还可实现其它功能,具体可参见前面各实施例的描述。
进一步,如图17所示,客户端设备还包括:第五显示器1704、第五电源组件1705、第五音频组件1706等其它组件。图17中仅示意性给出部分组件,并不意味着客户端设备只包括图17所示组件。
相应地,本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,所述计算机程序被计算机执行时能够实现上述各实施例提供的用户指令执行方法的步骤或功能。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)操作各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (30)

1.一种用户意图识别方法,其特征在于,包括:
对用户输入单句进行意图识别,得到用户意图;
所述用户意图属于非通用类时,获取与所述单句相关的关联信息;
根据所述关联信息,将所述用户意图转换为可操作意图。
2.根据权利要求1所述的方法,其特征在于,根据所述关联信息,将所述用户意图转换为可操作意图,包括:
将所述关联信息及所述用户意图作为意图转换模型的输入,执行所述意图转换模型得到所述可操作意图;或者
所述关联信息及所述用户意图作为关联对,根据预置的关联对与可操作意图的对应关系,获取所述关联对对应的所述可操作意图。
3.根据权利要求2所述的方法,其特征在于,所述意图转换模型包括:专家系统或意图分类模型。
4.根据权利要求1所述的方法,其特征在于,根据所述关联信息,将所述用户意图转换为可操作意图,包括:
根据所述关联信息中包含的所述单句的上文信息,将所述用户意图转换为可操作的第一意图;
所述第一意图的执行条件成立时,将所述第一意图作为所述可操作意图。
5.根据权利要求4所述的方法,其特征在于,根据所述关联信息,将所述用户意图转换为可操作意图,还包括:
所述第一意图的执行条件不成立时,根据所述关联信息中包含的与所述单句相关的辅助信息,确定第二意图;
将所述第二意图作为所述可操作意图。
6.根据权利要求5所述的方法,其特征在于,根据所述辅助信息,确定第二意图,包括:
根据所述辅助信息,确定有关使所述第一意图的执行条件成立需完成操作的参照信息;
根据所述参照信息,确定所述第二意图。
7.根据权利要求5或6所述的方法,其特征在于,所述辅助信息包括以下至少一种:所述用户的用户信息、设备信息。
8.根据权利要求1至6中任一项所述的方法,其特征在于,还包括:
根据所述可操作意图,执行相应的操作。
9.一种用户意图识别方法,其特征在于,包括:
对用户输入单句进行意图识别,得到用户意图;
确定所述用户意图是否属于通用类;
所述用户意图属于通用类时,根据所述用户意图执行相应的操作。
10.根据权利要求9所述的方法,其特征在于,确定所述用户意图是否属于通用类,包括:
获取预置的通用类意图列表;
查找所述通用类意图列表中不包含与所述用户意图相同或相似的意图项时,所述用户意图属于非通用类。
11.根据权利要求9或10所述的方法,其特征在于,还包括:
所述用户意图属于非通用类时,获取与所述单句相关的关联信息;
根据所述关联信息,将所述用户意图转换为可操作意图。
12.根据权利要求11所述的方法,其特征在于,所述关联信息包括以下至少一种:所述单句的上文信息、所述用户的用户信息、设备信息。
13.一种用户意图识别方法,其特征在于,包括:
对用户输入单句进行意图识别,得到用户意图;
所述用户意图属于非通用类时,获取所述单句的上文信息;
根据所述上文信息,将所述用户意图转换为可操作的第一意图;
所述第一意图的执行条件成立时,将所述第一意图作为所述用户的真实意图。
14.根据权利要求16所述的方法,其特征在于,还包括:
所述第一意图的执行条件不成立时,根据与所述单句相关的辅助信息,确定第二意图;
将所述第二意图作为所述用户的真实意图。
15.根据权利要求14所述的方法,其特征在于,根据所述辅助信息,确定所述第二意图,包括:
根据所述辅助信息,确定有关使所述第一意图的执行条件成立需完成操作的参照信息;
根据所述参照信息,确定所述第二意图。
16.根据权利要求14或15所述的方法,其特征在于,所述辅助信息包括以下至少一种:所述用户的用户信息和/或设备信息。
17.根据权利要求13至15中任一项所述的方法,其特征在于,根据所述上文信息,将所述用户意图转换为所述第一意图,包括:
将所述上文信息及所述用户意图作为意图转换模型的输入,执行所述意图转换模型得到所述第一意图;或者
所述上文信息及所述用户意图作为关联对,根据预置的关联对与可操作意图的对应关系,获取所述关联对对应的所述第一意图。
18.根据权利要求13至15所述的方法,其特征在于,还包括:
根据所述用户的真实意图,执行相应的操作。
19.一种用户指令执行方法,其特征在于,包括:
接收客户端发送的用户输入单句指令;
对所述单句指令进行意图识别,得到用户意图;
所述用户意图属于非通用类时,根据与所述单句相关的关联信息,将所述用户意图转换为可操作意图;
将所述可操作意图反馈至所述客户端,以由所述客户端按照所述可操作意图执行相应的操作。
20.根据权利要求19所述的方法,其特征在于,根据所述关联信息,将所述用户意图转换为可操作意图,包括:
将所述关联信息及所述用户意图作为意图转换模型的输入,执行所述意图转换模型得到所述可操作意图;或者
所述关联信息及所述用户意图作为关联对,根据预置的关联对与可操作意图的对应关系,获取所述关联对对应的所述可操作意图。
21.根据权利要求19所述的方法,其特征在于,根据所述关联信息,将所述用户意图转换为可操作意图,包括:
根据所述关联信息中包含的单句的上文信息,将所述用户意图转换为可操作的第一意图;
所述第一意图的执行条件成立时,将所述第一意图作为所述可操作意图。
22.根据权利要求21所述的方法,其特征在于,根据所述关联信息,将所述用户意图转换为可操作意图,还包括:
所述第一意图的执行条件不成立时,根据所述关联信息中包含的与所述单句相关的辅助信息,确定第二意图;
将所述第二意图作为所述可操作意图。
23.根据权利要求22所述的方法,其特征在于,所述辅助信息包括以下至少一种:所述用户的用户信息、设备信息。
24.一种用户指令执行方法,其特征在于,包括:
向服务端发送用户输入的单句指令;
接收服务端反馈的所述单句指令对应的可操作意图;
按照所述可操作意图,执行相应的操作;
其中,所述可操作意图是对所述单句进行意图识别得到用户意图;所述用户意图属于非通用类时,根据与所述单句相关的关联信息对所述用户意图进行意图转换后得到。
25.一种用户指令执行系统,其特征在于,包括:
服务端,用于接收客户端发送的用户输入单句;对所述单句进行意图识别,得到用户意图;所述用户意图属于非通用类时,根据与所述单句相关的关联信息,将所述用户意图转换为可操作意图;将所述可操作意图反馈至所述客户端,以由所述客户端按照所述可操作意图执行相应的操作;
客户端,用于向服务端发送用户输入的单句;接收服务端反馈的所述用户的可操作意图;按照所述可操作意图,执行相应的操作。
26.一种电子设备,其特征在于,包括:第一存储器以及第一处理器;
所述第一存储器,用于存储程序;
所述第一处理器,与所述第一存储器耦合,用于执行所述第一存储器中存储的所述程序,以用于:
对用户输入单句进行意图识别,得到用户意图;
所述用户意图属于非通用类时,获取与所述单句相关的关联信息;
根据所述关联信息,将所述用户意图转换为可操作意图。
27.一种电子设备,其特征在于,包括:第二存储器以及第二处理器;
所述第二存储器,用于存储程序;
所述第二处理器,与所述第二存储器耦合,用于执行所述第二存储器中存储的所述程序,以用于:
对用户输入单句进行意图识别,得到用户意图;
确定所述用户意图是否属于通用类;
所述用户意图属于通用类时,根据所述用户意图执行相应的操作。
28.一种电子设备,其特征在于,包括:第三存储器以及第三处理器;
所述第三存储器,用于存储程序;
所述第三处理器,与所述第三存储器耦合,用于执行所述第三存储器中存储的所述程序,以用于:
对用户输入单句进行意图识别,得到用户意图;
所述用户意图属于非通用类时,获取所述单句的上文信息;
根据所述上文信息,将所述用户意图转换为可操作的第一意图;
所述第一意图的执行条件成立时,将所述第一意图作为所述用户的真实意图。
29.一种服务端设备,其特征在于,包括:第四存储器、第四处理器及第四通信组件;
所述第四存储器,用于存储程序;
所述第四处理器,与所述第四存储器耦合,用于执行所述第四存储器中存储的所述程序,以用于:
对用户输入单句进行意图识别,得到用户意图;
所述用户意图属于非通用类时,根据与所述单句相关的关联信息,将所述用户意图转换为可操作意图;
所述第四通信组件,与所述第四处理耦合,用于:
接收客户端发送的用户输入的所述单句;
将所述可操作意图反馈至所述客户端,以由所述客户端按照所述可操作意图执行相应的操作。
30.一种客户端设备,其特征在于,包括:第五存储器、第五处理器及第五通信组件;其中,
所述第五存储器,用于存储程序;
所述第五通信组件,与所述第五处理器耦合,用于:
向服务端发送用户输入的单句;
接收服务端反馈的所述用户的可操作意图;
所述第五处理器,与所述第五存储器耦合,用于执行所述第五存储器中存储的所述程序,以用于:
按照所述可操作意图,执行相应的操作;
其中,所述可操作意图是对所述单句进行意图识别得到用户意图;所述用户意图属于非通用类时,根据与所述单句相关的关联信息对所述用户意图进行意图转换后得到。
CN201810416493.5A 2018-05-03 2018-05-03 用户意图识别方法、用户指令执行方法、系统及设备 Active CN110517672B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810416493.5A CN110517672B (zh) 2018-05-03 2018-05-03 用户意图识别方法、用户指令执行方法、系统及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810416493.5A CN110517672B (zh) 2018-05-03 2018-05-03 用户意图识别方法、用户指令执行方法、系统及设备

Publications (2)

Publication Number Publication Date
CN110517672A true CN110517672A (zh) 2019-11-29
CN110517672B CN110517672B (zh) 2023-08-15

Family

ID=68621458

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810416493.5A Active CN110517672B (zh) 2018-05-03 2018-05-03 用户意图识别方法、用户指令执行方法、系统及设备

Country Status (1)

Country Link
CN (1) CN110517672B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111191030A (zh) * 2019-12-20 2020-05-22 北京淇瑀信息科技有限公司 基于分类的单句意图识别方法、装置和系统
CN112232080A (zh) * 2020-10-20 2021-01-15 大唐融合通信股份有限公司 命名实体识别方法、装置及电子设备
CN113240438A (zh) * 2021-05-11 2021-08-10 京东数字科技控股股份有限公司 意图识别方法、设备、存储介质及程序产品

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130218836A1 (en) * 2012-02-22 2013-08-22 Microsoft Corporation Deep Linking From Task List Based on Intent
CN104951458A (zh) * 2014-03-26 2015-09-30 华为技术有限公司 基于语义识别的帮助处理方法及设备
CN105206266A (zh) * 2015-09-01 2015-12-30 重庆长安汽车股份有限公司 基于用户意图猜测的车载语音控制系统及方法
CN106372132A (zh) * 2016-08-25 2017-02-01 北京百度网讯科技有限公司 基于人工智能的查询意图预测方法和装置
CN106649694A (zh) * 2016-12-19 2017-05-10 北京云知声信息技术有限公司 语音交互中确定用户意图的方法及装置
CN107133345A (zh) * 2017-05-22 2017-09-05 北京百度网讯科技有限公司 基于人工智能的交互方法和装置
CN107862005A (zh) * 2017-10-25 2018-03-30 阿里巴巴集团控股有限公司 用户意图识别方法及装置
CN107977183A (zh) * 2017-11-16 2018-05-01 百度在线网络技术(北京)有限公司 语音交互方法、装置及设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130218836A1 (en) * 2012-02-22 2013-08-22 Microsoft Corporation Deep Linking From Task List Based on Intent
CN104951458A (zh) * 2014-03-26 2015-09-30 华为技术有限公司 基于语义识别的帮助处理方法及设备
CN105206266A (zh) * 2015-09-01 2015-12-30 重庆长安汽车股份有限公司 基于用户意图猜测的车载语音控制系统及方法
CN106372132A (zh) * 2016-08-25 2017-02-01 北京百度网讯科技有限公司 基于人工智能的查询意图预测方法和装置
CN106649694A (zh) * 2016-12-19 2017-05-10 北京云知声信息技术有限公司 语音交互中确定用户意图的方法及装置
CN107133345A (zh) * 2017-05-22 2017-09-05 北京百度网讯科技有限公司 基于人工智能的交互方法和装置
CN107862005A (zh) * 2017-10-25 2018-03-30 阿里巴巴集团控股有限公司 用户意图识别方法及装置
CN107977183A (zh) * 2017-11-16 2018-05-01 百度在线网络技术(北京)有限公司 语音交互方法、装置及设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111191030A (zh) * 2019-12-20 2020-05-22 北京淇瑀信息科技有限公司 基于分类的单句意图识别方法、装置和系统
CN111191030B (zh) * 2019-12-20 2024-04-26 北京淇瑀信息科技有限公司 基于分类的单句意图识别方法、装置和系统
CN112232080A (zh) * 2020-10-20 2021-01-15 大唐融合通信股份有限公司 命名实体识别方法、装置及电子设备
CN113240438A (zh) * 2021-05-11 2021-08-10 京东数字科技控股股份有限公司 意图识别方法、设备、存储介质及程序产品

Also Published As

Publication number Publication date
CN110517672B (zh) 2023-08-15

Similar Documents

Publication Publication Date Title
CN110008322B (zh) 多轮对话场景下的话术推荐方法和装置
CN107492379B (zh) 一种声纹创建与注册方法及装置
CN109003624B (zh) 情绪识别方法、装置、计算机设备及存储介质
CN108197282B (zh) 文件数据的分类方法、装置及终端、服务器、存储介质
CN110168535B (zh) 一种信息处理方法及终端、计算机存储介质
WO2022095380A1 (zh) 基于ai的虚拟交互模型生成方法、装置、计算机设备及存储介质
WO2020253064A1 (zh) 语音的识别方法及装置、计算机设备、存储介质
CN111651497B (zh) 用户标签挖掘方法、装置、存储介质及电子设备
CN113590850A (zh) 多媒体数据的搜索方法、装置、设备及存储介质
CN110321564B (zh) 一种多轮对话意图识别方法
KR20180054407A (ko) 로봇 시스템
CN110517672B (zh) 用户意图识别方法、用户指令执行方法、系统及设备
CN111276148A (zh) 基于卷积神经网络的回访方法、系统及存储介质
CN111178081B (zh) 语义识别的方法、服务器、电子设备及计算机存储介质
CN112632244A (zh) 一种人机通话的优化方法、装置、计算机设备及存储介质
CN111429157A (zh) 投诉工单的评价处理方法、装置、设备及存储介质
CN110765776A (zh) 回访标注样本数据的生成方法及装置
CN110750626B (zh) 一种基于场景的任务驱动的多轮对话方法及系统
CN114065720A (zh) 会议纪要生成方法、装置、存储介质及电子设备
CN113111658B (zh) 校验信息的方法、装置、设备和存储介质
CN113918679A (zh) 一种知识问答方法、装置及工程机械
CN116737883A (zh) 人机交互方法、装置、设备及存储介质
CN111415662A (zh) 用于生成视频的方法、装置、设备和介质
CN114528851B (zh) 回复语句确定方法、装置、电子设备和存储介质
CN116821290A (zh) 面向多任务对话的大语言模型训练方法和交互方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant