CN114281952A - 一种用户意图分析方法及装置 - Google Patents

一种用户意图分析方法及装置 Download PDF

Info

Publication number
CN114281952A
CN114281952A CN202110934690.8A CN202110934690A CN114281952A CN 114281952 A CN114281952 A CN 114281952A CN 202110934690 A CN202110934690 A CN 202110934690A CN 114281952 A CN114281952 A CN 114281952A
Authority
CN
China
Prior art keywords
syntax tree
syntax
optimal
user intention
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110934690.8A
Other languages
English (en)
Inventor
李霞
张立泽
李金凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hisense Visual Technology Co Ltd
Original Assignee
Hisense Visual Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hisense Visual Technology Co Ltd filed Critical Hisense Visual Technology Co Ltd
Priority to CN202110934690.8A priority Critical patent/CN114281952A/zh
Publication of CN114281952A publication Critical patent/CN114281952A/zh
Priority to CN202280047134.1A priority patent/CN117651943A/zh
Priority to PCT/CN2022/102456 priority patent/WO2023005580A1/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

本申请实施例提供一种用户意图分析方法及装置,方法包括:利用依存句法分析语音文本得到至少两棵句法树。如果句法树的概率值均相等,则将用户意图与当前设备的设备状态信息匹配的句法树确定为最优句法树。如果句法树的概率值不均相等,并且概率值最大的句法树具有的用户意图与当前设备的设备状态信息匹配,则将概率值最大的句法树确定为最优句法树,以及将最优句法树具有的用户意图确定为最优用户意图。本申请提供的用户意图分析方法及装置,不仅基于用户维度对用户意图进行理解,还在意图分析过程中嵌入设备维度,从而使得意图分析更准确,最终使得终端设备能够准确执行对应操作,提升用户使用体验。

Description

一种用户意图分析方法及装置
技术领域
本申请涉及语音交互技术领域,尤其涉及一种用户意图分析方法及装置。
背景技术
随着智能语音交互技术的发展,语音交互功能逐渐成为智能终端产品的标准配置。用户可利用语音交互功能,实现语音控制智能终端产品,进行看视频、听音乐、查天气、电视控制等一系列操作。
语音控制智能终端产品的过程通常是,语音识别模块将用户输入的语音识别为文本。之后语义分析模块对该文本进行词法句法和语义的分析,从而理解用户的意图。最后控制端根据理解结果控制智能终端产品进行相应的操作。
然而,目前的智能终端产品,在理解用户意图时,通常仅基于用户维度(用户输入文本及用户上下文)对用户意图进行解析。例如,用户输入语音文本″天天向上″,基于用户维度解析用户意图,可能得到显示天天向上的百科介绍、趣味问答好好学习天天向上、播放天天向上综艺节目等结果。如果忽略智能终端当前所处场景,而仅基于用户维度选取执行结果,可能会产生执行结果与用户实际意图存在偏差的情况,最终造成用户对智能终端产品的使用体验较差。
发明内容
本申请提供了一种语义理解方法及装置,用于解决目前的智能终端产品,忽略智能终端当前所处场景,而仅基于用户维度选取执行结果,可能会产生执行结果与用户实际意图存在偏差的情况,最终造成用户对智能终端产品的使用体验较差的问题。
第一方面,本申请实施例提供一种用户意图分析方法,该方法包括:获取用户输入的语音文本,对所述语音文本进行语义分析处理,生成至少两棵句法树,其中,所述句法树具有概率值和用户意图,概率值为系统输出所述句法树的概率;
在所述句法树的概率值均相等时,将用户意图与当前设备的设备状态信息匹配的所述句法树确定为最优句法树,以及将最优句法树具有的用户意图确定为最优用户意图;
在所述句法树的概率值不均相等,且概率值最大的所述句法树具有的用户意图与当前设备的设备状态信息匹配时,将概率值最大的所述句法树确定为最优句法树,以及将最优句法树具有的用户意图确定为最优用户意图
第二方面,本申请实施例提供一种用户意图分析装置,该装置包括:
句法树生成单元,用于执行:获取用户输入的语音文本,对所述语音文本进行语义分析处理,生成至少两棵句法树,其中,所述句法树具有概率值和用户意图,概率值为系统输出所述句法树的概率;
意图优先级适配单元,用于执行:在所述句法树的概率值均相等时,将用户意图与当前设备的设备状态信息匹配的所述句法树确定为最优句法树,以及将最优句法树具有的用户意图确定为最优用户意图;
意图改写单元,用于执行:在所述句法树的概率值不均相等,且概率值最大的所述句法树具有的用户意图与当前设备的设备状态信息匹配时,将概率值最大的所述句法树确定为最优句法树,以及将最优句法树具有的用户意图确定为最优用户意图。
本申请提供的技术方案包括以下有益效果:利用依存句法分析语音文本得到至少两棵句法树。如果句法树的概率值均相等,则将用户意图与当前设备的设备状态信息匹配的句法树确定为最优句法树,以及将最优句法树具有的用户意图确定为最优用户意图。如果句法树的概率值不均相等,并且概率值最大的句法树具有的用户意图与当前设备的设备状态信息匹配,则将概率值最大的句法树确定为最优句法树,以及将最优句法树具有的用户意图确定为最优用户意图。本申请提供的用户意图分析方法及装置,不仅基于用户维度对用户意图进行理解,还在意图分析过程中嵌入设备维度,从而使得意图分析更准确,最终使得终端设备能够准确执行对应操作,提升用户使用体验。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1示例性示出了根据一些实施例的语音交互原理的示意图;
图2示例性示出了根据一些实施例的用户意图分析方法流程示意图;
图3示例性示出了根据一些实施例的又一种用户意图分析方法流程示意图;
图4示例性示出了根据一些实施例的用户意图分析装置框架示意图。
具体实施方式
为使本申请的目的和实施方式更加清楚,下面将结合本申请示例性实施例中的附图,对本申请示例性实施方式进行清楚、完整地描述,显然,描述的示例性实施例仅是本申请一部分实施例,而不是全部的实施例。
需要说明的是,本申请中对于术语的简要说明,仅是为了方便理解接下来描述的实施方式,而不是意图限定本申请的实施方式。除非另有说明,这些术语应当按照其普通和通常的含义理解。
本申请中说明书和权利要求书及上述附图中的术语″第一″、″第二″、″第三″等是用于区别类似或同类的对象或实体,而不必然意味着限定特定的顺序或先后次序,除非另外注明。应该理解这样使用的用语在适当情况下可以互换。
术语″包括″和″具有″以及他们的任何变形,意图在于覆盖但不排他的包含,例如,包含了一系列组件的产品或设备不必限于清楚地列出的所有组件,而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。
术语″模块″是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合,能够执行与该元件相关的功能。
为清楚说明本申请的实施例,下面结合图1对本申请实施例提供的一种语音识别网络架构进行描述。
参见图1,图1为本申请实施例提供的一种语音识别网络架构示意图。图1中,智能设备用于接收输入的信息以及输出对该信息的处理结果。语音识别服务设备为部署有语音识别服务的电子设备,语义服务设备为部署有语义服务的电子设备,业务服务设备为部署有业务服务的电子设备。这里的电子设备可包括服务器、计算机等,这里的语音识别服务、语义服务(也可称为语义引擎)和业务服务为可部署在电子设备上的web服务,其中,语音识别服务用于将音频识别为文本,语义服务用于对文本进行语义解析,业务服务用于提供具体的服务如墨迹天气的天气查询服务、QQ音乐的音乐查询服务等。在一个实施例中,图1所示架构中可存在部署有不同业务服务的多个实体服务设备,也可以一个或多个实体服务设备中集合一项或多项功能服务。
一些实施例中,下面对基于图1所示架构处理输入智能设备的信息的过程进行举例描述,以输入智能设备的信息为通过语音输入的查询语句为例,上述过程可包括如下三个过程:
[语音识别]
智能设备可在接收到通过语音输入的查询语句后,将该查询语句的音频上传至语音识别服务设备,以由语音识别服务设备通过语音识别服务将该音频识别为文本后返回至智能设备。在一个实施例中,将查询语句的音频上传至语音识别服务设备前,智能设备可对查询语句的音频进行去噪处理,这里的去噪处理可包括去除回声和环境噪声等步骤。
[语义理解]
智能设备将语音识别服务识别出的查询语句的文本上传至语义服务设备,以由语义服务设备通过语义服务对该文本进行语义解析,得到文本的业务领域、意图等。
[语义响应]
语义服务设备根据对查询语句的文本的语义解析结果,向相应的业务服务设备下发查询指令以获取业务服务给出的查询结果。智能设备可从语义服务设备获取该查询结果并输出。作为一个实施例,语义服务设备还可将对查询语句的语义解析结果发送至智能设备,以由智能设备输出该语义解析结果中的反馈语句。
需要说明的是,图1所示架构只是一种示例,并非对本申请保护范围的限定。本申请实施例中,也可采用其他架构来实现类似功能,例如:三个过程全部或部分可以由智能终端来完成,在此不做赘述。
在一些实施例中,图1所示的智能设备可为显示设备,如智能电视,语音识别服务设备的功能可由显示设备上设置的声音采集器和控制器配合实现,语义服务设备和业务服务设备的功能可由显示设备的控制器实现,或者由显示设备的服务器来实现。
随着智能语音交互技术的发展,语音交互功能逐渐成为智能终端产品的标准配置。用户可利用语音交互功能,实现语音控制智能终端产品,进行看视频、听音乐、查天气、电视控制等一系列操作。
语音控制智能终端产品的过程通常是,语音识别模块将用户输入的语音识别为文本。之后语义分析模块对该文本进行词法句法和语义的分析,从而理解用户的意图。最后控制端根据理解结果控制智能终端产品进行相应的操作。
然而,目前的智能终端产品,在理解用户意图时,通常仅基于用户维度对用户意图进行解析。例如,用户输入语音文本″天天向上″,基于用户维度解析用户意图,可能得到显示天天向上的百科介绍、趣味问答好好学习天天向上、播放天天向上综艺节目等结果。如果忽略智能终端当前所处场景,而仅基于用户维度选取执行结果,可能会产生执行结果与用户实际意图存在偏差的情况。例如,智能终端当前所处场景为打开视频应用,此时用户的意图可能偏向于观看天天向上综艺节目,但是如果仅基于用户维度理解用户意图,可能执行的结果为显示天天向上的百科介绍,这就产生执行结果与用户实际意图存在偏差的情况。
上述示例为基于不同的智能终端的操控场景,在不同的智能终端类型的场景中也存在执行结果与用户实际意图存在偏差的情况。例如,如果智能终端为智能音箱,用户输入语音文本天天向上,用户的意图可能偏向于播放歌曲天天向上。但是由于目前智能终端理解用户意图时忽略了智能终端的类型,可能执行的结果为播放天天向上综艺节目。而智能音箱不能观看视频内容,最终导致智能音箱不能执行相应的结果。
为了解决上述问题,本申请提供一种用户意图分析方法,该方法能够在意图分析过程中不仅基于用户维度,还嵌入设备维度信息,从而使得意图分析更准确,最终使得终端设备能够准确执行对应操,提升用户使用体验。
如图2的语义理解方法的流程示意图,该方法包括以下步骤:
步骤S101,获取用户输入的语音文本,利用依存句法分析该语音文本,生成至少两棵句法树。需要说明的事,在利用依存句法分析语音文本时,有可能只生成一棵句法树,本申请实施例以生成至少两棵句法树为示例进行方案的阐述。
语音文本为对用户输入的语音信号解析得到的。具体的,用户在终端设备接收信号的距离范围内输入语音信号。终端设备可以是通过麦克风采集用户输入的语音信号,之后从语音信号中识别出语音文本。本申请实施例可由语音识别服务器识别出语音文本。
由语义服务器对语音文本进行语义分析处理。具体的,首先对语音文本进行分词处理。可以以词库为依据,使用正向最大匹配法,进行分词。例如″刘德华的电影新少林寺″,分词处理后得到分词″刘德华,的,电影,新少林寺″。
进一步对分词进行词性标注,具体可以采用例如LAC(Lexical Analysis ofChinese)词法分析工具,对媒资标题进行中文分词和词性标注。LAC词法分析工具是一种联合的词法分析模型,能够整体性地完成中文分词和词性标注,还可添加自定义词典,对专有名称进行识别。LAC词法分析任务的输入是一个字符串,输出的则是媒资标题中的词边界和词性。需要说明的是,本申请所使用的分词和词性标注工具不限于LAC词法分析工具,还可以使用其他的词法分析工具。词性标注后的结果为刘德华cast:singer|的,的,funcwordstructaux|电影,电影,rname|新少林寺musicName:title|。
之后利用依存句法,根据词性标注的结果,提取语音文本中用户意图。依存句法分析采用全局搜索,生成多棵句法树,每个句子对应一棵或多棵句法树,每一课句法树都具有概率值和用户意图。在现有技术中通常的做法是系统输出概率最高的句法树。最后将概率最高的句法树具有的用户意图,确定为该语音文本中的用户意图。
语义分析系统中定义使用11中依存关系,即非目标词与目标词之间的关系。首先确定句子中的每个业务的目标词,例如音乐业务的目标词为音乐名称。非目标词与目标词的关系可以是修饰词关系,与目标词构成定语关系。例如歌手名字和音乐类型是音乐名称的修饰词。非目标词与目标词的关系也可以是的主谓关系,与目标词构成动宾关系。例如,动作听和动作播放是音乐名称的动词。利用这些依存关系,对句子进行计算,可以输出不同句法树的概率值。
例如,语音文本″我想看钟汉良的何以笙箫默″经过分词和词性标注后得到结果:我想,funcwordintention|看,actionWatch钟汉良,cast:singer|的,funcwordstructaux|何以笙箫默,videoName:musicName。其中,videoname是视频业务的目标词。确定业务目标词后,计算剩余词语与目标词之间的依存关系和依存关系的权重,最后综合各种依存关系的权重,得到视频业务的句法树,并输出视频业务句法树的概率值。musicname是音乐业务的目标词,同样的方法得到音乐业务的句法树,并输出音乐业务句法树的概率值。最后得到各种不同业务的句法树,每一棵句法树均具有概率值和对应的用户意图。
步骤S102,如果所有的句法树的概率值均相等,将具有的用户意图与当前设备的设备状态信息匹配的句法树确定为最优句法树,以及将最优句法树具有的用户意图确定为最优用户意图。
本申请实施例中的当前设备的设备状态信息可以包括设备类型、设备模式以及终端状态等信息。设备类型可以是电视、冰箱、音箱等,设备模式可以是电视模式、音箱模式、少儿模式等,终端状态可以是设备当前所处的应用或者界面信息。设备模式和终端状态都是依附于设备类型,因此三个维度存在依赖关系。在确定最优句法树时,将所有的句法树与当前设备的设备状态信息进行匹配,匹配的句法树则为最优句法树。
需要说明的是,不同的设备支持的技能不同,相同的设备在不同的模式下支撑的技能不同,相同的设备相同的模式下在不同的界面下支持的技能又不同。如果设备不具备多种模式,同时不具有多种界面,则只需要考虑设备类型支持的技能。
针对设备类型层面的设备状态信息的示例:分析用户输入的语音文本确定的句法树的概率值均相等。当前设备为音箱,并且当前设备的设备类型支持广播功能。在所有句法树中,句法树A具有的用户意图为播放广播。此时句法树A具有的用户意图与当前设备的设备状态信息匹配,则将句法树A确定为最优句法树。同时将句法树A具有的用户意图播放广播确定为最优用户意图。最终当前设备执行播放广播的操作。
如果分析用户输入的语音文本确定的句法树B的用户意图为播放视频。而音箱不支持视频播放功能,则句法树B具有的用户意图与当前设备的设备状态信息不匹配,则不将句法树B确定为最优句法树。
针对设备模式层面的设备状态信息的示例:分析用户输入的语音文本确定的句法树的概率值均相等。当前设备为显示设备,并且当前设备的设备模式为少儿模式。在所有句法树中,句法树A具有的用户意图为播放真人电影花木兰。而在显示设备的设备模式为少儿模式时,不允许显示设备播放真人电影。则句法树A的用户意图与当前设备的设备状态信息不匹配,不可将句法树A确定为最优句法树。
句法树B具有的用户意图为播放动画片花木兰。在显示设备的设备模式为少儿模式时,允许显示设备播放动画片。则句法树B的用户意图与当前设备的设备状态信息匹配,可将句法树B确定为最优句法树。最终将句法树B具有的用户意图播放动画片确定为最优用户意图。
针对设备界面层面的设备状态信息的示例:用户输入的语音文本为″二两牛肉″,分析用户输入的语音文本确定的句法树A具有的用户意图为管理牛肉食材,句法树B具有的用户意图为购买两斤牛肉。句法树A和句法树B的概率值相等。当前设备为智能冰箱,如果当前设备的设备界面为食材管理界面。则句法树A具有的用户意图″管理牛肉食材″与当前设备的设备状态信息匹配。可将句法树A确定为最优句法树,并可将句法树A具有的用户意图″管理牛肉食材″确定为最优用户意图。
如果当前设备的设备间界面为购物界面。则句法树B具有的用户意图″购买两斤牛肉″与当前设备的设备状态信息匹配。可将句法树B确定为最优句法树,并可将句法树B具有的用户意图″购买两斤牛肉″确定为最优用户意图。
步骤S103,如果所有的句法树的概率值不均相等,并且概率值最大的句法树具有的用户意图与当前设备的设备状态信息匹配,则将概率值最大的句法树确定为最优句法树,以及将最优句法树具有的用户意图确定为最优用户意图。需要说明的是,这里所有的句法树的概率值不均相等,可以是所有的句法树概率值均不相等,也可以是所有的句法树概率值中至少有两棵句法树的概率值不相等。
例如,对用户输入的语音取文本进行语义分析处理后得到句法树A、句法树B以及句法树C。其中,三棵句法树的概率值均不相等,句法树A的概率值最大。如果此时句法树A具有的用户意图与当前设备的设备状态信息匹配,则将句法树A确定为最优句法树,以及将句法树A具有的用户意图确定为最优用户意图。
在一些实施例中,如图3所示的流程图,本申请实施例的方法还包括按照概率值大小有大到小对所有句法树进行排序。例如上述实施例的句法树A、句法树B以及句法树C,其中句法树A的概率值为0.96,句法树B的概率值小于0.96,句法树C的概率值小于句法树B的概率值。则按照概率值大小由大到小排序为:句法树A、句法树B以及句法树C。
在确定最优句法树时,首先判断句法树A具有的用户意图是否与当前设备的设备状态信息匹配。如果句法树A具有的用户意图与当前设备的设备状态信息匹配,则将句法树A确定为最优句法树。如果句法树A具有的用户意图与当前设备的设备状态信息不匹配,则进一步判断排序为第二位的句法树B的概率值与句法树A的概率值的偏差值是否小于偏差阈值。
如果句法树B的概率值与句法树A的概率值的偏差值小于偏差阈值,进一步判断句法树B具有用户意图是否与当前设备的设备状态信息匹配。
如果句法树B的用户意图与当前设备的设备状态信息匹配,则将句法树B确定为最优句法树,以及将句法树B的用户意图确定为最优用户意图。如果句法树B的用户意图与当前设备的设备状态信息不匹配,则进一步对句法树C作同样的判断操作。
如果句法树B的概率值与句法树A的概率值的偏差值大于偏差阈值,则仍然将句法树A确定为最优句法树。此时,由于句法树A具有的用户意图与当前设备的设备状态信息不匹配,则可以向用户展示提示语,该提示语用于提示用户当前设备不可执行最优用户意图对应的操作。向用户展示提示语的方式可以是在显示器上显示提示语,或者通过语音播报的方式展示提示语。
示例性的,用户输入语音文本″我想听郭德纲的相声″,经过语义分析处理,得到句法树A和句法树B。句法树A具有的用户意图为播放″郭德纲的相声″广播,句法树B的用户意图为播放″郭德纲的相声″视频。句法树A的概率值为0.92,句法树B的概率值为0.85,偏差阈值为10%。当前设备如果为显示设备,则当前设备类型不支持播放广播。即句法树A具有的用户意图与当前设备的设备状态信息不匹配,则不将句法树A确定为最优句法树。
之后判断句法树B的概率值与句法树A的概率值的偏差为7%,该偏差值小于偏差阈值10%。进一步判断句法树B具有的用户意图″播放郭德纲的相声视频″与当前设备的设备状态信息匹配。则将句法树B确定为最优句法树,将句法树B具有的用户意图″播放郭德纲的相声视频″确定为最优用户意图。当前设备执行播放郭德纲相声视频的操作。
用户如果输入语音文本″我想看岳云鹏的相声″,经过语义分析处理,得到句法树A和句法树B。句法树A具有的用户意图为播放″岳云鹏的相声″视频,句法树B具有的用户意图为播放″岳云鹏的相声″广播。由于用户明确表达了看的意图,则句法树A的概率值相对更高为0.99。而句法树B的概率值相对较低为0.31。如果当前设备为音箱,则当前设备类型不支持播放视频。即句法树A具有的用户意图与当前设备的设备状态信息不匹配,则不将句法树A确定为最优句法树。
之后判断句法树B的概率值与句法树A的概率值的偏差为68%该偏差值大于偏差阈值10%。此时为用户具有明确意图的情况,则同样不可将句法树B确定为最优句法树。最后仍然将句法树A确定为最优句法树。但是当前设备为音箱,不可播放视频,因此音箱可以通过语音提示用户″音箱上暂不支持观看视频″。
在一些实施例中,如果所有的句法树的概率值均相等,并且用户意图与当前设备的设备状态信息匹配的句法树存在多棵时,将用户意图对应的媒资资源搜索热度最高的句法树确定为最优句法树,以及将最优句法树具有的用户意图确定为最优用户意图。
示例性的,用户输入语音文本″麻雀″,可以生成句法树A、句法树B以及句法树C。句法树A具有的用户意图对应的媒资资源为李易峰出演的电视剧麻雀,句法树B具有的用户意图对应的媒资资源为李荣浩演唱的歌曲麻雀,句法树C具有的用户意图对应的媒资资源为百科麻雀。当前设备同时支持播放视频、播放音乐以及展示搜索的百科内容。进一步,判断各个媒资资源的在网络上的搜索热度。最后将搜索热度最高的媒资资源对应的句法树确定为最优句法树。例如,李易峰出演的电视剧麻雀搜索热度最高,则将句法树A确定为最优句法树。需要说明的是,如果当前设备为智能音箱,智能音箱仅支持播放音乐,则智能将句法树B确定为最优句法树,播放音乐″麻雀″确定为最优用户意图。
在一些实施例中,如果所有的句法树的概率值均相等,并且用户意图与当前设备的设备状态信息匹配的句法树存在多棵时,将这些用户意图对应的媒资资源均向用户展示。例如上述实施例中的句法树A具有的用户意图对应的媒资资源为李易峰出演的电视剧麻雀,句法树B具有的用户意图对应的媒资资源为李荣浩演唱的歌曲麻雀,句法树C具有的用户意图对应的媒资资源为百科麻雀,可以均向用户展示。例如可以以列表的形式,向用户展示各个媒资资源的缩略图。
本申请实施例提供一种用户意图分析装置,用于执行图1对应的实施例,如图4所示,本申请提供的用户意图分析装置包括:
句法树生成单元201,用于执行:获取用户输入的语音文本,对语音文本进行语义分析处理,生成至少两棵句法树,其中,句法树具有概率值和用户意图,概率值为系统输出句法树的概率;
意图优先级适配单元202,用于执行:在句法树的概率值均相等时,将用户意图与当前设备的设备状态信息匹配的句法树确定为最优句法树,以及将最优句法树具有的用户意图确定为最优用户意图;
意图改写单元203,用于执行:在句法树的概率值不均相等,且概率值最大的句法树具有的用户意图与当前设备的设备状态信息匹配时,将概率值最大的句法树确定为最优句法树,以及将最优句法树具有的用户意图确定为最优用户意图。
在一些实施例中,意图优先级适配单元202还用于执行:在句法树的概率值均相等,且用户意图与当前设备的设备状态信息匹配的句法树存在多棵时,将用户意图对应的媒资资源搜索热度最高的句法树确定为最优句法树,以及将最优句法树具有的用户意图确定为最优用户意图;或者,将与当前设备的设备状态信息匹配的句法树具有的用户意图对应的媒资资源均显示在当前设备的显示器上。
在一些实施例中,意图改写单元203还用于执行:按照概率值大小由大到小对所述句法树进行排序,在所述句法树的概率值不均相等,概率值最大的所述句法树具有的用户意图与当前设备的设备状态信息不匹配,且概率值排序位于第二位的所述句法树的概率值与概率值最大的所述句法树的概率值偏差小于偏差阈值时,将概率值排序位于第二位的所述句法树确定为最优句法树,以及将最优句法树具有的用户意图确定为最优用户最优句法树。
以上已经描述的包括本发明的实现的示例。为了描述要求保护主题的目的,当然不可能描述组件或方法的每一个可设想组合,但是要意识到,本创新的许多另外组合和置换是可能的。相应地,要求保护主题打算包含全部这类改变、修改和变化,其落入所附权利要求的精神和范围之内。此外,包括″摘要″中所述的事物的本申请的所示实现的以上描述并不是要详细列举或者将所公开实现局限于所公开的精确形式。虽然本申请中为了说明目的而描述具体实现和示例,但是如相关领域的技术人员能够认识的,被认为在这类实现和示例的范围之内的各种修改是可能的。
此外,词语″示例″或″示范″在本申请中用来表示″用作示例、实例或说明″。本申请中描述为″示范″的任何方面或设计不一定被理解为相对其它方面或设计是优选或有利的。相反,词语″示例″或″示范″的使用打算以具体方式呈现概念。

Claims (10)

1.一种用户意图分析方法,其特征在于,包括:
获取用户输入的语音文本,对所述语音文本进行语义分析处理,生成至少两棵句法树,其中,所述句法树具有概率值和用户意图,概率值为系统输出所述句法树的概率;
在所述句法树的概率值均相等时,将用户意图与当前设备的设备状态信息匹配的所述句法树确定为最优句法树,以及将最优句法树具有的用户意图确定为最优用户意图;
在所述句法树的概率值不均相等,且概率值最大的所述句法树具有的用户意图与当前设备的设备状态信息匹配时,将概率值最大的所述句法树确定为最优句法树,以及将最优句法树具有的用户意图确定为最优用户意图。
2.根据权利要求1所述的用户意图分析方法,其特征在于,在所述句法树的所述概率值均相等,且用户意图与当前设备的设备状态信息匹配的所述句法树存在多棵时,将用户意图对应的媒资资源搜索热度最高的所述句法树确定为最优句法树,以及将最优句法树具有的用户意图确定为最优用户意图。
3.根据权利要求1所述的用户意图分析方法,其特征在于,在所述句法树的所述概率值均相等,且用户意图与当前设备的设备状态信息匹配的所述句法树存在多棵时,将与当前设备的设备状态信息匹配的所述句法树具有的用户意图对应的媒资资源均向用户展示。
4.根据权利要求1所述的用户意图分析方法,其特征在于,所述方法还包括按照概率值大小由大到小对所述句法树进行排序,在所述句法树的概率值不均相等,概率值最大的所述句法树具有的用户意图与当前设备的设备状态信息不匹配,且概率值排序位于第二位的所述句法树的概率值与概率值最大的所述句法树的概率值偏差小于偏差阈值时,将概率值排序位于第二位的所述句法树确定为最优句法树,以及将最优句法树具有的用户意图确定为最优用户最优句法树意图。
5.根据权利要求4所述的用户意图分析方法,其特征在于,所述方法还包括:在概率值排序位于第二位的所述句法树具有的用户意图与当前设备的设备状态信息匹配时,将概率值排序位于第二位的所述句法树确定为最优句法树,以及将最优句法树具有的用户意图确定为最优用户意图;
在概率值排序位于第二位的所述句法树具有的用户意图与当前设备的设备状态信息不匹配时,不将概率值排序位于第二位的所述句法树确定为最优句法树。
6.根据权利要求1所述的用户意图分析方法,其特征在于,所述方法还包括按照概率值大小由大到小对所述句法树进行排序,在所述句法树的所述概率值不均相等,概率值最大的所述句法树对应的用户意图与当前设备的设备状态信息不匹配,且概率值排序位于第二位的所述句法树的概率值与概率值最大的所述句法树的概率值偏差大于所述偏差阈值时,将概率值最大的所述句法树确定为最优句法树,以及将最优句法树具有的用户意图确定为最优用户意图。
7.根据权利要求6所述的用户意图分析方法,其特征在于,所述方法还包括:向用户展示提示语,所述提示语用于提示用户当前设备不可执行最优用户意图对应的操作。
8.一种用户意图分析装置,其特征在于,包括:
句法树生成单元,用于执行:获取用户输入的语音文本,对所述语音文本进行语义分析处理,生成至少两棵句法树,其中,所述句法树具有概率值和用户意图,概率值为系统输出所述句法树的概率;
意图优先级适配单元,用于执行:在所述句法树的概率值均相等时,将用户意图与当前设备的设备状态信息匹配的所述句法树确定为最优句法树,以及将最优句法树具有的用户意图确定为最优用户意图;
意图改写单元,用于执行:在所述句法树的概率值不均相等,且概率值最大的所述句法树具有的用户意图与当前设备的设备状态信息匹配时,将概率值最大的所述句法树确定为最优句法树,以及将最优句法树具有的用户意图确定为最优用户意图。
9.根据权利要求8所述的用户意图分析装置,其特征在于,所述意图优先级适配单元还用于执行:在所述句法树的所述概率值均相等,且用户意图与当前设备的设备状态信息匹配的所述句法树存在多棵时,将用户意图对应的媒资资源搜索热度最高的所述句法树确定为最优句法树,以及将最优句法树具有的用户意图确定为最优用户意图;
或者,将与当前设备的设备状态信息匹配的所述句法树具有的用户意图对应的媒资资源均显示在当前设备的显示器上。
10.根据权利要求8所述的用户意图分析装置,其特征在于,所述意图改写单元还用于执行:按照概率值大小由大到小对所述句法树进行排序,在所述句法树的概率值不均相等,概率值最大的所述句法树具有的用户意图与当前设备的设备状态信息不匹配,且概率值排序位于第二位的所述句法树的概率值与概率值最大的所述句法树的概率值偏差小于偏差阈值时,将概率值排序位于第二位的所述句法树确定为最优句法树,以及将最优句法树具有的用户意图确定为最优用户最优句法树。
CN202110934690.8A 2021-07-29 2021-08-16 一种用户意图分析方法及装置 Pending CN114281952A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202110934690.8A CN114281952A (zh) 2021-08-16 2021-08-16 一种用户意图分析方法及装置
CN202280047134.1A CN117651943A (zh) 2021-07-29 2022-06-29 显示设备
PCT/CN2022/102456 WO2023005580A1 (zh) 2021-07-29 2022-06-29 显示设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110934690.8A CN114281952A (zh) 2021-08-16 2021-08-16 一种用户意图分析方法及装置

Publications (1)

Publication Number Publication Date
CN114281952A true CN114281952A (zh) 2022-04-05

Family

ID=80868456

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110934690.8A Pending CN114281952A (zh) 2021-07-29 2021-08-16 一种用户意图分析方法及装置

Country Status (1)

Country Link
CN (1) CN114281952A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023005580A1 (zh) * 2021-07-29 2023-02-02 海信视像科技股份有限公司 显示设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070208556A1 (en) * 2006-03-03 2007-09-06 Samsung Electronics Co., Ltd. Apparatus for providing voice dialogue service and method of operating the same
CN109948155A (zh) * 2019-03-12 2019-06-28 广东小天才科技有限公司 一种多意图的选择方法及装置、终端设备
CN110717337A (zh) * 2019-09-29 2020-01-21 北京声智科技有限公司 信息处理方法、装置、计算设备和存储介质
CN111783425A (zh) * 2020-06-28 2020-10-16 中国平安人寿保险股份有限公司 基于句法分析模型的意图识别方法及相关装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070208556A1 (en) * 2006-03-03 2007-09-06 Samsung Electronics Co., Ltd. Apparatus for providing voice dialogue service and method of operating the same
CN109948155A (zh) * 2019-03-12 2019-06-28 广东小天才科技有限公司 一种多意图的选择方法及装置、终端设备
CN110717337A (zh) * 2019-09-29 2020-01-21 北京声智科技有限公司 信息处理方法、装置、计算设备和存储介质
CN111783425A (zh) * 2020-06-28 2020-10-16 中国平安人寿保险股份有限公司 基于句法分析模型的意图识别方法及相关装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023005580A1 (zh) * 2021-07-29 2023-02-02 海信视像科技股份有限公司 显示设备

Similar Documents

Publication Publication Date Title
JP7335062B2 (ja) 音声サービス提供方法および装置
CN109165302B (zh) 多媒体文件推荐方法及装置
US9190052B2 (en) Systems and methods for providing information discovery and retrieval
US8775174B2 (en) Method for indexing multimedia information
US9646606B2 (en) Speech recognition using domain knowledge
WO2017096877A1 (zh) 一种推荐方法和装置
CN109036417B (zh) 用于处理语音请求的方法和装置
US20070208556A1 (en) Apparatus for providing voice dialogue service and method of operating the same
CN107526809B (zh) 基于人工智能推送音乐的方法和装置
CN105979376A (zh) 一种推荐方法和装置
WO2018045646A1 (zh) 基于人工智能的人机交互方法和装置
CN111626049B (zh) 多媒体信息的标题修正方法、装置、电子设备及存储介质
CN109545185B (zh) 交互系统评价方法、评价系统、服务器及计算机可读介质
KR101942459B1 (ko) 음원 컨텐츠 및 메타 정보를 이용한 플레이리스트 자동 생성 방법 및 시스템
CN107145509B (zh) 一种信息搜索方法及其设备
US20140161423A1 (en) Message composition of media portions in association with image content
CN111930974A (zh) 一种音视频类型的推荐方法、装置、设备及存储介质
CN109600625A (zh) 一种节目搜索方法、装置、设备及介质
CN115148212A (zh) 一种语音交互方法、智能设备及系统
CN114281952A (zh) 一种用户意图分析方法及装置
CN114547373A (zh) 一种基于音频智能识别搜索节目的方法
CN115734024A (zh) 音频数据处理方法、装置、设备及存储介质
CN116343771A (zh) 一种基于知识图谱的音乐点播语音指令识别方法、装置
CN111354350A (zh) 语音处理方法及装置、语音处理设备、电子设备
Stein et al. From raw data to semantically enriched hyperlinking: Recent advances in the LinkedTV analysis workflow

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination