CN112669832A - 一种智能设备的语义理解方法、智能设备、管理平台 - Google Patents

一种智能设备的语义理解方法、智能设备、管理平台 Download PDF

Info

Publication number
CN112669832A
CN112669832A CN201910933754.5A CN201910933754A CN112669832A CN 112669832 A CN112669832 A CN 112669832A CN 201910933754 A CN201910933754 A CN 201910933754A CN 112669832 A CN112669832 A CN 112669832A
Authority
CN
China
Prior art keywords
user
semantic understanding
voice
understanding model
management platform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910933754.5A
Other languages
English (en)
Inventor
杜国威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Anyun Century Technology Co Ltd
Original Assignee
Beijing Anyun Century Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Anyun Century Technology Co Ltd filed Critical Beijing Anyun Century Technology Co Ltd
Priority to CN201910933754.5A priority Critical patent/CN112669832A/zh
Publication of CN112669832A publication Critical patent/CN112669832A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种智能设备的语义理解方法、智能设备、管理平台,涉及智能设备技术领域,主要目的在于提高智能设备识别特定用户语义的准确率;主要技术方案包括:在输入语音指令的用户为特定用户时,确定所述用户的生理特征;将所述语音指令和所述用户的生理特征对应的发送至管理平台;接收所述管理平台下发的语义理解模型,其中,所述语义理解模型是所述管理平台基于所述语音指令更新其自身管理的语义理解模型中与所述生理特征相应的语义理解模型而得;基于所述语义理解模型对所述语音指令进行语义理解。

Description

一种智能设备的语义理解方法、智能设备、管理平台
技术领域
本发明涉及智能设备技术领域,特别是涉及一种智能设备的语义理解方法、智能设备、管理平台。
背景技术
随着科学技术的进步,智能音箱、智能电视等智能设备在人们的日常生活中被广泛应用。智能设备中设置有语义理解模型,基于语义理解智能设备对用于输入的语音执行进行语义理解,从而智能设备基于语义理解与用户进行交互。
目前,智能设备中的语义理解模型通常是智能设备出厂时设置的,无论智能设备被何种用户使用,智能设备中的语义理解模型均为出厂设置时的统一语义理解模型。但是,由于智能设备的用户群体广泛,用户的逻辑思维能力和语言表达能力不同,受限于语义理解模型的限制,智能设备对儿童等部分特征用户的语音指令无法准确进行语义理解。
发明内容
有鉴于此,本发明提出了一种智能设备的语义理解方法、智能设备、管理平台,主要目的在于提高智能设备识别特定用户语音的准确率。主要技术方案包括:
第一方面,本发明提供了一种智能设备的语义理解方法,应用于智能设备,该方法包括:
在输入语音指令的用户为特定用户时,确定所述用户的生理特征;
将所述语音指令和所述用户的生理特征对应的发送至管理平台;
接收所述管理平台下发的语义理解模型,其中,所述语义理解模型是所述管理平台基于所述语音指令更新其自身管理的语义理解模型中与所述生理特征相应的语义理解模型而得;
基于所述语义理解模型对所述语音指令进行语义理解。
第二方面,本发明提供了一种智能设备的语义理解方法,应用于管理平台,该方法包括:
接收智能设备对应发送的语音指令和用户的生理特征;
基于所述语音指令更新其自身管理的已有语义理解模型中与所述生理特征相应的语义理解模型;
向所述智能设备下发语义理解模型。
第三方面,本发明提供了一种智能设备,该智能设备包括:
第一确定单元,用于在输入语音指令的用户为特定用户时,确定所述用户的生理特征;
发送单元,用于将所述语音指令和所述用户的生理特征对应的发送至管理平台;
第一接收单元,拥有接收所述管理平台下发的语义理解模型,其中,所述语义理解模型是所述管理平台基于所述语音指令更新其自身管理的语义理解模型中与所述生理特征相应的语义理解模型而得;
处理单元,用于基于所述语义理解模型对所述语音指令进行语义理解。
第四方面,本发明提供了一种管理平台,该管理平台包括:
第二接收单元,用于接收智能设备对应发送的语音指令和用户的生理特征;
更新单元,用于基于所述语音指令更新其自身管理的已有语义理解模型中与所述生理特征相应的语义理解模型;
下发单元,用于向所述智能设备下发语义理解模型。
第五方面,本发明提供了一种智能设备管理系统,包括:第三方面所述的智能设备,以及第四方面所述的管理平台。
第六方面,本发明提供了一种计算机可读存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行第三方面所述的智能设备的语义理解方法,以及执行第二方面所述的智能设备的语义理解方法。
借由上述技术方案,本发明提供的一种智能设备的语义理解方法、智能设备、管理平台,首先智能设备在输入语音指令的用户为特定用户时,确定用户的生理特征,然后将语音指令和用户的生理特征对应的发送至管理平台,以使管理平台向智能设备下发基于语音指令更新其自身管理的语义理解模型中与生理特征相应的语义理解模型。在接收到管理平台下发的语义理解模型时,基于语义理解模型对语音指令进行语义理解。可见,本发明实施例中对特定用户的语音指令进行语义理解的语义理解模型,是根据特定用户的生理特征和语音指令有针对性的对已有语音理解模型优化调整而得,因此本发明提供的方案能够提高智能设备识别特定用户语义的准确率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明一个实施例提供的一种智能设备的语义理解方法的流程图;
图2示出了本发明另一个实施例提供的一种智能设备的语义理解方法的流程图;
图3示出了本发明又一个实施例提供的一种智能设备的语义理解方法的流程图;
图4示出了本发明一个实施例提供的一种智能设备的结构示意图;
图5示出了本发明另一个实施例提供的一种智能设备的结构示意图;
图6示出了本发明一个实施例提供的一种管理平台的结构示意图;
图7示出了本发明另一个实施例提供的一种管理平台的结构示意图;
图8示出了本发明一个实施例提供的一种智能设备管理系统的结构示意图。
具体实施方式
下面将参照附图更加详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
如图1所示,本发明实施例提供了一种智能设备的语义理解方法,该方法应用于智能设备,该方法主要包括:
101、在输入语音指令的用户为特定用户时,确定所述用户的生理特征。
本实施例中所述的智能设备的具体类型可以基于业务要求确定,本实施例中对智能设备的类型不作具体限定。可选的,智能设备可以包括但不限于智能音箱、智能手表、智能手机、智能电视、智能冰箱和智能玩具中的任意一种。一种实施方式中,智能设备能够与用户进行语音交互。智能设备通过拾取用户的语音指令与用户交互,其中,语音指令用于指示智能设备执行操作。
本实施例中对特定用户的具体类型不作具体限定,可选的,特定用户为语言沟通存在缺陷的人群。示例性的,特定用户至少包括如下中的任一种:儿童用户或语言障碍用户。其中,语言障碍用户是指语言功能受损的用户,比如,口吃用户或因某种疾病导致语言功能受损的用户。
在本实施例中,在接收到用户输入的语音指令时,需要判断该输入语音指令的用户是否为特定用户。若判断出该用户非特定用户,则利用面向语言功能正常的普通用户的语义理解模型对语音指令进行理解。若判断出该用户为特定用户时,则需要确定该用户的生理特征,以便利用与该用户生理特征相匹配的语义理解模型对语音指令进行理解,以便提高针对该用户语音指令进行语义理解的正确性。
下面对如何判断输入语音指令的用户为特定用户进行说明,该判断方法为至少包括如下几种:
第一种,对用户输入的语音指令进行意图分析,若分析出语音指令不具有完整意图时,确定输入语音指令的用户为特定用户。若分析出语音指令具有完成意图时,则说明输入语音指令的用户是普通用户而非特征用户。
具体的,对用户输入的语音指令进行意图分析的过程至少包括:将语音指令转换为文本,然后对文本进行分词和语义分析;当文本在语义层面不具有完整且可理解的意图时,则说明输入语音指令的用户为特定用户。当文本在语音层面具有完整且可理解的意图时,则说明输入语音指令的用于为普通用户。
示例性的,用户的语音指令为“小猪佩奇我要”,则该语音指令不具有完整且可理解的意图,则说明输入语音指令的用户为特定用户“儿童”。
第二种,确定用户输入语音指令时所述智能设备所处的运行模式,若确定出所述智能设备处于针对特征用户的运行模式时,确定输入语音指令的用户为特定用户。若确定出所述智能设备处于针对普通用户的运行模式时,确定输入语音指令的用户为普通用户。
具体的,本实施例对特征用户的运行模式不做具体限定。可选的,特定用户为“儿童”时,则针对儿童的运行模式为儿童模式。特定用户为“因疾病造成语言功能受损的用户”时,则针对该特定用户的运行模式为个性服务模式。
具体的,智能设备当前所处的运行模式,即默认为智能设备当前服务于该运行模式相应的人群。因此智能设备所处针对特征用户的运行模式时,智能设备所拾取到语音指令即为特定用户输入的语音指令。
示例性,智能设备当前处于儿童模式,当智能设备拾取到语音指令时,则默认输入该语音指令的用户为儿童。
第三种,对用户输入的语音指令进行声纹分析,若分析出所述语音指令符合预设的声纹条件时,确定输入语音指令的用户为特定用户。
具体的,由于不同人群具有不同的语音特征,因此可以通过声纹分析确定输入语音特征的用户是否为特定用户。
具体的,声纹分析的过程至少为:采用预设的声纹识别模型对语音指令进行声纹分析,得到语音指令对应的语音特征,将语音特征与特定用户的语音特征进行比对,当对比出语音指令的语音特征与特定用户的语音特征匹配时,则确定输入语音指令的用户为特定用户。当对比出语音指令的语音特征与特定用户的语音特征不匹配时,则确定输入语音指令的用户非特定用户。其中,预设的声纹识别模型至少可以为高斯混合模型-全局背景模型(gmm-ubm)。
示例性的,当对比出语音指令的语音特征与儿童的语音特征相同时,则确定输入语音指令的用户为儿童。
第四种,获取输入所述语音指令的用户的人脸图像,并分析所述人脸图像,若所述人脸图像符合预设的人脸条件时,确定输入语音指令的用户为特定用户。
具体的,由于不同人群具有不同的人脸特征,因此可以通过分析人脸图像确定输入语音特征的用户是否为特定用户。
具体的,在拾取到语音指令时,触发智能设备上的摄像头采集输入语音指令的用户的人脸图像,并对人脸图像进行分析。其中,人脸图像分析的过程至少为:采用预设的人脸识别模型对人脸图像进行识别,得到人脸图像对应的人脸特征,将人脸特征与特定用户的人脸特征进行比对,当对比出人脸图像的人脸特征与特定用户的人脸特征匹配时,则确定输入语音指令的用户为特定用户。当对比出人脸图像的人脸特征与特定用户的人脸特征不匹配时,则确定输入语音指令的用户非特定用户。其中,预设的人脸识别模型至少可以为卷积神经网络模型。
需要说明的是,上述的几种方法可以基于业务要求组合使用。比如,为了保证用户的隐私安全,不让摄像头随意采集用户的图像,则可将上述的第一种方法与第四种方法结合使用,结合判断输入语音指令的用户为特定用户的方法为:对用户输入的语音指令进行意图分析,若分析出语音指令不具有完整意图时,获取输入所述语音指令的用户的人脸图像,并分析所述人脸图像,若所述人脸图像符合预设的人脸条件时,确定输入语音指令的用户为特定用户。若分析出语音指令具有完成意图时,说明输入语音指令的用户是普通用户而非特征用户,则不用获取用户的人脸图像。
本实施例中所述的生理特征的种类基于特定用户的类型确定,且确定出的用户的生理特征至少包括如下三种:
第一种,生理特征为年龄,示例性的,在特定用户为儿童时,由于不同年龄段的儿童的语言表达能力不同,因此,特征用户为儿童时,选用的生理特征为年龄。
第二种,生理特征为语言障碍程度,示例性的,在特定用户为语言障碍用户时,由于语言功能受损程度不同,这些用户的语言表达能力不同,因此特征用于为语言障碍用户时,选用的生理特征为语言障碍程度。
第三种,生理特征为年龄和语言障碍程度,示例性在特定用户为语言功能受损的儿童时,则选用的生成特征为儿童和语言障碍程度。
下面对确定用户的生理特征的方法进行说明,该方法至少包括如下几种:
第一种,获取输入语音指令的用户的人脸图像,分析人脸图像确定该用户的年龄。
具体的,确定用户年龄的过程至少为:采用预设的人脸识别模型对人脸图像进行识别,得到人脸图像对应的人脸特征,将人脸特征与预设的人脸特征集合进行比对,其中,每一个人脸特征集合分别具有其各自对应的年龄。将包含用户人脸特征的人脸特征集合对应的年龄,确定为输入语音指令的用户的年龄。可选的,此种方法适用于特征用户为儿童的情况。
第二种,对用户输入的语音指令进行声纹分析;根据声纹分析结果,确定所述用户的年龄。
具体的,确定用户年龄的过程至少为:采用预设的声纹识别模型对语音指令进行声纹分析,得到语音指令对应的语音特征,将语音特征与预设的语音特征集合进行比对,其中,每一个语音特征集合分别具有其各自对应的年龄。将包含用户语音特征的语音特征集合对应的年龄,确定为输入语音指令的用户的年龄。可选的,此种方法适用于特征用户为儿童的情况。
第三种,对用户输入的语音指令进行声纹分析;根据声纹分析结果,确定所述用户的语言障碍程度。
具体的,确定用户年龄的过程至少为:采用预设的声纹识别模型对语音指令进行声纹分析,得到语音指令对应的语音特征,将语音特征与预设的语音特征集合进行比对,其中,每一个语音特征集合分别具有其各自对应的语言障碍程度。将包含用户语音特征的语音特征集合对应的语言障碍程度,确定为输入语音指令的用户的语言障碍程度。可选的,此种方法适用于特征用户为语言障碍用户的情况。需要说明的是,从语音特征包括的音高、音强、音长、音色、强度、波长、频率和节奏变化。
第四种,对用户输入的语音指令进行声纹分析;根据声纹分析结果,确定所述用户的年龄和语言障碍程度。
具体的,本方法是上述的第二种和第三种的结合,具体方法这里不再赘述,此种方法适用于特征用户为具有语言障碍的儿童用户的情况。
102、将所述语音指令和所述用户的生理特征对应的发送至管理平台。
本实施例中,需要将语音指令和生理特征对应的发送给管理平台,以便管理平台根据依据语音指令对生理特征对应的语义理解模型进行有针对性的更新。
103、接收所述管理平台下发的语义理解模型,其中,所述语义理解模型是所述管理平台基于所述语音指令更新其自身管理的语义理解模型中与所述生理特征相应的语义理解模型而得。
本实施例中,由于下发的语义理解模型是管理平台根据语音指令更新其自身管理的语义理解模型中与用户的生理特征相应的语义理解模型而得,因此,该语义理解模型更适用于输入语音指令的用户,能够对用户输入的语音指令进行正确语义理解。
本实施例中,管理平台下发的语义理解模型至少存在如下两种:
第一种,语义理解模型不仅能对具有其对应生理特征的特征用户进行准确性较高的语义理解,还能对不具有其对应生理特征的普通用户进行准确性较高的语义理解。
此种情况下,智能设备中仅设置一个语义理解模型,无论输入的语音指令的是普通用户还是特定用户,智能设备均是基于该一个语义理解模型对语音指令进行语义理解。
第二种,语义理解模型仅能对具有其对应生理特征的特征用户进行准确性较高的语义理解。
此种情况下,智能设备中设置两个语义理解模型,一个语义理解模型用户对普通用户输入的语音指令进行语义理解,另一个语义理解模型用户对特定用户输入的语音指令进行语义理解。
需要说明的是,在接收管理平台下发的语义理解模型时,利用该下发的语义理解模型更新智能设备中与该语义理解模型相应的语义理解模型,然后利用下发的语义理解模型进行语义理解。
104、基于所述语义理解模型对所述语音指令进行语义理解。
本实施例中,基于语义理解模型对语音指令进行语义理解的过程至少包括如下两种:
第一种,直接利用管理平台下发的语义理解模型对语音进行语义理解。
具体的,由于语义理解模型是管理平台基于用户的语音指令和生理特征进行调整和优化得到的,因此基于语义理解模型对语音指令进行语义理解时,语义理解针对性较高,从而提高了语义理解的准确率。
具体的,直接利用管理平台下发的语义理解模型对语音指令进行语义理解的过程为:将语音指令转换为文本,利用语义理解模型对文本进行句子检测、分词、词性标注、句法分析、文本分类/聚类、文字角度、信息抽取/自动摘要处理,确定文本的主题;基于主题确定语音指令对一个的语义理解结果。
第二种,对所述用户输入的至少部分历史语音指令和当前语音指令进行语义理解相关的分析,其中,所述历史语音指令是所述用户在输入当前语音指令之前用户输入的语音指令;基于分析结果更新所述语义理解模型,并利用更新后的语义理解模型对所述语音指令进行语义理解。
具体的,历史语音指令可以是该用户对智能设备已输入的全部语音指令。当然,在考虑到该用户的语言能力可以回随着时间的推移而逐渐提升,则仅提取临近当前时间之前的预设时间段内用户对智能设备已输入的语音指令。
具体的,对用户输入的至少部分历史语音指令和当前语音指令进行语义理解相关的分析,得到分析结果,更能反映出用户的语言使用习惯。因此基于分析结果更新所述语义理解模型能够获取到更能符合用户语言使用习惯的语义理解模型。
具体的,更新语义理解模型的过程可以为:将历史语音指令和当前语音指令转换为文本,对文本进行句子检测、分词、词性标注、句法分析、文本分类/聚类、文字角度、信息抽取/自动摘要处理,确定文本的特征。采用文本的特征为输入参数,至少采用神经网络对语义理解模型进行更新。
具体的,基于语义理解模型对语音指令进行语义理解之后,智能设备基于语义理解的结果,执行与语音指令相应的动作。
本发明实施例提供的一种智能设备的语义理解方法,首先智能设备在输入语音指令的用户为特定用户时,确定用户的生理特征,然后将语音指令和用户的生理特征对应的发送至管理平台,以使管理平台向智能设备下发基于语音指令更新其自身管理的语义理解模型中与生理特征相应的语义理解模型。在接收到管理平台下发的语义理解模型时,基于语义理解模型对语音指令进行语义理解。可见,本发明实施例中对特定用户的语音指令进行语义理解的语义理解模型,是根据特定用户的生理特征和语音指令有针对性的对已有语音理解模型优化调整而得,因此本发明实施例提供的方案能够提高智能设备识别特定用户语义的准确率。
如图2所示,本发明实施例提供了一种智能设备的语义理解方法,该方法应用于管理平台,该方法主要包括:
201、接收智能设备对应发送的语音指令和用户的生理特征。
本实施例中,在一个时间段可以接收到一个智能设备发送的语音指令和生理特征,也就同时接收到多个智能设备发送的语音指令。
202、基于所述语音指令更新其自身管理的已有语义理解模型中与所述生理特征相应的语义理解模型。
本实施例中,语义理解模型的更新策略至少包括如下两种:
第一种,在一个时间段可以接收到一个智能设备发送的语音指令和生理特征时,仅从已有语义理解模型中选取与所述生理特征相关的语义理解模型;对语音指令进行语义理解相关的分析;基于分析结果,更新已有语义理解模型中与生理特征相应的语义理解模型。
第二种,在一个时间段内同时接收到多个智能设备发送的语音指令时,从已有语义理解模型中选取与所述生理特征相关的语义理解模型;对对应与相同生理特征的语音指令一起记性语义理解相关的分析,得到针对每种生理特征的分析结果,利用各种生成特征的分析结果,更新与各生理特征响应的语义理解模型。
需要说明的是,上述两种策略中的语音指令分析过程可以为:将语音指令转换为文本,对文本进行句子检测、分词、词性标注、句法分析、文本分类/聚类、文字角度、信息抽取/自动摘要处理,确定文本的特征,该特征作为分析结果。更新语义理解模型的过程为:采用分析结果的特征为输入参数,至少采用神经网络对语义理解模型进行更新。
本实施例中,进一步的,若已有语义理解模型中不存在与生理特征相关的语义理解模型,则基于分析结果更新预设的语义理解模型。
203、向所述智能设备下发语义理解模型。
本发明实施例提供的一种智能设备的语义理解方法,首先管理平台接收智能设备对应发送的语音指令和用户的生理特征,并基于语音指令更新其自身管理的已有语义理解模型中与生理特征相应的语义理解模型。然后向智能设备下发语义理解模型。可见,本发明实施例中管理平台向智能设备下发的对特定用户的语音指令进行语义理解的语义理解模型,是根据特定用户的生理特征和语音指令有针对性的对已有语音理解模型优化调整而得,因此本发明实施例提供的方案能够提高智能设备识别特定用户语义的准确率。
进一步的,根据图1和图2所示的方法,本发明的另一个实施例还提供了一种智能设备的语义理解方法,该方法应用于智能设备和管理平台组成的智能设备管理系统,如图3所示,所述方法主要包括:
301、智能设备在接收到语音指令时,确定输入语音指令的用户是否为特定用户,在确定输入语音指令的用户为特征用户时,执行302。
302、智能设备在输入语音指令的用户为特定用户时,确定所述用户的生理特征。
303、智能设备将所述语音指令和所述用户的生理特征对应的发送至管理平台。
304、管理平台接收智能设备对应发送的语音指令和用户的生理特征。
305、管理平台基于所述语音指令更新其自身管理的已有语义理解模型中与所述生理特征相应的语义理解模型。
306、管理平台向所述智能设备下发语义理解模型。
307、智能设备接收所述管理平台下发的语义理解模型,其中,所述语义理解模型是所述管理平台基于所述语音指令更新其自身管理的语义理解模型中与所述生理特征相应的语义理解模型而得。
308、智能设备基于所述语义理解模型对所述语音指令进行语义理解。
进一步的,依据上述方法实施例,本发明的另一个实施例还提供了一种智能设备,如图4所示,所述智能设备包括:
第一确定单元41,用于在输入语音指令的用户为特定用户时,确定所述用户的生理特征;
发送单元42,用于将所述语音指令和所述用户的生理特征对应的发送至管理平台;
第一接收单元43,拥有接收所述管理平台下发的语义理解模型,其中,所述语义理解模型是所述管理平台基于所述语音指令更新其自身管理的语义理解模型中与所述生理特征相应的语义理解模型而得;
处理单元44,用于基于所述语义理解模型对所述语音指令进行语义理解。
本发明实施例提供的一种智能设备,首先智能设备在输入语音指令的用户为特定用户时,确定用户的生理特征,然后将语音指令和用户的生理特征对应的发送至管理平台,以使管理平台向智能设备下发基于语音指令更新其自身管理的语义理解模型中与生理特征相应的语义理解模型。在接收到管理平台下发的语义理解模型时,基于语义理解模型对语音指令进行语义理解。可见,本发明实施例中对特定用户的语音指令进行语义理解的语义理解模型,是根据特定用户的生理特征和语音指令有针对性的对已有语音理解模型优化调整而得,因此本发明实施例提供的方案能够提高智能设备识别特定用户语义的准确率。
可选的,如图5所示,该智能设备还包括:第二确定单元45,用于对用户输入的语音指令进行意图分析,若分析出所述语音指令不具有完整意图时,确定输入语音指令的用户为特定用户;或,
用于确定用户输入语音指令时所述智能设备所处的运行模式,若确定出所述智能设备处于针对特征用户的运行模式时,确定输入语音指令的用户为特定用户;或,
用于获取输入所述语音指令的用户的人脸图像,并分析所述人脸图像,若所述人脸图像符合预设的人脸条件时,确定输入语音指令的用户为特定用户;或,
用于对用户输入的语音指令进行声纹分析,若分析出所述语音指令符合预设的声纹条件时,确定输入语音指令的用户为特定用户。
可选的,如图5所示,所述第一确定单元41包括:
获取模块411,用于获取所述用户的人脸图像;
第一确定模块412,用于分析所述人脸图像,确定所述用户的年龄。
可选的,如图5所示,所述第一确定单元41包括:
分析单元413,用于对用户输入的语音指令进行声纹分析;
第二确定模块414,用于根据声纹分析结果,确定所述用户的年龄和/或语言障碍程度。
可选的,如图5所示,所述处理单元44包括:
分析模块441,用于对所述用户输入的至少部分历史语音指令和当前语音指令进行语义理解相关的分析,其中,所述历史语音指令是所述用户在输入当前语音指令之前用户输入的语音指令;
处理模块442,用于基于分析结果更新所述语义理解模型,并利用更新后的语义理解模型对所述语音指令进行语义理解。
本发明实施例提供的智能设备中,各个功能模块运行过程中所采用的方法详解可以参见图1和图3方法实施例的对应方法详解,在此不再赘述。
进一步的,依据上述方法实施例,本发明的另一个实施例还提供了一种管理平台,如图6所示,所述管理平台包括:
第二接收单元51,用于接收智能设备对应发送的语音指令和用户的生理特征;
更新单元52,用于基于所述语音指令更新其自身管理的已有语义理解模型中与所述生理特征相应的语义理解模型;
下发单元53,用于向所述智能设备下发语义理解模型。
本发明实施例提供的管理平台,首先管理平台接收智能设备对应发送的语音指令和用户的生理特征,并基于语音指令更新其自身管理的已有语义理解模型中与生理特征相应的语义理解模型。然后向智能设备下发语义理解模型。可见,本发明实施例中管理平台向智能设备下发的对特定用户的语音指令进行语义理解的语义理解模型,是根据特定用户的生理特征和语音指令有针对性的对已有语音理解模型优化调整而得,因此本发明实施例提供的方案能够提高智能设备识别特定用户语义的准确率。
可选的,如图7所示,所述更新单元52包括:
选取模块521,用于从已有语义理解模型中选取与所述生理特征相关的语义理解模型;
第一更新模块522,用于对所述语音指令进行语义理解相关的分析:基于分析结果,更新已有语义理解模型中与所述生理特征相应的语义理解模型。
可选的,如图7所示,所述更新单元52还包括:
第二更新模块523,用于若确定已有语义理解模型中不存在与所述生理特征相关的语义理解模型,则基于分析结果更新预设的语义理解模型。
本发明实施例提供的管理平台中,各个功能模块运行过程中所采用的方法详解可以参见图2和图3方法实施例的对应方法详解,在此不再赘述。
进一步的,依据上述实施例,如图8所示,本发明的另一个实施例还提供了一种智能设备管理系统,该智能设备管理系统包括:上述中任一所述的智能设备61,以及上述中任一所述的管理平台62。
本发明实施例提供的智能设备管理系统,由于管理平台向智能设备下发的对特定用户的语音指令进行语义理解的语义理解模型,是根据特定用户的生理特征和语音指令有针对性的对已有语音理解模型优化调整而得,因此本发明实施例提供的方案能够提高智能设备识别特定用户语义的准确率。
进一步的,依据上述实施例,本发明的另一个实施例还提供了一种计算机可读存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述中任意一项所述的应用于智能设备的智能设备的语义理解方法,以及上述中任意一项所述的应用于管理平台的智能设备的语义理解方法。
进一步的,依据上述实施例,本发明的另一个实施例还提供了一种存储管理设备,所述存储管理设备包括:
存储器,用于存储程序;
处理器,耦合至所述存储器,用于运行所述程序以执行上述中任意一项所述的应用于智能设备的智能设备的语义理解方法,以及上述中任意一项所述的应用于管理平台的智能设备的语义理解方法。
本发明实施例公开了:
A1.一种智能设备的语义理解方法,应用于智能设备,包括:
在输入语音指令的用户为特定用户时,确定所述用户的生理特征;
将所述语音指令和所述用户的生理特征对应的发送至管理平台;
接收所述管理平台下发的语义理解模型,其中,所述语义理解模型是所述管理平台基于所述语音指令更新其自身管理的语义理解模型中与所述生理特征相应的语义理解模型而得;
基于所述语义理解模型对所述语音指令进行语义理解。
A2.根据A1所述的方法,该方法还包括:
对用户输入的语音指令进行意图分析,若分析出所述语音指令不具有完整意图时,确定输入语音指令的用户为特定用户;或,
确定用户输入语音指令时所述智能设备所处的运行模式,若确定出所述智能设备处于针对特征用户的运行模式时,确定输入语音指令的用户为特定用户;或,
获取输入所述语音指令的用户的人脸图像,并分析所述人脸图像,若所述人脸图像符合预设的人脸条件时,确定输入语音指令的用户为特定用户;或,
对用户输入的语音指令进行声纹分析,若分析出所述语音指令符合预设的声纹条件时,确定输入语音指令的用户为特定用户。
A3.根据A1所述的方法,所述确定所述用户的生理特征,包括:
获取所述用户的人脸图像;
分析所述人脸图像,确定所述用户的年龄。
A4.根据A1所述的方法,所述确定所述用户的生理特征,包括:
对用户输入的语音指令进行声纹分析;
根据声纹分析结果,确定所述用户的年龄和/或语言障碍程度。
A5.根据A1所述的方法,所述基于所述语义理解模型对所述语音指令进行语义理解,包括:
对所述用户输入的至少部分历史语音指令和当前语音指令进行语义理解相关的分析,其中,所述历史语音指令是所述用户在输入当前语音指令之前用户输入的语音指令;
基于分析结果更新所述语义理解模型,并利用更新后的语义理解模型对所述语音指令进行语义理解。
B1.一种智能设备的语义理解方法,应用于管理平台,包括:
接收智能设备对应发送的语音指令和用户的生理特征;
基于所述语音指令更新其自身管理的已有语义理解模型中与所述生理特征相应的语义理解模型;
向所述智能设备下发语义理解模型。
B2.根据B1所述的方法,所述基于所述语音指令更新其自身管理的已有语义理解模型中与所述生理特征相应的语义理解模型,包括:
从已有语义理解模型中选取与所述生理特征相关的语义理解模型;
对所述语音指令进行语义理解相关的分析:
基于分析结果,更新已有语义理解模型中与所述生理特征相应的语义理解模型。
B3.根据B2所述的方法,该方法还包括:
若已有语义理解模型中不存在与所述生理特征相关的语义理解模型,则基于分析结果更新预设的语义理解模型。
C1.一种智能设备,包括:
第一确定单元,用于在输入语音指令的用户为特定用户时,确定所述用户的生理特征;
发送单元,用于将所述语音指令和所述用户的生理特征对应的发送至管理平台;
第一接收单元,拥有接收所述管理平台下发的语义理解模型,其中,所述语义理解模型是所述管理平台基于所述语音指令更新其自身管理的语义理解模型中与所述生理特征相应的语义理解模型而得;
处理单元,用于基于所述语义理解模型对所述语音指令进行语义理解。
C2.根据C1所述的智能设备,该智能设备还包括:第二确定单元,用于对用户输入的语音指令进行意图分析,若分析出所述语音指令不具有完整意图时,确定输入语音指令的用户为特定用户;或,
用于确定用户输入语音指令时所述智能设备所处的运行模式,若确定出所述智能设备处于针对特征用户的运行模式时,确定输入语音指令的用户为特定用户;或,
用于获取输入所述语音指令的用户的人脸图像,并分析所述人脸图像,若所述人脸图像符合预设的人脸条件时,确定输入语音指令的用户为特定用户;或,
用于对用户输入的语音指令进行声纹分析,若分析出所述语音指令符合预设的声纹条件时,确定输入语音指令的用户为特定用户。
C3.根据C1所述的智能设备,所述第一确定单元包括:
获取模块,用于获取所述用户的人脸图像;
第一确定模块,用于分析所述人脸图像,确定所述用户的年龄。
C4.根据C1所述的智能设备,所述第一确定单元包括:
分析单元,用于对用户输入的语音指令进行声纹分析;
第二确定模块,用于根据声纹分析结果,确定所述用户的年龄和/或语言障碍程度。
C5.根据C1述的智能设备,所述处理单元包括:
分析模块,用于对所述用户输入的至少部分历史语音指令和当前语音指令进行语义理解相关的分析,其中,所述历史语音指令是所述用户在输入当前语音指令之前用户输入的语音指令;
处理模块,用于基于分析结果更新所述语义理解模型,并利用更新后的语义理解模型对所述语音指令进行语义理解。
D1.一种管理平台,包括:
第二接收单元,用于接收智能设备对应发送的语音指令和用户的生理特征;
更新单元,用于基于所述语音指令更新其自身管理的已有语义理解模型中与所述生理特征相应的语义理解模型;
下发单元,用于向所述智能设备下发语义理解模型。
D2.根据D1所述的管理平台,所述更新单元包括:
选取模块,用于从已有语义理解模型中选取与所述生理特征相关的语义理解模型;
第一更新模块,用于对所述语音指令进行语义理解相关的分析:基于分析结果,更新已有语义理解模型中与所述生理特征相应的语义理解模型。
D3.根据D2所述的管理平台,所述更新单元还包括:
第二更新模块,用于若确定已有语义理解模型中不存在与所述生理特征相关的语义理解模型,则基于分析结果更新预设的语义理解模型。
E1.一种智能设备管理系统,包括:C1-C5中任一所述的智能设备,以及D1-D3中任一所述的管理平台。
F1.一种计算机可读存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行A1至A5中任意一项所述的智能设备的语义理解方法,以及执行B1至B3中任意一项所述的智能设备的语义理解方法。
G1.一种存储管理设备,所述存储管理设备包括:
存储器,用于存储程序;
处理器,耦合至所述存储器,用于运行所述程序以执行A1至A5中任意一项所述的智能设备的语义理解方法,以及执行B1至B3中任意一项所述的智能设备的语义理解方法。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
可以理解的是,上述方法及装置中的相关特征可以相互参考。另外,上述实施例中的“第一”、“第二”等是用于区分各实施例,而并不代表各实施例的优劣。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的深度神经网络模型的运行方法、装置及框架中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (10)

1.一种智能设备的语义理解方法,其特征在于,应用于智能设备,包括:
在输入语音指令的用户为特定用户时,确定所述用户的生理特征;
将所述语音指令和所述用户的生理特征对应的发送至管理平台;
接收所述管理平台下发的语义理解模型,其中,所述语义理解模型是所述管理平台基于所述语音指令更新其自身管理的语义理解模型中与所述生理特征相应的语义理解模型而得;
基于所述语义理解模型对所述语音指令进行语义理解。
2.根据权利要求1所述的方法,其特征在于,该方法还包括:
对用户输入的语音指令进行意图分析,若分析出所述语音指令不具有完整意图时,确定输入语音指令的用户为特定用户;或,
确定用户输入语音指令时所述智能设备所处的运行模式,若确定出所述智能设备处于针对特征用户的运行模式时,确定输入语音指令的用户为特定用户;或,
获取输入所述语音指令的用户的人脸图像,并分析所述人脸图像,若所述人脸图像符合预设的人脸条件时,确定输入语音指令的用户为特定用户;或,
对用户输入的语音指令进行声纹分析,若分析出所述语音指令符合预设的声纹条件时,确定输入语音指令的用户为特定用户。
3.根据权利要求1所述的方法,其特征在于,所述确定所述用户的生理特征,包括:
获取所述用户的人脸图像;
分析所述人脸图像,确定所述用户的年龄。
4.根据权利要求1所述的方法,其特征在于,所述确定所述用户的生理特征,包括:
对用户输入的语音指令进行声纹分析;
根据声纹分析结果,确定所述用户的年龄和/或语言障碍程度。
5.一种智能设备的语义理解方法,其特征在于,应用于管理平台,包括:
接收智能设备对应发送的语音指令和用户的生理特征;
基于所述语音指令更新其自身管理的已有语义理解模型中与所述生理特征相应的语义理解模型;
向所述智能设备下发语义理解模型。
6.一种智能设备,其特征在于,包括:
第一确定单元,用于在输入语音指令的用户为特定用户时,确定所述用户的生理特征;
发送单元,用于将所述语音指令和所述用户的生理特征对应的发送至管理平台;
第一接收单元,拥有接收所述管理平台下发的语义理解模型,其中,所述语义理解模型是所述管理平台基于所述语音指令更新其自身管理的语义理解模型中与所述生理特征相应的语义理解模型而得;
处理单元,用于基于所述语义理解模型对所述语音指令进行语义理解。
7.一种管理平台,其特征在于,包括:
第二接收单元,用于接收智能设备对应发送的语音指令和用户的生理特征;
更新单元,用于基于所述语音指令更新其自身管理的已有语义理解模型中与所述生理特征相应的语义理解模型;
下发单元,用于向所述智能设备下发语义理解模型。
8.一种智能设备管理系统,其特征在于,包括:权利要求6所述的智能设备,以及权利要求7所述的管理平台。
9.一种计算机可读存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至权利要求4中任意一项所述的智能设备的语义理解方法,以及执行权利要求5所述的智能设备的语义理解方法。
10.一种存储管理设备,其特征在于,所述存储管理设备包括:
存储器,用于存储程序;
处理器,耦合至所述存储器,用于运行所述程序以执行权利要求1至权利要求4中任意一项所述的智能设备的语义理解方法,以及执行权利要求5所述的智能设备的语义理解方法。
CN201910933754.5A 2019-09-29 2019-09-29 一种智能设备的语义理解方法、智能设备、管理平台 Pending CN112669832A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910933754.5A CN112669832A (zh) 2019-09-29 2019-09-29 一种智能设备的语义理解方法、智能设备、管理平台

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910933754.5A CN112669832A (zh) 2019-09-29 2019-09-29 一种智能设备的语义理解方法、智能设备、管理平台

Publications (1)

Publication Number Publication Date
CN112669832A true CN112669832A (zh) 2021-04-16

Family

ID=75399650

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910933754.5A Pending CN112669832A (zh) 2019-09-29 2019-09-29 一种智能设备的语义理解方法、智能设备、管理平台

Country Status (1)

Country Link
CN (1) CN112669832A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117059102A (zh) * 2023-10-12 2023-11-14 广州市零脉信息科技有限公司 一种智能儿童玩具对话系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117059102A (zh) * 2023-10-12 2023-11-14 广州市零脉信息科技有限公司 一种智能儿童玩具对话系统

Similar Documents

Publication Publication Date Title
US10977452B2 (en) Multi-lingual virtual personal assistant
US10410625B2 (en) Machine learning dialect identification
CN107665708B (zh) 智能语音交互方法及系统
US20220317641A1 (en) Device control method, conflict processing method, corresponding apparatus and electronic device
US9501743B2 (en) Method and apparatus for tailoring the output of an intelligent automated assistant to a user
JP4401155B2 (ja) ユーザとエージェント間の対話管理方法及び装置
US7539654B2 (en) User interaction management using an ongoing estimate of user interaction skills
JP7130194B2 (ja) ユーザ意図認識方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム
KR20210070213A (ko) 음성 사용자 인터페이스
CN110148405A (zh) 语音指令处理方法及装置、电子设备及存储介质
CN111161726B (zh) 一种智能语音交互方法、设备、介质及系统
KR20190024148A (ko) 음성 인식 장치 및 음성 인식 방법
CN110019777A (zh) 一种信息分类的方法及设备
CN109151366A (zh) 一种视频通话的声音处理方法
CN110544468A (zh) 应用唤醒方法、装置、存储介质及电子设备
US20060100851A1 (en) Voice processing system, method for allocating acoustic and/or written character strings to words or lexical entries
CN117292688B (zh) 一种基于智能语音鼠标的控制方法及智能语音鼠标
CN109074809A (zh) 信息处理设备、信息处理方法和程序
CN112581937A (zh) 一种语音指令的获得方法及装置
CN113330513B (zh) 语音信息处理方法及设备
CN112037772B (zh) 基于多模态的响应义务检测方法、系统及装置
CN112669832A (zh) 一种智能设备的语义理解方法、智能设备、管理平台
WO2019228140A1 (zh) 指令执行方法、装置、存储介质及电子设备
CN114333826B (zh) 一种适用于筋膜枪的控制方法及系统
CN111680514A (zh) 信息处理和模型训练方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210416