WO2023185006A1

WO2023185006A1 - 一种工作模式设置方法及装置

Info

Publication number: WO2023185006A1
Application number: PCT/CN2022/132600
Authority: WO
Inventors: 张凯月; 张桂芳
Original assignee: 青岛海尔空调器有限总公司; 青岛海尔空调电子有限公司; 海尔智家股份有限公司
Priority date: 2022-03-29
Filing date: 2022-11-17
Publication date: 2023-10-05
Also published as: CN114863932A

Abstract

一种工作模式设置方法，包括：接收目标用户发送的目标语音信息（S1）；根据目标语音信息，获取目标用户被认定为目标群体的置信度（S2）；根据置信度，设置目标用户对应的工作模式（S3）。还涉及一种工作模式设置装置、电子设备、计算机刻度存储介质。提供的工作模式设置方法及装置，通过语音信息的置信度确定用户是否为特定的群体，进而自动设置该群体的定制化工作模式，无需提前录制声纹以及中间操作，简单直接，对于用户友好。

Description

一种工作模式设置方法及装置

相关申请的交叉引用

本申请要求于2022年3月29日提交的申请号为202210324202.6，名称为“一种工作模式设置方法及装置”的中国专利申请的优先权，其通过引用方式全部并入本文。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种工作模式设置方法。

背景技术

老年人因为年龄大了身体机能减弱，比较容易受到环境因素的影响而诱发各种疾病，室内空气污染常常会诱发哮喘，肺、功能减弱等呼吸系统疾病，且温度过低会引发关节疾病。

现有的空调控制需要老人先在应用程序(Application，APP)上录入声纹，再执行语音指令。

然而，声纹录入过程繁琐，老人对网络操作不熟悉不适应，学习困难。

发明内容

本申请提供一种工作模式设置方法及装置，用以解决现有技术中录入繁琐的缺陷，实现空调设置的便捷操作。

本申请提供一种工作模式设置方法，包括：接收目标用户发送的目标语音信息；

根据所述目标语音信息，获取所述目标用户被认定为目标群体的置信度；

根据所述置信度，设置所述目标用户对应的工作模式。

根据本申请提供的一种工作模式设置方法，所述根据所述目标语音信息，获取所述目标用户被认定为目标群体的置信度，包括：

在确定所述目标语音信息为开机指令的情况下，执行开机指令；

对所述目标语音信息进行声纹分析，获取目标声纹特征；

根据所述目标声纹特征，对所述目标用户与所述目标群体之间的声纹相似度进行打分，获取所述置信度。

根据本申请提供的一种工作模式设置方法，所述根据所述置信度，设置所述目标用户对应的工作模式，包括：

在确定所述置信度不小于预设阈值的情况下，确定所述目标用户为目标群体，以设置目标工作模式；

在确定所述置信度小于所述预设阈值，且处于预设置信度区间的情况下，生成工作模式语音提示；

接收回应指令，以设置所述目标工作模式；

所述回应指令是任一用户响应所述工作模式语音提示后输入的。

根据本申请提供的一种工作模式设置方法，在所述获取目标声纹特征之后，还包括：

比对所述目标声纹特征与所有注册用户的录入声纹特征；

在确定所述目标用户为注册用户的情况下，从注册信息中确定所述目标用户的年龄标签；

在根据所述年龄标签，确定所述目标用户为所述目标群体的情况下，设置目标工作模式。

根据本申请提供的一种工作模式设置方法，所述对所述目标语音信息进行声纹分析，获取目标声纹特征，包括：

对所述目标语音信息进行预加重，确定预加重语音信息；

对所述预加重语音信息进行分帧，确定分帧语音信息；

对所述分帧语音信息进行加窗，获取加窗语音信息；

对所述加窗语音信息进行声纹提取，获取所述目标语音信息的目标声纹特征。

根据本申请提供的一种工作模式设置方法，在所述接收目标用户发送的目标语音信息之后，还包括：

在确定开机状态的情况下，确定所述目标语音信息为打开目标模式指令；

根据所述打开目标模式指令，确定当前工作模式；

在确定所述当前工作模式为目标工作模式的情况下，生成已开启提示；

在确定所述当前工作模式不为所述目标工作模式的情况下，设置目标工作模式，并生成开启语音提示。

本申请还提供一种工作模式设置装置，包括：接收模块，用于接收目标用户发送的目标语音信息；

获取模块，用于根据所述目标语音信息，获取所述目标用户被认定为目标群体的置信度；

设置模块，用于根据所述置信度，设置所述目标用户对应的工作模式。

本申请还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述工作模式设置方法。

本申请还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述工作模式设置方法。

本申请还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述工作模式设置方法。

本申请提供的工作模式设置方法及装置，通过语音信息的置信度确定用户是否为特定的群体，进而自动设置该群体的定制化工作模式，无需提前录制声纹以及中间操作，简单直接，对于用户友好。

附图说明

为了更清楚地说明本申请或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请提供的工作模式设置方法的流程示意图之一；

图2是本申请提供的工作模式设置方法的流程示意图之二；

图3是本申请提供的工作模式设置装置的结构示意图；

图4是本申请提供的电子设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请中的附图，对本申请中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

现有智能空调的功能复杂，在录入声纹之后才可进行识别，但是录入的过程很繁琐，老人常常因为操作麻烦而放弃使用该功能；由于智能空调的功能名称纷繁复杂，即使录入了声纹，老人也常常无法叫出适合自己的模式，进而导致适合老人的功能无法使用；或是，老人不知道如何调空调才是最健康，最合适的。

而且现有的空调遥控器按键很小，老人看不清，很多时候都需要借助子女的帮助。

为了解决上述问题，本申请提供的工作模式设置方法，采用了非注册制声纹识别技术，老人无需在APP上录入自己的声纹，智能空调便可自动识别和判断用户是否为老人群体，并结合针对老人身体状况量身定制的老人模式。

下面结合图1至图4描述本申请的实施例所提供的工作模式设置方法及装置。

本申请实施例提供的工作模式设置方法，执行主体可以为电子设备或者电子设备中能够实现该工作模式设置方法的软件或功能模块或功能实体，本申请实施例中电子包括但不限于智能空调设备。需要说明的是，上述执行主体并不构成对本申请的限制。

图1是本申请提供的工作模式设置方法的流程示意图之一，如图1所示，包括但不限于以下步骤：

首先，在步骤S1中，接收目标用户发送的目标语音信息。

发送目标语音信息的目标用户可以是已录入声纹的注册用户，也可以为未录入声纹的非注册用户。

目标语音信息可以为开机指令，也可以为长辈关怀模式设置指令。

进一步地，在步骤S2中，根据所述目标语音信息，获取所述目标用户被认定为目标群体的置信度。

目标群体可以为老人群体。

在获取到目标语音信息之后，将该目标语音信息进行预加重、分帧和加窗等预处理，将预处理后的目标语音信息转换为声纹特征图。其中声纹特征图可以为梅尔能量谱图。梅尔能量谱图能表征人能听到的声音的频率分布，是人通过声音辨别事物的深层特征，利用这种在梅尔频域的分布特性，更适合构建说话人识别系统，语音信号经过这样的转换，语音信号就变为了携带声纹信息的图像，对于单个信号，其梅尔能量谱图是黑白的，可以理解为单通道的特征图。

将声纹特征图输入至预先训练好的打分神经网络模型，以得到对目标用户与老人群体的声纹相似度的打分，作为置信度。实现了智慧识人，使空调主动为用户服务，极其的便利。

打分神经网络模型经过大量的样本数据训练，样本数据包括样本用户的群体标签和样本声纹特征图，因此在输入目标用户的声纹特征图后，就可以得到目标用户的置信度。

进一步地，在步骤S3中，根据所述置信度，设置所述目标用户对应的工作模式。

在确定目标用户的置信度大于置信度阈值的情况下，确定目标用户为老人群体，则将工作模式设置为长辈关怀模式；在确定目标用户的置信度不大于置信度阈值的情况下，确定目标用户不为老人群体，则生成设置工作模式的提示，目标用户可以根据提示，进行空调工作模式的设置，可以包括温度、风速和风向等。

本申请提供的工作模式设置方法，通过语音信息的置信度确定用户是否为特定的群体，进而自动设置该群体的定制化工作模式，无需提前录制声纹以及中间操作，简单直接，对于用户友好。

可选地，所述根据所述目标语音信息，获取所述目标用户被认定为目标群体的置信度，包括：

对所述目标语音信息进行声纹分析，获取目标声纹特征；

在确定目标语音信息为开机指令的情况下，执行开机指令，开机后对目标语音信息进行声纹分析，提取目标语音信息的特征信息，并输入至声纹识别模型，输出为目标语音信息的目标声纹特征。声纹识别模型是一个深度神经网络模型，经大量中文语料训练而得，具有很强的抗噪性和鲁棒性。

将目标声纹特征输入至打分模型进行打分，得到目标语音信息为老人群体的置信度。

其中，打分模型是由多个样本声纹特征，以及每个样本声纹特征对应的年龄标签组成的训练样本，对神经网络模型进行训练后得到的。

可选地，所述对所述目标语音信息进行声纹分析，获取目标声纹特征，包括：

对所述目标语音信息进行预加重，确定预加重语音信息；

对所述预加重语音信息进行分帧，确定分帧语音信息；

对所述分帧语音信息进行加窗，获取加窗语音信息；

由于语音信号的平均功率谱受声门激励和口鼻辐射的影响，高频端大约在800赫兹(Hz)以上按6分贝/倍频程(dB/oct)衰减，频率越高相应的成分越小，为此要在对语音信号进行分析之前对其高频部分加以提升。可以利用数字滤波器实现对目标语音信息的预加重。

以10至20毫秒(ms)为间隔将声纹信号分为若干帧，一帧为一个基本单位，实现对预加重语音信息的分帧。

采用汉明窗函数对分帧语音信息来进行窗化。

根据本申请提供的工作模式设置方法，经过对目标语音信息的预加重、分帧和加窗，能够消除因为人类发声器官本身和由于采集语音信号的设备所带来的混叠、高次谐波失真、高频等等因素，对语音信号质量的影响。尽可能保证后续语音处理得到的信号更均匀、平滑，为信号参数提取提供优质的参数，提高语音处理质量。

可选地，在所述获取目标声纹特征之后，还包括：

比对所述目标声纹特征与所有注册用户的录入声纹特征；

将目标语音信息的目标声纹特征与所有注册用户已储存的录入声纹特征进行相似度计算；若得到的最高相似度高于设置的声纹阈值，则判定该最高相似度对应的录入声纹特征用户为目标语音信息的发出用户，可以根据该用户的注册信息确定年龄标签，并根据年龄标签，确定目标用户为老人群体，打开“长辈关怀模式”。长辈关怀模式是经过人体舒适研究院实验得出的针对老人的最优的空气解决方案。

若最高相似度低于设置的声纹阈值，则确定发送所述目标语音信息的对象不为注册用户。

在6月至9月的夏季期间，打开智能空调的人体舒适智能控制系统(PMV)，智能空调操作模式初始化(operation Mode＝0)，目标工作模式具体为：温度为27℃的制冷模式(target Temperature＝27℃)，风速为最低风(wind Speed＝3)，上下导板处于最大上吹位置1(wind Direction Vertical＝2)，空气洁净度为打开健康模式(health Mode＝true)。

在12月至2月的冬季期间，打开PMV，智能空调操作模式初始化(operation Mode＝0)，目标工作模式具体为：温度设为26℃的制热模式(target Temperature＝26℃)；风速设为最低风(wind Speed＝3)；上下导板位置处于最大下吹位置4(wind Direction Vertical＝6)，空气洁净度为打开健康模式(health Mode＝true)。调整为目标工作模式后，

在其他月份，打开PMV，智能空调操作模式初始化(operation Mode＝0)，目标工作模式具体为：温度设为26℃(target Temperature＝26℃)，在室内温度高于26℃的情况下制冷，在室内温度不高于26℃的情况下制热；风速为最低风(wind Speed＝3)，空气洁净度为打开健康模式(health Mode＝true)。

由于热空气轻容易上浮，冷空气重容易下沉，故夏季的上下导板处于上吹位置，冬季的上下导板处于下吹位置。

在智能空调调整为目标工作模式后，播报：“长辈关怀模式已开启，可以健康又舒服地吹空调啦！”

根据本申请提供的工作模式设置方法，通过声纹识别，对老人群体进行定制化呵护，提供最合适的空气方案。

可选地，在所述接收目标用户发送的目标语音信息之后，还包括：

根据所述打开目标模式指令，确定当前工作模式；

可选地，所述根据所述置信度，设置所述目标用户对应的工作模式，包括：

接收回应指令，以设置所述目标工作模式；

预设阈值可以为80；预设置信度区间可以为大于70到小于80。

图2是本申请提供的工作模式设置方法的流程示意图之二，如图2所示，包括：

第一方面，在空调关机的状态下，接收用户的语音唤醒指令，如“打开空调”，确认用户发出开机意图，执行语音唤醒指令，开机；

进一步地，在确定APP端老人声纹功能关闭的情况下，按照智能空调的原始逻辑，只执行用户的设置，并提示空调开机，播报“<device Name>打开了”；在确定APP端老人声纹功能开启的情况下，对语音唤醒指令进行声纹识别，获取置信度；

进一步地，在置信度不小于80的情况下，确定用户为老人，开启老人模式，播报“长辈关怀模式已开启，可以健康又舒服地吹空调啦！”

在置信度不大于70的情况下，确定用户不为老人，按照智能空调的原始逻辑，只执行用户的设置，并提示空调开机，播报“<device Name>打开了”；

在置信度大于70且小于80的情况下，生成设置语音提示，追问：是否需要为您打开长辈关怀模式；

进一步地，在用户没有回应的情况下，按照智能空调的原始逻辑，只执行用户的设置，并提示空调开机，播报“<device Name>打开了”；

在用户回应的情况下，确定用户的回应内容；

进一步地，在用户的回应内容不为肯定回答的情况下，按照智能空调的原始逻辑，只执行用户的设置，并提示空调开机，播报“<device Name>打开了”；

在用户的回应内容为肯定回答的情况下，开启老人模式，播报“长辈关怀模式已开启，可以健康又舒服地吹空调啦！”

第二方面，在空调开机的状态下，语音唤醒，用户主动发出切换到长辈关怀模式的意图，如“打开长辈关怀模式”；

进一步地，在当前未打开长辈关怀模式的情况下，开启老人模式，播报“长辈关怀模式已开启，可以健康又舒服地吹空调啦！”

在当前已打开长辈关怀模式的情况下，保持现有逻辑，播报“长辈关怀模式开着呢”。

表1为声纹触发老人模式表，包括自然语言生成(Natural Language Generation，NLG)的触发条件、NLG内容和入口语料。其中，智能空调的标识为设备名(device name)。

表1声纹触发老人模式表

其中，用户可以通过与智能空调配套的APP端的开关老人声纹功能，老人声纹功能的开关默认关闭，用户开启则生效。空调的语音侧云端接入声纹应用程序接口(Application Programming Interface，API)。用户可以在主控空调端唤醒小优，并发话“打开空调”。

声纹识别返回置信度至语音侧云端。

其中，置信度阈值和置信度区间可以依实际情况进行调整。

下面对本申请提供的工作模式设置装置进行描述，下文描述的工作模式设置装置与上文描述的工作模式设置方法可相互对应参照。

图3是本申请提供的工作模式设置装置的结构示意图，如图3所示，包括：

接收模块301，用于接收目标用户发送的目标语音信息；

获取模块302，用于根据所述目标语音信息，获取所述目标用户被认定为目标群体的置信度；

设置模块303，用于根据所述置信度，设置所述目标用户对应的工作模式。

首先，接收模块301接收目标用户发送的目标语音信息。

进一步地，获取模块302根据所述目标语音信息，获取所述目标用户被认定为目标群体的置信度。

目标群体可以为老人群体。

进一步地，设置模块303根据所述置信度，设置所述目标用户对应的工作模式。

本申请提供的工作模式设置装置，通过语音信息的置信度确定用户是否为特定的群体，进而自动设置该群体的定制化工作模式，无需提前录制声纹以及中间操作，简单直接，对于用户友好。

图4是本申请提供的电子设备的结构示意图，如图4所示，该电子设备可以包括：处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和通信总线440，其中，处理器410，通信接口420，存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令，以执行工作模式设置方法，该方法包括：接收目标用户发送的目标语音信息；根据所述目标语音信息，获取所述目标用户被认定为目标群体的置信度；根据所述置信度，设置所述目标用户对应的工作模式。

此外，上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本申请还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，计算机程序可存储在非暂态计算机可读存储介质上，所述计算机程序被处理器执行时，计算机能够执行上述各方法所提供的工作模式设置方法，该方法包括：接收目标用户发送的目标语音信息；根据所述目标语音信息，获取所述目标用户被认定为目标群体的置信度；根据所述置信度，设置所述目标用户对应的工作模式。

又一方面，本申请还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各方法提供的工作模式设置方法，该方法包括：接收目标用户发送的目标语音信息；根据所述目标语音信息，获取所述目标用户被认定为目标群体的置信度；根据所述置信度，设置所述目标用户对应的工作模式。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

一种工作模式设置方法，包括：

接收目标用户发送的目标语音信息；

根据所述目标语音信息，获取所述目标用户被认定为目标群体的置信度；

根据所述置信度，设置所述目标用户对应的工作模式。
根据权利要求1所述的工作模式设置方法，其中，所述根据所述目标语音信息，获取所述目标用户被认定为目标群体的置信度，包括：

在确定所述目标语音信息为开机指令的情况下，执行开机指令；

对所述目标语音信息进行声纹分析，获取目标声纹特征；

根据所述目标声纹特征，对所述目标用户与所述目标群体之间的声纹相似度进行打分，获取所述置信度。
根据权利要求1所述的工作模式设置方法，其中，所述根据所述置信度，设置所述目标用户对应的工作模式，包括：

在确定所述置信度不小于预设阈值的情况下，确定所述目标用户为目标群体，以设置目标工作模式；

在确定所述置信度小于所述预设阈值，且处于预设置信度区间的情况下，生成工作模式语音提示；

接收回应指令，以设置所述目标工作模式；

所述回应指令是任一用户响应所述工作模式语音提示后输入的。
根据权利要求2所述的工作模式设置方法，其中，在所述获取目标声纹特征之后，还包括：

比对所述目标声纹特征与所有注册用户的录入声纹特征；

在确定所述目标用户为注册用户的情况下，从注册信息中确定所述目标用户的年龄标签；

在根据所述年龄标签，确定所述目标用户为所述目标群体的情况下，设置目标工作模式。
根据权利要求2所述的工作模式设置方法，其中，所述对所述目标语音信息进行声纹分析，获取目标声纹特征，包括：

对所述目标语音信息进行预加重，确定预加重语音信息；

对所述预加重语音信息进行分帧，确定分帧语音信息；

对所述分帧语音信息进行加窗，获取加窗语音信息；

对所述加窗语音信息进行声纹提取，获取所述目标语音信息的目标声纹特征。
根据权利要求1所述的工作模式设置方法，其中，在所述接收目标用户发送的目标语音信息之后，还包括：

在确定开机状态的情况下，确定所述目标语音信息为打开目标模式指令；

根据所述打开目标模式指令，确定当前工作模式；

在确定所述当前工作模式为目标工作模式的情况下，生成已开启提示；

在确定所述当前工作模式不为所述目标工作模式的情况下，设置所述目标工作模式，并生成开启语音提示。
一种工作模式设置装置，包括：

接收模块，用于接收目标用户发送的目标语音信息；

获取模块，用于根据所述目标语音信息，获取所述目标用户被认定为目标群体的置信度；

设置模块，用于根据所述置信度，设置所述目标用户对应的工作模式。
一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其中，所述处理器执行所述程序时实现如权利要求1至6任一项所述工作模式设置方法。
一种非暂态计算机可读存储介质，其上存储有计算机程序，其中，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述工作模式设置方法。
一种计算机程序产品，包括计算机程序，其中，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述工作模式设置方法。