CN111260864A - 语音播报的控制方法、装置和空调 - Google Patents

语音播报的控制方法、装置和空调 Download PDF

Info

Publication number
CN111260864A
CN111260864A CN201811453975.4A CN201811453975A CN111260864A CN 111260864 A CN111260864 A CN 111260864A CN 201811453975 A CN201811453975 A CN 201811453975A CN 111260864 A CN111260864 A CN 111260864A
Authority
CN
China
Prior art keywords
voice
user
mode
environment
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811453975.4A
Other languages
English (en)
Inventor
李明杰
宋德超
贾巨涛
吴伟
胡志华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gree Electric Appliances Inc of Zhuhai
Original Assignee
Gree Electric Appliances Inc of Zhuhai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gree Electric Appliances Inc of Zhuhai filed Critical Gree Electric Appliances Inc of Zhuhai
Priority to CN201811453975.4A priority Critical patent/CN111260864A/zh
Publication of CN111260864A publication Critical patent/CN111260864A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B3/00Audible signalling systems; Audible personal calling systems
    • G08B3/10Audible signalling systems; Audible personal calling systems using electric transmission; using electromagnetic transmission

Landscapes

  • Physics & Mathematics (AREA)
  • Electromagnetism (AREA)
  • General Physics & Mathematics (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明提出一种语音播报的控制方法、装置和空调,其中方法包括:包括:获取用户状态和环境状态;根据用户状态和环境状态调节语音参数;按照语音参数进行语音播报。其中,用户状态包括用户位置和活动状态。通过检测用户状态和环境状态对应调节语音播报参数,解决了现有技术中语音播报模式过于单一化,用户在进行语音交互的过程中,体验效果较差的问题。

Description

语音播报的控制方法、装置和空调
技术领域
本发明涉及语音播报领域,特别涉及语音播报的控制方法、装置和空调。
背景技术
随着智能家居的发展,通过物联网技术实现各种设备间的互通连接,对家庭电器的影响巨大。智能家电技术的不断发展,对智能空调的交互方式及用户体验效果提出了更高的要求,主要是视觉和听觉方面。在智能语音空调的实际使用过程中,用户通过语音交互的方式对空调进行控制并使用相关扩展功能。但是,现有的空调在语音播报的过程中,存在音量过大或过小,音效不够人性化,使用户无法得到较好的体验效果。特别在用户在室内处于走动或者休息等不同状态下,对空调进行语音控制时,存在空调语音播报只有一种固定模式,影响用户的舒适度,带来不便。
因此,实现智能化语音播报,提高用户体验,是本领域亟待解决的问题。
发明内容
本发明提供了一种语音播报的控制方法、装置和空调,用于提高用户体验。
为了解决上述问题,作为本发明的一个方面,提供了一种语音播报的控制方法,包括:
获取用户状态和环境状态;
根据用户状态和环境状态调节语音参数;
按照语音参数进行语音播报。
其中,用户状态包括用户位置和活动状态。
可选的,根据用户状态和环境状态调节语音参数,包括:
建立神经网络模型,将用户状态和环境状态作为输入值,输出结果为语音参数。
可选的,根据用户状态和环境状态调节语音参数,包括:
根据用户状态和环境状态确定语音播报模式;
根据语音播报模式调节语音参数。
可选的,活动状态包括:运动状态和静止状态;
和/或,
环境状态包括:动态环境和静态环境;
和/或,
语音参数包括:幅度、频率和响度。
可选的,静态环境包括:会议环境、独自环境和/或无人环境。
可选的,根据用户的用户状态和环境状态确定语音播报模式,包括:
当用户状态为运动状态且环境状态为动态环境时,语音播报模式为活动模式;
和/或,当用户状态为静止状态且环境状态为动态环境时,语音播报模式为一般模式;
和/或,当环境状态为会议环境时,语音播报模式为会议模式;
和/或,当环境状态为独自环境时,语音播报模式为用户模式;
和/或,当环境状态为无人环境时,语音播报模式为静音模式。
可选的,根据语音播报模式调节语音参数,包括:
若语音播报模式为活动模式,调节声波参数以使音调位于第一频率范围、响度位于第一响度范围且音色为复音;和/或
若语音播报模式为一般模式,调节声波参数以使音调位于第二频率范围、响度位于第二响度范围且音色为泛音;和/或,
若语音播报模式为会议模式,调节声波参数以使音调位于第三频率范围,响度位于第三响度范围且音色为纯音;和/或,
若语音播报模式为用户模式,调节声波参数以满足预设语音参数;和/或,
若语音播报模式为静音模式,调节声波参数以使响度为0;
其中,声波参数包括振幅、频率和相位。
可选的,第一频率范围为:3kHz-5kHz;和/或,
第一响度范围为:80dB-100dB;和/或,
第二频率范围为:2kHz-3kHz;和/或,
第二响度范围为:50dB-70dB;和/或,
第三频率范围为:4kHz-5kHz;和/或,
第三响度范围为:30dB-40dB。
可选的,还包括:
接收用户对语音参数的用户反馈;
根据用户反馈对语音参数进行修正。
本申请还提出一种语音播报的控制装置,包括:
检测单元,用于获取用户状态和环境状态;
调节单元,用于根据用户状态和环境状态调节语音参数;
播报单元,用于按照语音参数进行语音播报。
其中,用户状态包括用户位置和活动状态。
可选的,调节单元根据用户状态和环境状态调节语音参数,包括:
建立神经网络模型,将用户状态和环境状态作为输入值,输出结果为语音参数。
可选的,调节单元根据用户状态和环境状态调节语音参数,包括:
根据用户状态和环境状态确定语音播报模式;
根据语音播报模式调节语音参数。
可选的,活动状态包括:运动状态和静止状态;
和/或,
环境状态包括:动态环境和静态环境;
和/或,
语音参数包括:幅度、频率和响度。
可选的,静态环境包括:会议环境、独自环境和/或无人环境。
可选的,调节单元根据用户的用户状态和环境状态确定语音播报模式,包括:
当用户状态为运动状态且环境状态为动态环境时,语音播报模式为活动模式;
和/或,当用户状态为静止状态且环境状态为动态环境时,语音播报模式为一般模式;
和/或,当环境状态为会议环境时,语音播报模式为会议模式;
和/或,当环境状态为独自环境时,语音播报模式为用户模式;
和/或,当环境状态为无人环境时,语音播报模式为静音模式。
可选的,调节单元根据语音播报模式调节语音参数,包括:
若语音播报模式为活动模式,调节声波参数以使音调位于第一频率范围、响度位于第一响度范围且音色为复音;和/或
若语音播报模式为一般模式,调节声波参数以使音调位于第二频率范围、响度位于第二响度范围且音色为泛音;和/或,
若语音播报模式为会议模式,调节声波参数以使音调位于第三频率范围,响度位于第三响度范围且音色为纯音;和/或,
若语音播报模式为用户模式,调节声波参数以满足预设语音参数;和/或,
若语音播报模式为静音模式,调节声波参数以使响度为0;
其中,声波参数包括振幅、频率和相位。
可选的,第一频率范围为:3kHz-5kHz;和/或,
第一响度范围为:80dB-100dB;和/或,
第二频率范围为:2kHz-3kHz;和/或,
第二响度范围为:50dB-70dB;和/或,
第三频率范围为:4kHz-5kHz;和/或,
第三响度范围为:30dB-40dB。
可选的,还包括:修正单元,用于接收用户对语音参数的用户反馈;
根据用户反馈对语音参数进行修正。
本申请还提出一种空调,具有语音播报装置,其特征在于,包括处理器、存储器以及存储在存储器上可在处理器上运行的程序,处理器执行程序时实现本申请提出的任一控制方法的步骤。
本申请还提出一种空调,其特征在于,包括本申请提出的任一的控制装置。
本发明提出了一种语音播报的控制方法、装置和空调,通过检测用户状态和环境状态对应调节语音播报参数,解决了现有技术中语音播报模式过于单一化,用户在进行语音交互的过程中,体验效果较差的问题。
附图说明
图1为本发明实施例中一种语音播报的控制方法的流程图;
图2为本发明实施例中一种语音播报的控制装置的组成图;
图3为本发明实施例中另一种语音播报的控制装置的组成图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、装置、产品或电器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或电器固有的其它步骤或单元。
在现有技术中,智能家居进行语音播报的模式非常单一,采用固定的音调、音色和音量进行播报,用户仅仅能够自己调节音量,或是从预存的几种声音中选择,而不能做到智能化定制,导致用户体验较差,难以选择到能够令自己满意的语音进行语音播报。
为了解决上述问题,实现智能化、个性化的语音播报,本申请中提出了一种语音播报的控制方法,如图1所示,包括:
S11:获取用户状态和环境状态;
具体的,用户状态包括用户位置和活动状态。本申请提出的控制方法可以用于空调、语音助手、洗衣机等具有语音播报装置的智能家电,可以采用摄像头采用拍照的方式结合图像分析技术获取用户状态和环境状态,环境状态具体可以当前环境的噪声强度、光线强度、是否有其他人等,噪声强度决定了语音播放时音量的大小,即声音响度,光线强度决定了此时用户是否希望进行语音播放以及音量大小,例如当光线较弱而用户没有开灯,且用户独自坐在屋子中,表明用户此时不希望被打扰,应当减少不必要的语音播报,并且尽可能采用柔和的方式进行语音播报。环境状态还可以包括当前的时间,例如在用户睡眠时间应当尽可能不进行语音播报或是采用柔和轻音的方式进行语音播报。用户状态还可以包括用户的姿势和表情,这些姿势和表情表征了用户此时的心境。
S12:根据用户状态和环境状态调节语音参数;
具体的,用户状态中的用户位置将影响音量大小,用户的活动状态决定了用户此时适宜听取的播报的语音的音色和音调,特别是用户状态还可以包括用户的表情,可以通过图像采集获取用户的表情,表情表征了用户的心境,这些决定了用户此时的心情,通过图像识别技术确定用户的表情对应的心情。本申请中不仅考虑了用户的动作和环境,还可以结合用户的心情,从而智能调节语音播放的时的语音参数,语音参数具体可以包括语音播放时的音调、响度和音色。
S13:按照语音参数进行语音播报。
与现有技术相比,本申请在进行语音播放前智能获取用户状态和环境状态,并对应调节语音参数,从而实现了个性化语音播报,给用户一种专属的独有的语音播报体验,解决了现有技术中语音播报时播报模式单一,不够智能的问题。
优选地,在一些可选的实施例中,根据用户状态和环境状态调节语音参数,包括:建立神经网络模型,将用户状态和环境状态作为输入值,输出结果为语音参数。
具体的,在本申请中使用的网络模型可以是卷积申请网络、残差神经网络和循环神经网络,优选为循环神经网络,在本申请中,神经网络模型可以设置在服务器中,本申请提出的控制方法在获取了用户状态和环境状态作为输入值后,将输入值发送到服务器,服务器接收该输入值,进行计算得到语音参数,在建立神经网络模型的初期,可以先预先采集用户以往设定的语音播报参数,建立输入和用户以往设定的语音播报参数的关系,也可以是预先通过大量实验采集不同的用户状态和环境状态下,人们最希望选取的语音参数,从而建立用户状态和环境状态与语音参数的神经网络模型,并且为了提高神经网络模型的准确度,在本申请中,可以不断接受用户对语音参数的反馈,根据反馈结果不断训练和优化神经网络模型,例如可以在进行语音播报的时候采集用户的表情和动作图像,根据表情和动作采用图像识别技术从中分析用户此时的心情,并与在进行语音播报之前用户的心情进行比对,通过比对结果确定用户的反馈,再根据反馈调节神经网络模型。
可选的,在本申请提出的控制方法中,根据用户状态和环境状态调节语音参数,包括:
根据用户状态和环境状态确定语音播报模式;
根据语音播报模式调节语音参数。
具体的,在本申请中根据不同的用户状态和环境状态预先设立了不同的语音播报模式,并且为各个语音播报模式设定了语音参数可调节的范围,在不同的语音播报模式下,只能将语音参数调节到预先设定的范围内。例如:当环境状态显示用户所在的当前环境较为安静,且用户状态显示用户正坐在椅子上看书,且椅子距离具有语音播报功能的设备的距离为2米时,此时应当限制播报的语音的响度小于预设响度。
可选的,为了进一步划分语音播报模式,在本申请中活动状态包括:运动状态和静止状态;运动模式表示用户处于运动状态,例如正在家里中跑步机上跑步,或是正在做家务,静止状态表示用户此时很少动,例如正坐在沙发上看电视或是正躺在床上休息,需要注意的是,静止状态并不意味用户完全不动,而是动作相对较少,重心移动较少,优选认为用户在5分钟内累积移动的距离小于5米时处于静止状态,否则处于运动状态。
可选的,环境状态包括:动态环境和静态环境;更进一步的,动态环境包括活动环境、聚会环境等,可选的,静态环境包括:会议环境、独自环境和/或无人环境。会议环境是指多个人正在开会,即检测到多个人,且多个人都处于清醒状态,并且彼此之间有交流,独自环境是指此时只有用户一人,无人环境是指当前未检测到任何用户。可选的,语音参数包括:幅度、频率和响度。在具体划分了用户状态和环境状态后,即可进一步依据换分后的用户状态和环境状态确定不同的语音播报模式。
可选的,根据用户的用户状态和环境状态确定语音播报模式,包括:
当用户状态为运动状态且环境状态为动态环境时,语音播报模式为活动模式;
和/或,当用户状态为静止状态且环境状态为动态环境时,语音播报模式为一般模式;
和/或,当环境状态为会议环境时,语音播报模式为会议模式;
和/或,当环境状态为独自环境时,语音播报模式为用户模式;
和/或,当环境状态为无人环境时,语音播报模式为静音模式。
具体的,以用户状态和环境状态具体将语音播报模式分为上述五种模式后,需要对应调节语音参数,从而最优化用户体验。
可选的,根据语音播报模式调节语音参数,包括:
若语音播报模式为活动模式,调节声波参数以使音调位于第一频率范围、响度位于第一响度范围且音色为复音;可选的,第一频率范围为:3kHz-5kHz;和/或,第一响度范围为:80dB-100dB;其中,声波参数包括振幅、频率和相位。
可选的,若语音播报模式为一般模式,调节声波参数以使音调位于第二频率范围、响度位于第二响度范围且音色为泛音;可选的,第二频率范围为:2kHz-3kHz;和/或,第二响度范围为:50dB-70dB;
可选的,若语音播报模式为会议模式,调节声波参数以使音调位于第三频率范围,响度位于第三响度范围且音色为纯音;可选的,第三频率范围为:4kHz-5kHz;和/或,第三响度范围为:30dB-40dB。
可选的,若语音播报模式为用户模式,调节声波参数以满足预设语音参数;具体的,预设语音参数可以是用户预先设定的语音参数也可以是默认或自动生成的语音参数。
可选的,若语音播报模式为静音模式,调节声波参数以使响度为0;此时处于无人环境,无需进行语音播报,因此设定响度为零。
具体的,如上述所示,在确定了不同的语音播报模式后,通过调节语音播报时播报语音的声波参数,即调节播报语音的振幅、频率和相位从而调节响度、音调和音色,在调节的过程中,可以预先建立如下所示函数:
T=a1x+b1y+c1z+d1
L=a2x+b2y+c2z+d2
P=a3x+b3y+c3z+d3
其中,x为振幅、y为频率、z为相位,T为音调、L为响度、P为音色、ai(1、2、3、4)为第一类参数、bi(1、2、3、4)为第二类参数、ci(1、2、3、4)为第三类参数、d i(1、2、3、4)为扰动项。
在上述三个函数中,x、y和z是可以控制的参数,第一类参数、第二类参数、第三类参数和扰动项是需要确定的参数,在具体计算过程中,可以先设定不同的第一类参数、第二类参数、第三类参数和扰动项,然后输入不同的x、y和z,得到理论计算结果,理论计算结果包括计算出的音调、音色和响度,再将计算的音调、音色和响度与实际值(实际的音调、音色和响度)进行比对,得到比对结果,通过不断的修正第一类参数、第二类参数、第三类参数和扰动项的具体数值,从而使得理论计算结果与实际值的差值位于可接受范围。从而得到第一类参数、第二类参数、第三类参数和扰动项的具体值,这一步骤可以在神经网络模型中进行,通过不断强化训练神经网络模型,以确定如何通过振幅、频率和相位调节音调、响度和音色。在确定了上述三个函数后,就得到了调节音调、音色和响度的方法,根据确定的语音播报模式,通过调节振幅、频率和相位将响度、音调和音色调节到对应的范围内。
需要注意的是,上述不同的语音播报模式中的音调、响度和音色是在不同的语音播报模式下语音参数所需要满足的基本条件,但在实际情况中,仍需要在上述条件的限制下,进一步调节语音参数以满足用户的需要。
可选的,本申请提出的控制方法,还包括:接收用户对语音参数的用户反馈;根据用户反馈对语音参数进行修正。
即本申请提出的控制方法在调节了语音参数进行语音播报后,会采集用户反馈,根据反馈以不断修正,从而满足用户需要。例如:本申请提出的控制方法可以用于具有语音播报功能的空调,空调可以与用户手机无线连接,在进行了语音播报之后,用户可以通过手机app对语音播报的效果进行评价或留言,根据用户的评价和留言对语音播报参数进行修正。用户反馈的结果可以是响度太大、音调过高等,则对应降低响度和音调。
为了更好的说明本申请提出的有益效果,以下提出另一优选实施例。
在本实施例中,以具有语音播报功能的空调为例,空调内置有摄像头,通过摄像头实时获取用户的位置、活动状态和环境状态,预先根据对人类的活动行为分析,可将用户的活动状态分为:运动状态和静止状态两大类。运动状态主要分为:行走状态、站姿状态,静止活动状态主要分为:坐姿状态、躺姿状态。根据对环境分析,可将环境状态分为:动态环境和静态环境。动态环境主要分为:运动环境状态、聚会环境状态,静态环境主要分为:会议环境状态、独自环境状态、无人环境状态。针对上述不同的用户状态和环境状态,将空调的语音播报主要分为三种五种模式:活动模式、一般模式、会议模式、用户模式、静音模式。当用户状态为运动状态且环境状态为动态环境时,语音播报模式为活动模式;当用户状态为静止状态且环境状态为动态环境时,语音播报模式为一般模式;当环境状态为会议环境时,语音播报模式为会议模式;当环境状态为独自环境时,语音播报模式为用户模式;当环境状态为无人环境时,语音播报模式为静音模式。
根据人类对声音的敏感特性,通过调节语音播报时声波的振幅、频率和相位,从而调节语音参数,即调节音调、响度和音色。针对上述五种语音播报模式在调节语音参数时需要满足表1要求:
表1各语音播报模式下语音参数的控制范围
语音播报播模式 音调 响度 音色
活动模式 <u>3kHz-5kHz</u> 80dB-100dB 复音
一般模式 <u>2kHz-3kHz</u> 50dB-70dB 泛音
会议模式 <u>4kHz-5kHz</u> 30dB-40dB 纯音
用户模式 自定义 自定义 自定义
静音模式 0 0 0
在调节语音参数中的音调、响度和音色时,需要满足表1中的限定,在具体调节音调、音色和响度时,是通过调节声波的振幅、频率和相位实现的。
先建立声波的振幅x、频率y和相位z与音调T、响度L、音色P以的函数关系:
T=a1x+b1y+c1z+d1
L=a2x+b2y+c2z+d2
P=a3x+b3y+c3z+d3
其中ai、bi、ci(i=1、2、3)分别是声波在振幅、频率和相位变量上的参数,di(i=1、2、3)是音调T、响度L和音色的扰动项。通过调整声波的振幅、频率和相位来控制不同语音播报模式下的音调、响度和音色。
在确定了语音参数中音调、响度和音色的控制范围和控制方法的情况下,还需要确定在不同的用户状态和环境状态下最优的语音参数,在本实施例中采用循环神经网络模型获取最优的语音参数,具体的,将用户状态和环境状态作为输入值上传到后台,采用循环神经网络模型对上传的输入值进行分析和学习,确定当前应采取的语音播报模式,在表1的限制范围内,确定语音播报时的音调、音色和响度。再结合振幅、频率和相位与音调、响度和音色的之间的函数关系,就可以通过调节语音播报时的振幅、频率和相位实现按照确定的语音参数进行语音播报。之后可以结合用户的反馈,对语音播报时的音调、响度和音色进行调整以满足用户需要。
本申请还提出一种语音播报的控制装置,如图2所示,包括:检测单元10、调节单元20和播报单元30。
检测单元10,用于获取用户状态和环境状态。具体的,用户状态包括用户位置和活动状态。本申请提出的控制装置可以用于空调、语音助手、洗衣机等具有语音播报装置的智能家电上,可以采用摄像头采用拍照的方式结合图像分析技术获取用户状态和环境状态,环境状态具体可以当前环境的噪声强度、光线强度、是否有其他人等,噪声强度决定了语音播放时音量的大小,即声音响度,光线强度决定了此时用户是否希望进行语音播放以及音量大小,例如当光线较弱而用户没有开灯,且用户独自坐在屋子中,表明用户此时不希望被打扰,应当减少不必要的语音播报,并且尽可能采用柔和的方式进行语音播报。环境状态还可以包括当前的时间,例如在用户睡眠时间应当尽可能不进行语音播报或是采用柔和轻音的方式进行语音播报。用户状态还可以包括用户的姿势和表情,这些姿势和表情表征了用户此时的心境。
调节单元20,用于根据用户状态和环境状态调节语音参数;具体的,用户状态中的用户位置将影响音量大小,用户的活动状态决定了用户此时适宜听取的播报的语音的音色和音调,特别是用户状态还可以包括用户的表情,表情表征了用户的心境,这些决定了用户此时的心情,本申请中不仅考虑了用户的动作和环境,还可以结合用户的心情,从而智能调节语音播放的时的语音参数,语音参数具体可以包括语音播放时的音调、响度和音色。
播报单元30,用于按照语音参数进行语音播报。
与现有技术相比,本申请提出的控制装置在进行语音播放前智能获取用户状态和环境状态,并对应调节语音参数,从而实现了个性化语音播报,给用户一种专属的独有的语音播报体验,解决了现有技术中语音播报时播报模式单一,不够智能的问题。
可选的,调节单元20根据用户状态和环境状态调节语音参数,包括:建立神经网络模型,将用户状态和环境状态作为输入值,输出结果为语音参数。
具体的,在本实施例中,调节单元20包括有神经网路模块,本实施例中使用的网络模型可以是卷积申请网络、残差神经网络和循环神经网络,优选为循环神经网络,在本申请中,神经网络模型可以设置在服务器中,本申请提出的控制装置在获取了用户状态和环境状态作为输入值后,将输入值发送到服务器,服务器接收该输入值,进行计算得到语音参数,在建立神经网络模型的初期,可以先预先采集用户以往设定的语音播报参数,建立输入和用户以往设定的语音播报参数的关系,也可以是预先通过大量实验采集不同的用户状态和环境状态下,人们最希望选取的语音参数,从而建立用户状态和环境状态与语音参数的神经网络模型,并且为了提高神经网络模型的准确度,在本申请中,可以不断接受用户对语音参数的反馈,根据反馈结果不断训练和优化神经网络模型,例如可以在进行语音播报的时候采集用户的表情和动作图像,根据表情和动作采用图像识别技术从中分析用户此时的心情,并与在进行语音播报之前用户的心情进行比对,通过比对结果确定用户的反馈,再根据反馈调节神经网络模型。
可选的,调节单元20根据用户状态和环境状态调节语音参数,包括:根据用户状态和环境状态确定语音播报模式;根据语音播报模式调节语音参数。
具体的,在本申请中根据不同的用户状态和环境状态预先设立了不同的语音播报模式,并且为各个语音播报模式设定了语音参数可调节的范围,在不同的语音播报模式下,只能将语音参数调节到预先设定的范围内。例如:当环境状态显示用户所在的当前环境较为安静,且用户状态显示用户正坐在椅子上看书,且椅子距离具有语音播报功能的设备的距离为2米时,此时应当限制播报的语音的响度小于预设响度。
可选的,为了进一步划分语音播报模式,在本申请中活动状态包括:运动状态和静止状态;运动模式表示用户处于运动状态,例如正在家里中跑步机上跑步,或是正在做家务,静止状态表示用户此时很少动,例如正坐在沙发上看电视或是正躺在床上休息,需要注意的是,静止状态并不意味用户完全不动,而是动作相对较少,重心移动较少。
可选的,环境状态包括:动态环境和静态环境;更进一步的,动态环境包括活动环境、聚会环境等,可选的,静态环境包括:会议环境、独自环境和/或无人环境。会议环境是指多个人正在开会,独自环境是指此时只有用户一人,无人环境是指当前未检测到任何用户。可选的,语音参数包括:幅度、频率和响度。在具体划分了用户状态和环境状态后,即可进一步依据换分后的用户状态和环境状态确定不同的语音播报模式。
可选的,调节单元20根据用户的用户状态和环境状态确定语音播报模式,包括:
当用户状态为运动状态且环境状态为动态环境时,语音播报模式为活动模式;
和/或,当用户状态为静止状态且环境状态为动态环境时,语音播报模式为一般模式;
和/或,当环境状态为会议环境时,语音播报模式为会议模式;
和/或,当环境状态为独自环境时,语音播报模式为用户模式;
和/或,当环境状态为无人环境时,语音播报模式为静音模式。
具体的,以用户状态和环境状态具体将语音播报模式分为上述五种模式后,需要对应调节语音参数,从而最优化用户体验。
调节单元根据语音播报模式调节语音参数,包括:
若语音播报模式为活动模式,调节声波参数以使音调位于第一频率范围、响度位于第一响度范围且音色为复音;可选的,第一频率范围为:3kHz-5kHz;和/或,第一响度范围为:80dB-100dB;其中,声波参数包括振幅、频率和相位。
可选的,若语音播报模式为一般模式,调节声波参数以使音调位于第二频率范围、响度位于第二响度范围且音色为泛音;可选的,第二频率范围为:2kHz-3kHz;和/或,第二响度范围为:50dB-70dB;
可选的,若语音播报模式为会议模式,调节声波参数以使音调位于第三频率范围,响度位于第三响度范围且音色为纯音;可选的,第三频率范围为:4kHz-5kHz;和/或,第三响度范围为:30dB-40dB。
可选的,若语音播报模式为用户模式,调节声波参数以满足预设语音参数;具体的,预设语音参数可以是用户预先设定的语音参数也可以是默认或自动生成的语音参数。
可选的,若语音播报模式为静音模式,调节声波参数以使响度为0;此时处于无人环境,无需进行语音播报,因此设定响度为零。
具体的,如上述所示,在确定了不同的语音播报模式后,播报单元30通过调节语音播报时播报语音的声波参数,即调节播报语音的振幅、频率和相位从而调节响度、音调和音色,在调节的过程中,可以预先建立如下所示三个函数:
T=a1x+b1y+c1z+d1
L=a2x+b2y+c2z+d2
P=a3x+b3y+c3z+d3
其中,x为振幅、y为频率、z为相位,T为音调、L为响度、P为音色、ai(1、2、3、4)为第一类参数、bi(1、2、3、4)为第二类参数、ci(1、2、3、4)为第三类参数、d i(1、2、3、4)为扰动项。
在上述三个函数中,x、y和z是可以控制的参数,第一类参数、第二类参数、第三类参数和扰动项是需要确定的参数,在具体计算过程中,可以先设定不同的第一类参数、第二类参数、第三类参数和扰动项,然后输入不同的x、y和z,得到理论计算结果,理论计算结果包括计算出的音调、音色和响度,再将计算的音调、音色和响度与实际值(实际的音调、音色和响度)进行比对,得到比对结果,通过不断的修正第一类参数、第二类参数、第三类参数和扰动项的具体数值,从而使得理论计算结果与实际值的差值位于可接受范围。从而得到第一类参数、第二类参数、第三类参数和扰动项的具体值,这一步骤可以在神经网络模型中进行,通过不断强化训练神经网络模型,以确定如何通过振幅、频率和相位调节音调、响度和音色。在确定了上述三个函数后,就得到了调节音调、音色和响度的方法,根据确定的语音播报模式,通过调节振幅、频率和相位将响度、音调和音色调节到对应的范围内。
需要注意的是,上述不同的语音播报模式中的音调、响度和音色是在不同的语音播报模式下语音参数所需要满足的基本条件,但在实际情况中,仍需要在上述条件的限制下,进一步调节语音参数以满足用户的需要。
因此,可选的,本申请提出的装置,还包括:修正单元40,用于接收用户对语音参数的用户反馈;根据用户反馈对语音参数进行修正。
即本申请提出的控制装置在调节了语音参数进行语音播报后,会采集用户反馈,根据反馈以不断修正,从而满足用户需要。例如:本申请提出的控制装置可以用于具有语音播报功能的空调,空调可以与用户手机无线连接,在进行了语音播报之后,用户可以通过手机app对语音播报的效果进行评价或留言,根据用户的评价和留言对语音播报参数进行修正。
本申请还提出一种空调,具有语音播报装置,包括处理器、存储器以及存储在存储器上可在处理器上运行的程序,处理器执行程序时实现本申请提出的任一控制方法的步骤。
本申请还提出另一种空调,其特征在于,包括本申请提出的任一的控制装置。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (20)

1.一种语音播报的控制方法,其特征在于,包括:
获取用户状态和环境状态;
根据所述用户状态和所述环境状态调节语音参数;
按照所述语音参数进行语音播报。
其中,所述用户状态包括用户位置和活动状态。
2.根据权利要求1所述的语音播报的控制方法,其特征在于,根据所述用户状态和所述环境状态调节语音参数,包括:
建立神经网络模型,将所述用户状态和所述环境状态作为输入值,输出结果为语音参数。
3.根据权利要求1-2任一项所述的语音播报的控制方法,其特征在于,根据所述用户状态和所述环境状态调节语音参数,包括:
根据所述用户状态和所述环境状态确定语音播报模式;
根据所述语音播报模式调节所述语音参数。
4.根据权利要求1-3任一项所述的语音播报的控制方法,其特征在于,
所述活动状态包括:运动状态和静止状态;
和/或,
所述环境状态包括:动态环境和静态环境;
和/或,
所述语音参数包括:幅度、频率和响度。
5.根据权利要求4所述的语音播报的控制方法,其特征在于,
所述静态环境包括:会议环境、独自环境和/或无人环境。
6.根据权利要求5所述的语音播报的控制方法,其特征在于,根据所述用户的用户状态和所述环境状态确定语音播报模式,包括:
当所述用户状态为运动状态且所述环境状态为动态环境时,所述语音播报模式为活动模式;
和/或,当所述用户状态为静止状态且所述环境状态为动态环境时,所述语音播报模式为一般模式;
和/或,当所述环境状态为会议环境时,所述语音播报模式为会议模式;
和/或,当所述环境状态为独自环境时,所述语音播报模式为用户模式;
和/或,当所述环境状态为无人环境时,所述语音播报模式为静音模式。
7.根据权利要求6所述的语音播报的控制方法,其特征在于,根据所述语音播报模式调节所述语音参数,包括:
若所述语音播报模式为活动模式,调节声波参数以使音调位于第一频率范围、响度位于第一响度范围且音色为复音;和/或
若所述语音播报模式为一般模式,调节声波参数以使音调位于第二频率范围、响度位于第二响度范围且音色为泛音;和/或,
若所述语音播报模式为会议模式,调节声波参数以使音调位于第三频率范围,响度位于第三响度范围且音色为纯音;和/或,
若所述语音播报模式为用户模式,调节声波参数以满足预设语音参数;和/或,
若所述语音播报模式为静音模式,调节声波参数以使响度为0;
其中,所述声波参数包括振幅、频率和相位。
8.根据权利要求7所述的语音播报的控制方法,其特征在于,
所述第一频率范围为:3kHz-5kHz;和/或,
所述第一响度范围为:80dB-100dB;和/或,
所述第二频率范围为:2kHz-3kHz;和/或,
所述第二响度范围为:50dB-70dB;和/或,
所述第三频率范围为:4kHz-5kHz;和/或,
所述第三响度范围为:30dB-40dB。
9.根据权利要求1-8任一项所述的语音播报的控制方法,其特征在于,还包括:
接收用户对所述语音参数的用户反馈;
根据所述用户反馈对所述语音参数进行修正。
10.一种语音播报的控制装置,其特征在于,包括:
检测单元,用于获取用户状态和环境状态;
调节单元,用于根据所述用户状态和所述环境状态调节语音参数;
播报单元,用于按照所述语音参数进行语音播报。
其中,所述用户状态包括用户位置和活动状态。
11.根据权利要求10所述的语音播报的控制装置,其特征在于,所述调节单元根据所述用户状态和所述环境状态调节语音参数,包括:
建立神经网络模型,将所述用户状态和所述环境状态作为输入值,输出结果为语音参数。
12.根据权利要求10-11任一项所述的语音播报的控制装置,其特征在于,所述调节单元根据所述用户状态和所述环境状态调节语音参数,包括:
根据所述用户状态和所述环境状态确定语音播报模式;
根据所述语音播报模式调节所述语音参数。
13.根据权利要求10-12任一项所述的语音播报的控制装置,其特征在于,
所述活动状态包括:运动状态和静止状态;
和/或,
所述环境状态包括:动态环境和静态环境;
和/或,
所述语音参数包括:幅度、频率和响度。
14.根据权利要求13所述的语音播报的控制装置,其特征在于,
所述静态环境包括:会议环境、独自环境和/或无人环境。
15.根据权利要求14所述的语音播报的控制装置,其特征在于,所述调节单元根据所述用户的用户状态和所述环境状态确定语音播报模式,包括:
当所述用户状态为运动状态且所述环境状态为动态环境时,所述语音播报模式为活动模式;
和/或,当所述用户状态为静止状态且所述环境状态为动态环境时,所述语音播报模式为一般模式;
和/或,当所述环境状态为会议环境时,所述语音播报模式为会议模式;
和/或,当所述环境状态为独自环境时,所述语音播报模式为用户模式;
和/或,当所述环境状态为无人环境时,所述语音播报模式为静音模式。
16.根据权利要求15所述的语音播报的控制装置,其特征在于,所述调节单元根据所述语音播报模式调节所述语音参数,包括:
若所述语音播报模式为活动模式,调节声波参数以使音调位于第一频率范围、响度位于第一响度范围且音色为复音;和/或
若所述语音播报模式为一般模式,调节声波参数以使音调位于第二频率范围、响度位于第二响度范围且音色为泛音;和/或,
若所述语音播报模式为会议模式,调节声波参数以使音调位于第三频率范围,响度位于第三响度范围且音色为纯音;和/或,
若所述语音播报模式为用户模式,调节声波参数以满足预设语音参数;和/或,
若所述语音播报模式为静音模式,调节声波参数以使响度为0;
其中,所述声波参数包括振幅、频率和相位。
17.根据权利要求16所述的语音播报的控制装置,其特征在于,
所述第一频率范围为:3kHz-5kHz;和/或,
所述第一响度范围为:80dB-100dB;和/或,
所述第二频率范围为:2kHz-3kHz;和/或,
所述第二响度范围为:50dB-70dB;和/或,
所述第三频率范围为:4kHz-5kHz;和/或,
所述第三响度范围为:30dB-40dB。
18.根据权利要求10-17任一项所述的语音播报的控制装置,其特征在于,还包括:修正单元,用于接收用户对所述语音参数的用户反馈;
根据所述用户反馈对所述语音参数进行修正。
19.一种空调,具有语音播报装置,其特征在于,包括处理器、存储器以及存储在存储器上可在处理器上运行的程序,所述处理器执行所述程序时实现权利要求1-9任一所述控制方法的步骤。
20.一种空调,其特征在于,包括如权利要求10-18任一所述的控制装置。
CN201811453975.4A 2018-11-30 2018-11-30 语音播报的控制方法、装置和空调 Pending CN111260864A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811453975.4A CN111260864A (zh) 2018-11-30 2018-11-30 语音播报的控制方法、装置和空调

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811453975.4A CN111260864A (zh) 2018-11-30 2018-11-30 语音播报的控制方法、装置和空调

Publications (1)

Publication Number Publication Date
CN111260864A true CN111260864A (zh) 2020-06-09

Family

ID=70953608

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811453975.4A Pending CN111260864A (zh) 2018-11-30 2018-11-30 语音播报的控制方法、装置和空调

Country Status (1)

Country Link
CN (1) CN111260864A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111930336A (zh) * 2020-07-29 2020-11-13 歌尔科技有限公司 音频设备的音量调节方法、设备及存储介质
CN112104965A (zh) * 2020-11-09 2020-12-18 北京声智科技有限公司 一种扩声方法及扩声系统
CN112614332A (zh) * 2020-12-10 2021-04-06 维沃移动通信有限公司 终端控制方法、装置和电子设备
CN112634916A (zh) * 2020-12-21 2021-04-09 久心医疗科技(苏州)有限公司 一种除颤器语音自动调节方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105135631A (zh) * 2015-10-16 2015-12-09 珠海格力电器股份有限公司 一种空调语音播报装置、空调及语音播报方法
CN106237558A (zh) * 2016-08-09 2016-12-21 北京长城电子装备有限责任公司 一种气压智能报警系统
CN106681686A (zh) * 2017-01-04 2017-05-17 广东美的制冷设备有限公司 播报控制方法、播报控制装置和空调器
CN106687958A (zh) * 2016-12-08 2017-05-17 深圳市汇顶科技股份有限公司 一种音频播放装置、系统及方法
CN108335700A (zh) * 2018-01-30 2018-07-27 上海思愚智能科技有限公司 语音调节方法、装置、语音交互设备及存储介质
US20180288104A1 (en) * 2017-03-30 2018-10-04 Intel Corporation Methods, systems and apparatus to enable voice assistant device communication

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105135631A (zh) * 2015-10-16 2015-12-09 珠海格力电器股份有限公司 一种空调语音播报装置、空调及语音播报方法
CN106237558A (zh) * 2016-08-09 2016-12-21 北京长城电子装备有限责任公司 一种气压智能报警系统
CN106687958A (zh) * 2016-12-08 2017-05-17 深圳市汇顶科技股份有限公司 一种音频播放装置、系统及方法
CN106681686A (zh) * 2017-01-04 2017-05-17 广东美的制冷设备有限公司 播报控制方法、播报控制装置和空调器
US20180288104A1 (en) * 2017-03-30 2018-10-04 Intel Corporation Methods, systems and apparatus to enable voice assistant device communication
CN108335700A (zh) * 2018-01-30 2018-07-27 上海思愚智能科技有限公司 语音调节方法、装置、语音交互设备及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111930336A (zh) * 2020-07-29 2020-11-13 歌尔科技有限公司 音频设备的音量调节方法、设备及存储介质
CN112104965A (zh) * 2020-11-09 2020-12-18 北京声智科技有限公司 一种扩声方法及扩声系统
CN112614332A (zh) * 2020-12-10 2021-04-06 维沃移动通信有限公司 终端控制方法、装置和电子设备
CN112634916A (zh) * 2020-12-21 2021-04-09 久心医疗科技(苏州)有限公司 一种除颤器语音自动调节方法及装置

Similar Documents

Publication Publication Date Title
CN111260864A (zh) 语音播报的控制方法、装置和空调
US11800318B2 (en) Systems and methods for playback device management
US20150271608A1 (en) Crowd sourced recommendations for hearing assistance devices
CN106162427B (zh) 一种声音获取元件的指向性调整方法和装置
CN110347367B (zh) 音量调节方法、终端设备、存储介质及电子设备
CN104272599B (zh) 用于输出音频的设备和方法
CN109741747B (zh) 语音场景识别方法和装置、语音控制方法和设备、空调
CN102946483B (zh) 一种控制提醒模式的方法和装置
CN103428326A (zh) 铃音调节处理方法及装置
CN102088648A (zh) 当听电输入时动态抑制周围噪声的方法
JP2022542387A (ja) 複数のスピーカーを通じた複数のオーディオ・ストリームの再生の管理
CN111492672B (zh) 听力设备及其操作方法
CN106303806B (zh) 音响系统的音量平衡控制方法及装置
CN108235181A (zh) 在音频处理装置中降噪的方法
CN114207715A (zh) 用于分布式音频设备的声学回声消除控制
CN110004659B (zh) 衣物处理设备及其控制方法
CN113949956A (zh) 降噪处理方法、装置、电子设备、耳机及存储介质
CN105704619A (zh) 音量调节方法及装置
CN112470496B (zh) 使用正常事物的听力性能和康复和/或复原增强
US20200296523A1 (en) Acoustic spot identification
US11818556B2 (en) User satisfaction based microphone array
CN109005486A (zh) 听力设备设置的试听,相关系统和听力设备
JPWO2019058673A1 (ja) 情報処理装置、情報処理端末、情報処理方法、および、プログラム
CN114283773A (zh) 用于语音设备降低环境噪声的方法和装置、存储介质
CN110173864B (zh) 空调器的控制方法、空调器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200609