CN108335700A - 语音调节方法、装置、语音交互设备及存储介质 - Google Patents

语音调节方法、装置、语音交互设备及存储介质 Download PDF

Info

Publication number
CN108335700A
CN108335700A CN201810089944.9A CN201810089944A CN108335700A CN 108335700 A CN108335700 A CN 108335700A CN 201810089944 A CN201810089944 A CN 201810089944A CN 108335700 A CN108335700 A CN 108335700A
Authority
CN
China
Prior art keywords
voice
volume
information
feature parameter
input voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810089944.9A
Other languages
English (en)
Other versions
CN108335700B (zh
Inventor
李承敏
李封翔
韩帅
候健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Everything Workshop Intelligent Technology Co ltd
Original Assignee
Shanghai Si Yu Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Si Yu Intelligent Technology Co Ltd filed Critical Shanghai Si Yu Intelligent Technology Co Ltd
Priority to CN201810089944.9A priority Critical patent/CN108335700B/zh
Publication of CN108335700A publication Critical patent/CN108335700A/zh
Application granted granted Critical
Publication of CN108335700B publication Critical patent/CN108335700B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • User Interface Of Digital Computer (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明实施例公开了一种语音调节方法、装置、语音交互设备及存储介质。该方法包括:接收输入语音信息,确定所述输入语音信息的第一特征参数;根据所述输入语音信息的第一特征参数,调节待输出语音信息的第二特征参数。本发明实施例避免输出语音的特征参数恒定不变导致输出语音不能满足用户需求,用户体验差的问题,根据输入语音调节输出语音实现了输出语音跟随输入语音的不同而变化,保证输出语音与输入语音相适应,提高用户体验。

Description

语音调节方法、装置、语音交互设备及存储介质
技术领域
本发明实施例涉及语音处理技术,尤其涉及一种语音调节方法、装置、语音交互设备及存储介质。
背景技术
不同用户说话习惯不同,说话音量存在高低不同的差异;说话音量也会随着年龄的增长而变化,年龄越大,听力系统功能越差,导致用户自身说话音量提高。
目前具有语音交互功能的智能设备的应用越来越普遍,为人们的生产和生活带来很大便利。现有的语音交互智能设备在与人交互时,输出的音量大小固定,不能根据不同人的不同说话音量进行调节,存在输出音量过大或过小的情况,导致用户使用体验差。
发明内容
本发明实施例提供一种语音调节方法、装置、语音交互设备及存储介质,解决现有的语音交互智能设备的输出音量不能根据不同人的说话音量进行调节,存在输出音量过大或过小的情况,导致用户使用体验差的问题。
第一方面,本发明实施例提供了一种语音调节方法,该方法包括:
接收输入语音信息,确定所述输入语音信息的第一特征参数;
根据所述输入语音信息的第一特征参数,调节待输出语音信息的第二特征参数。
进一步地,所述第一特征参数包括第一音量,所述第二特征参数包括第二音量;相应地,所述根据所述输入语音信息的第一特征参数,调节待输出语音信息的第二特征参数,包括:
获取所述输入语音信息的第一音量;
根据所述第一音量确定所述第二音量,其中,所述第二音量与所述第一音量相匹配。
进一步地,根据所述第一音量确定所述第二音量,包括:
根据所述输入语音的第一语音振幅确定第一音量等级;
根据所述第一音量等级确定所述待输出语音信息的第二音量等级,并根据所述第二音量等级确定所述待输出语音信息的第二语音振幅,其中,所述第二音量等级与所述第一音量等级相匹配。
进一步地,接收输入语音信息包括基于至少两个语音接收器接收所述输入语音信息;相应地,确定所述输入语音信息的第一特征参数,包括:
根据所述输入语音信息的接收时间差确定发声源的位置信息;
根据所述发声源的位置信息,确定所述发声源的原始语音信息;
将所述输入语音信息更新为所述原始语音信息,并根据所述原始语音信息确定所述第一特征参数。
进一步地,所述第一特征参数包括第一语音周期,所述第二特征参数包括第二语音周期;相应地,所述根据所述输入语音信息的第一特征参数,调节待输出语音信息的第二特征参数,包括:
根据所述输入语音信息的第一语音周期确定第一语速;
根据所述第一语音周期确定所述第二语音周期,并根据所述第二语音周期确定所述待输出语音信息的第二语速,其中,所述第二语音周期与所述第一语音周期相匹配。
进一步地,所述第一特征参数包括时间信息,所述第二特征参数包括第三音量,相应地,所述根据所述输入语音信息的第一特征参数,调节待输出语音信息的第二特征参数,包括:
根据所述输入语音信息的时间信息,确定待输出语音信息的第三音量,所述第三音量与所述时间信息相匹配。
进一步地,根据所述输入语音信息的时间信息,确定待输出语音信息的第三音量,包括:
根据所述时间信息,确定用户的作息状态,其中所述作息状态根据作息学习模型确定;
根据所述作息状态,确定所述待输出语音信息的第三音量。
进一步地,在确定待输出语音信息的第三音量之后,还包括:
根据所述输入语音信息的第四音量对所述第三音量进行校正。
其中,所述第一特征参数包括声纹信息,所述第二特征参数包括第五音量;相应地,所述根据所述输入语音信息的第一特征参数,调节待输出语音信息的第二特征参数,包括:
根据所述输入语音信息的声纹信息确定年龄范围;
根据所述年龄范围确定所述待输出语音信息的第五音量。
进一步地,在根据所述年龄范围确定所述待输出语音信息的第五音量之后,还包括:
将所述声纹信息在预先存储的声纹数据库中进行匹配,确定所述声纹信息对应的用户信息;
根据所述用户信息确定用户的音量范围,并根据所述音量范围对所述第五音量进行校正,其中所述音量范围根据所述用户在预设时间段内历史播放音量确定。
第二方面,本发明实施例还提供了一种语音调节装置,该装置包括:
第一特征参数调节模块,用于接收输入语音信息,确定所述输入语音信息的第一特征参数;
第二特征参数调节模块,用于根据所述输入语音信息的第一特征参数,调节待输出语音信息的第二特征参数。
第三方面,本发明实施例还提供了一种语音交互设备,该设备包括:
至少一个麦克风;
至少一个扬声器;
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例第一方面任一所述的语音调节方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例第一方面任一所述的语音调节方法。
本发明实施例通过输入语音的第一特征参数调节输出语音的第二特征参数,避免输出语音的特征参数恒定不变导致输出语音不能满足用户需求,用户体验差的问题,根据输入语音调节输出语音实现了输出语音跟随输入语音的不同而变化,保证输出语音与输入语音相适应,提高用户体验。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图做一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的一种语音调节方法的流程示意图;
图2是本发明实施例二提供的一种语音调节方法的流程示意图;
图3是本发明实施例三提供的一种语音调节方法的流程示意图;
图4是本发明实施例四提供的一种语音调节方法的流程示意图;
图5是本发明实施例五提供的一种语音调节装置的结构示意图;
图6是本发明实施例六提供的一种语音交互设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,以下将参照本发明实施例中的附图,通过实施方式清楚、完整地描述本发明的技术方案,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
图1是本发明实施例一提供的一种语音调节方法的流程图。本实施例的技术方案可以适用于对语音交互设备例如智能音箱的输出语音进行调节的情况。该方法可以由本发明实施例提供的一种语音调节装置来执行,该装置可以采用软件和/或硬件的方式实现,并配置于智能音箱中应用。该方法具体包括如下操作:
S110、接收输入语音信息,确定所述输入语音信息的第一特征参数。
其中,输入语音信息例如可以是用户向音频采集装置发送的语音,音频采集装置例如可以是智能音箱,智能音箱接收输入语音信息,对输入语音进行特征提取,确定输入语音信息的第一特征参数。第一特征参数例如可以是音量、语音周期、输入语音的发生时间等信息。具体的特征提取方法根据第一特征参数的不同而不同。示例性地,第一特征参数为音量时,特征提取的方式可以是根据输入语音的振幅特性,确定输入语音信息的音量,其他确定音量的方式也可以,在此不做具体限定。
S120、根据所述输入语音信息的第一特征参数,调节待输出语音信息的第二特征参数。
智能音箱接收输入语音,根据输入语音和预设规则生成待输出语音,例如输入语音为“请帮我查看A市明天天气”,智能音箱通过查看天气网站的数据,获取到A市明天天气,将A市明天天气用语音的方式播放,A时明天天气的语音即为待输出语音。智能音箱根据输入语音的第一特征参数调节待输出语音的第二特征参数,第一特征参数和第二特征参数可以相同,也可以不相同。
可选地,所述第一特征参数包括第一音量,所述第二特征参数包括第二音量;相应地,所述根据所述输入语音信息的第一特征参数,调节待输出语音信息的第二特征参数,包括:获取所述输入语音信息的第一音量;根据所述第一音量确定所述第二音量,其中,所述第二音量与所述第一音量相匹配。
当第一音量为高音量时,可以将第二音量调节为高音量,当第一音量为低音量时,可以将第二音量调节为低音量。保证第一音量与第二音量相匹配,以便于用户大声说话时,音箱也能大声回应,用户小声说话时,音箱也小声回应,用户大声说话时,可以是用户距离音箱较远,也可以是用户为听力能力较弱的人,还可以是用户所处环境比较嘈杂;用户小声说话时,可以是用户距离音箱较近,用户所处环境较安静,或者用户所处环境有人睡觉。音箱的输出语音音量根据用户的输入语音音量调节,满足不同场景的需求,挺高用户体验。
进一步地,根据所述第一音量确定所述第二音量,包括:
根据所述输入语音的第一语音振幅确定第一音量等级;根据所述第一音量等级确定所述待输出语音信息的第二音量等级,并根据所述第二音量等级确定所述待输出语音信息的第二语音振幅,其中,所述第二音量等级与所述第一音量等级相匹配。
根据输入语音的第一语音振幅可以确定输入语音的音量,根据输入语音的音量确定第一音量等级,第一音量等级可以是包含输入语音音量的一个音量范围。例如输入语音的音量为50分贝,第一音量等级可以是45分贝~55分贝。根据第一音量等级确定第二音量等级,可以是与第一音量等级相同的音量范围,也可以是第二音量等级包含于第一音量等级中,例如第一音量等级是45分贝~55分贝,第二音量等级可以是45分贝~55分贝,第二音量等级还可以是48分贝~52分贝。假设第二音量等级是48分贝~52分贝,则在第二音量等级的音量分为中任选一个音量值作为待输出语音的音量,根据待输出语音的音量确定第二语音振幅。
在本实施例的另一优选实施方式中,接收输入语音信息包括基于至少两个语音接收器接收所述输入语音信息;相应地,确定所述输入语音信息的第一特征参数,包括:根据所述输入语音信息的接收时间差确定发声源的位置信息;根据所述发声源的位置信息,确定所述发声源的原始语音信息;将所述输入语音信息更新为所述原始语音信息,并根据所述原始语音信息确定所述第一特征参数。
语音接收器例如可以是麦克风阵列,配置于智能音箱中,通过至少两个语音接收器接收输入语音,可以根据语音接收器接收输入语音的时间差确定输入语音发声源的位置。由于声波在空气中以一定速度传播,到达设置于不同位置的语音接收器的相位不同,根据多个语音接收器对同一输入语音录制的相位差别,可以计算出同一输入声音到达每对麦克风的时间差值。合适的安排语音接收器的位置,可以使得双曲面的交点只有一个,该点即是输入语音发声源的位置。根据发声源的位置信息结合声音在空气中的衰减模型,将输入语音信息还原为原始语音信息,根据原始语音信息确定第一特征参数。由此可以保证输入语音的发声源距离智能音箱较远时,待输出语音的参数可以与原始语音参数保持一致,避免根据原始语音严重衰减得到的输入语音调节待输出语音不能满足用户需求,由此提高用户体验。
本发明实施例通过输入语音的第一特征参数调节输出语音的第二特征参数,避免输出语音的特征参数恒定不变导致输出语音不能满足用户需求,用户体验差的问题,根据输入语音调节输出语音实现了输出语音跟随输入语音的不同而变化,保证输出语音与输入语音相适应,提高用户体验。
实施例二
图2是本发明实施例二提供的一种语音调节方法的流程图。本发明实施例在上述实施例的基础上,进一步优化了所述第一特征参数包括第一语音周期,所述第二特征参数包括第二语音周期;相应地,优化了所述根据所述输入语音信息的第一特征参数,调节待输出语音信息的第二特征参数的操作。
相应地,本实施例的方法包括:
S210、接收输入语音信息,确定所述输入语音信息的第一特征参数,所述第一特征参数包括第一语音周期。
语音周期可以用语音频率表征,语音频率越大,语音周期越短,语音周期越短表明语速越快。
S220、根据所述输入语音信息的第一语音周期确定第一语速。
S230、根据所述第一语音周期确定第二语音周期,并根据所述第二语音周期确定所述待输出语音信息的第二语速,其中,所述第二语音周期与所述第一语音周期相匹配。
根据第一语音周期确定第二语音周期,第二语音周期可以与第一语音周期相同,也可以是与第一语音周期相差预设阈值范围内的周期值。根据第二语音周期确定第二语速,语速可以具体为每分钟说多少字
本发明实施例通过输入语音信息的第一语音周期确定待输出语音的第二语音周期,根据语音周期可以确定语速,实现待输出语音的语速与输入语音的语速一致,避免输入语音语速和待输出语音语速不一致导致的对话体验感差,从而提高用户体验。
实施例三
图3是本发明实施例三提供的一种语音调节方法的流程图。本发明实施例在上述实施例的基础上,进一步优化了第一特征参数包括时间信息,所述第二特征参数包括第三音量,相应地,优化了所述根据所述输入语音信息的第一特征参数,调节待输出语音信息的第二特征参数的操作。
相应地,本实施例的方法包括:
S310、接收输入语音信息,确定所述输入语音信息的第一特征参数,所述第一特征参数包括时间信息。
智能音箱可以根据接收到输入语音信息的时刻作为输入语音信息的时间信息,用户可以在任意时刻发送输入语音信息,智能音箱接收输入语音信息的时间也是任意的,即时间信息是任意的。
S320、根据所述输入语音信息的时间信息,确定待输出语音信息的第三音量,所述第三音量与所述时间信息相匹配。
凌晨时间多数人进入睡眠模式,道路上行驶车辆的汽笛声变少,周围环境相对寂静,上班时间环境相对嘈杂,中午午休时间环境相对寂静,如果输入语音信息的时间信息为凌晨时间或中午午休时间,则待输出语音信息的第三音量为音量小于预设阈值的小音量,上班时间待输出语音信息的第三音量为音量大于预设阈值的大音量,由此可以保证待输出音量根据时间信息进行自动调整,保证在环境寂静的休息时间音量小,在上班时间音量大,避免待输出语音的第三音量过大扰民或过小听不到的情况。
进一步地,根据所述输入语音信息的时间信息,确定待输出语音信息的第三音量,包括:
根据所述时间信息,确定用户的作息状态,其中所述作息状态根据作息学习模型确定;根据所述作息状态,确定所述待输出语音信息的第三音量。
用户的作息状态可以根据学习模型确定,例如可以是,针对某一家庭用户,统计该用户在晚上9点之后熄灯的概率为95%,在早上8点之后起床的概率为93%,在中午午休的概率为90%,且午休的时间的下午1点到下午2点,具体用户熄灯,起床或午休可以根据家庭摄像头确定,也可以检测家庭成员说话语音情况确定。根据输入语音信息的时间信息,可以确定该家庭用户所处的作息状态,根据作息状态确定待输出语音的第三音量,例如作息状态为休息,则第三音量为不能超过预设阈值的小音量,当作息状态为非休息状态时,第三音量为可以超过预设阈值的大音量。由此保证,待输出语音的音量与用户的作息状态相匹配,且待输出语音的音量可以适应不同用户的作息状态不同的情况,更能满足用户个性化需求差异,提高用户体验。
进一步地,在确定待输出语音信息的第三音量之后,还包括:
根据所述输入语音信息的第四音量对所述第三音量进行校正。
为避免根据输入语音的时间信息确定能够待输出语音的音量存在不能满足特殊场景的情况,例如在凌晨时间,输入语音音量大于待输出语音的音量阈值,此时可以表明用户没有在休息,如果输出语音音量仍然只根据时间信息确定音量则不能满足用户需要大声音的需求,因此,根据输入语音的第四音量对根据时间信息确定的第三音量进行校正,如果第四音量大,则第三音量也大,第四音量小,第三音量也小,保证待输出语音信息的第三音量满足用户需求。
本发明实施例通过输入语音的时间信息确定待输出语音的音量,保证待输出语音的音量根据休息时间而变化,避免对用户的打扰,提高用户体验。
实施例四
图4是本发明实施例四提供的一种语音调节方法的流程图。本发明实施例在上述实施例的基础上,进一步优化了所述第一特征参数包括声纹信息,所述第二特征参数包括第五音量;相应地,优化了所述根据所述输入语音信息的第一特征参数,调节待输出语音信息的第二特征参数的操作。
相应地,本实施例的方法包括:
S410、接收输入语音信息,确定所述输入语音信息的第一特征参数,所述第一特征参数包括声纹信息。
S420、根据所述输入语音信息的声纹信息确定年龄范围。
根据输入语音信息的声纹信息确定输入语音的发声者的年龄范围,具体可以采用声纹识别的方式确定年龄范围。
S430、根据所述年龄范围确定所述待输出语音信息的第五音量。
根据年龄范围确定待输出语音信息的第五音量具体可以是如果年龄范围为老年年龄,第五音量可以是大于预设阈值的大音量,以避免老人听力不好的情况;若年龄范围为中青年年龄,第五音量可以是音量在最大音量和最小音量之间的中音量;若年龄范围为少年年龄,第五音量可以是小于预设阈值的小音量,以避免对儿童听力的损坏。
进一步地,在根据所述年龄范围确定所述待输出语音信息的第五音量之后,还包括:
将所述声纹信息在预先存储的声纹数据库中进行匹配,确定所述声纹信息对应的用户信息;根据所述用户信息确定用户的音量范围,并根据所述音量范围对所述第五音量进行校正,其中所述音量范围根据所述用户在预设时间段内历史播放音量确定。
根据用户在预设时间段内的历史播放音量,可以得到用户在预设时间段内对音量大小的喜好,识别输入语音的声纹信息,确定用户信息,用户信息可以包括用户名称,根据用户名称调取用户在预设时间段内的历史播放音量,根据历史播放音量可以确定音量的最大值和音量的最小值,根据这一音量范围对待输出语音信息的第五音量进行校正,以避免只根据年龄确定的音量不能满足用户需求。通过年龄确定第五音量,根据用户习惯校正第五音量,保证第五音量确定的准确性。
本发明实施例通过对输入语音信息进行声纹识别,确定年龄范围,根据年龄范围确定待输出语音信息的音量,实现了待输出语音信息的音量根据输入语音的年龄不同而不同,提高音量的适应性,满足不同人群的使用需求。
实施例五
图5是本发明实施例五提供的一种语音调节装置的结构框图。该装置用于执行上述任意实施例所提供的一种语音调节方法。该装置包括:
第一特征参数调节模块510,用于接收输入语音信息,确定所述输入语音信息的第一特征参数;
第二特征参数调节模块520,用于根据所述输入语音信息的第一特征参数,调节待输出语音信息的第二特征参数。
进一步地,所述第一特征参数包括第一音量,所述第二特征参数包括第二音量;相应地,所述第二特征参数调节模块520包括:
第一音量获取单元,用于获取所述输入语音信息的第一音量;
第二音量获取单元,用于根据所述第一音量确定所述第二音量,其中,所述第二音量与所述第一音量相匹配。
进一步地,所述第二音量获取单元具体用于:
根据所述输入语音的第一语音振幅确定第一音量等级;
根据所述第一音量等级确定所述待输出语音信息的第二音量等级,并根据所述第二音量等级确定所述待输出语音信息的第二语音振幅,其中,所述第二音量等级与所述第一音量等级相匹配。
基于至少两个语音接收器接收所述输入语音信息;
根据所述输入语音信息的接收时间差确定发声源的位置信息;
根据所述发声源的位置信息,确定所述发声源的原始语音信息;
将所述输入语音信息更新为所述原始语音信息,并根据所述原始语音信息确定所述第一特征参数。
进一步地,所述第一特征参数包括第一语音周期,所述第二特征参数包括第二语音周期;相应地,所述第二特征参数调节模块520具体用于:
根据所述输入语音信息的第一语音周期确定第一语速;
根据所述第一语音周期确定所述第二语音周期,并根据所述第二语音周期确定所述待输出语音信息的第二语速,其中,所述第二语音周期与所述第一语音周期相匹配。
进一步地,所述第一特征参数包括时间信息,所述第二特征参数包括第三音量,相应地,所述第二特征参数调节模块520包括:
第三音量确定单元,用于根据所述输入语音信息的时间信息,确定待输出语音信息的第三音量,所述第三音量与所述时间信息相匹配。
进一步地,所述第三音量确定单元具体用于:
根据所述时间信息,确定用户的作息状态,其中所述作息状态根据作息学习模型确定;
根据所述作息状态,确定所述待输出语音信息的第三音量。
进一步地,该装置还包括:
第三音量校正模块,用于在确定待输出语音信息的第三音量之后,根据所述输入语音信息的第四音量对所述第三音量进行校正。
进一步地,所述第一特征参数包括声纹信息,所述第二特征参数包括第五音量;相应地,所述第二特征参数调节模块520具体用于:
根据所述输入语音信息的声纹信息确定年龄范围;
根据所述年龄范围确定所述待输出语音信息的第五音量。
进一步地,该装置还包括:
第五音量校正模块,用于在根据所述年龄范围确定所述待输出语音信息的第五音量之后,将所述声纹信息在预先存储的声纹数据库中进行匹配,确定所述声纹信息对应的用户信息;
根据所述用户信息确定用户的音量范围,并根据所述音量范围对所述第五音量进行校正,其中所述音量范围根据所述用户在预设时间段内历史播放音量确定。
本发明实施例五提供的语音调节装置,根据输入语音调节输出语音实现了输出语音跟随输入语音的不同而变化,保证输出语音与输入语音相适应,提高用户体验。
本发明实施例所提供的语音调节装置可执行本发明任意实施例所提供的语音调节方法,具备执行方法相应的功能模块和有益效果。
实施例六
图6为本发明实施例六提供的一种语音交互设备的结构示意图,如图6所示,该语音交互设备包括至少一个麦克风,至少一个扬声器和处理器60、存储器61、输入装置62和输出装置63;设备中处理器60的数量可以是一个或多个,图6中以一个处理器60为例;设备中的处理器60、存储器61、输入装置62和输出装置63可以通过总线或其他方式连接,图6中以通过总线连接为例。
存储器61作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的音频处理方法对应的程序指令/模块(例如,第一特征参数调节模块510和第二特征参数调节模块520)。处理器60通过运行存储在存储器61中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的语音调节方法。
存储器61主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器61可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器61可进一步包括相对于处理器60远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置62可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置63可包括显示屏等显示设备。
实施例七
本发明实施例七还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种语音调节方法,该方法包括:
接收输入语音信息,确定所述输入语音信息的第一特征参数;
根据所述输入语音信息的第一特征参数,调节待输出语音信息的第二特征参数。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的语音调节方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (13)

1.一种语音调节方法,其特征在于,包括:
接收输入语音信息,确定所述输入语音信息的第一特征参数;
根据所述输入语音信息的第一特征参数,调节待输出语音信息的第二特征参数。
2.根据权利要求1所述的方法,其特征在于,所述第一特征参数包括第一音量,所述第二特征参数包括第二音量;相应地,所述根据所述输入语音信息的第一特征参数,调节待输出语音信息的第二特征参数,包括:
获取所述输入语音信息的第一音量;
根据所述第一音量确定所述第二音量,其中,所述第二音量与所述第一音量相匹配。
3.根据权利要求2所述的方法,其特征在于,根据所述第一音量确定所述第二音量,包括:
根据所述输入语音的第一语音振幅确定第一音量等级;
根据所述第一音量等级确定所述待输出语音信息的第二音量等级,并根据所述第二音量等级确定所述待输出语音信息的第二语音振幅,其中,所述第二音量等级与所述第一音量等级相匹配。
4.根据权利要求1-3任一所述的方法,其特征在于,接收输入语音信息包括基于至少两个语音接收器接收所述输入语音信息;相应地,确定所述输入语音信息的第一特征参数,包括:
根据所述输入语音信息的接收时间差确定发声源的位置信息;
根据所述发声源的位置信息,确定所述发声源的原始语音信息;
将所述输入语音信息更新为所述原始语音信息,并根据所述原始语音信息确定所述第一特征参数。
5.根据权利要求1所述的方法,其特征在于,所述第一特征参数包括第一语音周期,所述第二特征参数包括第二语音周期;相应地,所述根据所述输入语音信息的第一特征参数,调节待输出语音信息的第二特征参数,包括:
根据所述输入语音信息的第一语音周期确定第一语速;
根据所述第一语音周期确定所述第二语音周期,并根据所述第二语音周期确定所述待输出语音信息的第二语速,其中,所述第二语音周期与所述第一语音周期相匹配。
6.根据权利要求1所述的方法,其特征在于,所述第一特征参数包括时间信息,所述第二特征参数包括第三音量,相应地,所述根据所述输入语音信息的第一特征参数,调节待输出语音信息的第二特征参数,包括:
根据所述输入语音信息的时间信息,确定待输出语音信息的第三音量,所述第三音量与所述时间信息相匹配。
7.根据权利要求6所述的方法,其特征在于,根据所述输入语音信息的时间信息,确定待输出语音信息的第三音量,包括:
根据所述时间信息,确定用户的作息状态,其中所述作息状态根据作息学习模型确定;
根据所述作息状态,确定所述待输出语音信息的第三音量。
8.根据权利要求6或7所述的方法,其特征在于,在确定待输出语音信息的第三音量之后,还包括:
根据所述输入语音信息的第四音量对所述第三音量进行校正。
9.根据权利要求1所述的方法,其特征在于,所述第一特征参数包括声纹信息,所述第二特征参数包括第五音量;相应地,所述根据所述输入语音信息的第一特征参数,调节待输出语音信息的第二特征参数,包括:
根据所述输入语音信息的声纹信息确定年龄范围;
根据所述年龄范围确定所述待输出语音信息的第五音量。
10.根据权利要求9所述的方法,其特征在于,在根据所述年龄范围确定所述待输出语音信息的第五音量之后,还包括:
将所述声纹信息在预先存储的声纹数据库中进行匹配,确定所述声纹信息对应的用户信息;
根据所述用户信息确定用户的音量范围,并根据所述音量范围对所述第五音量进行校正,其中所述音量范围根据所述用户在预设时间段内历史播放音量确定。
11.一种语音调节装置,其特征在于,包括:
第一特征参数调节模块,用于接收输入语音信息,确定所述输入语音信息的第一特征参数;
第二特征参数调节模块,用于根据所述输入语音信息的第一特征参数,调节待输出语音信息的第二特征参数。
12.一种语音交互设备,其特征在于,包括:
至少一个麦克风;
至少一个扬声器;
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-10中任一所述的语音调节方法。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-10中任一所述的语音调节方法。
CN201810089944.9A 2018-01-30 2018-01-30 语音调节方法、装置、语音交互设备及存储介质 Active CN108335700B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810089944.9A CN108335700B (zh) 2018-01-30 2018-01-30 语音调节方法、装置、语音交互设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810089944.9A CN108335700B (zh) 2018-01-30 2018-01-30 语音调节方法、装置、语音交互设备及存储介质

Publications (2)

Publication Number Publication Date
CN108335700A true CN108335700A (zh) 2018-07-27
CN108335700B CN108335700B (zh) 2021-07-06

Family

ID=62926748

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810089944.9A Active CN108335700B (zh) 2018-01-30 2018-01-30 语音调节方法、装置、语音交互设备及存储介质

Country Status (1)

Country Link
CN (1) CN108335700B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109087671A (zh) * 2018-09-20 2018-12-25 重庆先特服务外包产业有限公司 政府综合热线服务平台
CN109147802A (zh) * 2018-10-22 2019-01-04 珠海格力电器股份有限公司 一种播放语速调节方法及装置
CN109660655A (zh) * 2018-11-13 2019-04-19 珠海格力电器股份有限公司 音量调节方法、装置、终端及计算机可读介质
CN110060682A (zh) * 2019-04-28 2019-07-26 Oppo广东移动通信有限公司 音箱控制方法和装置
CN110248021A (zh) * 2019-05-10 2019-09-17 百度在线网络技术(北京)有限公司 一种智能设备音量控制方法及系统
CN110347366A (zh) * 2019-07-15 2019-10-18 百度在线网络技术(北京)有限公司 音量调节方法、终端设备、存储介质及电子设备
CN110347367A (zh) * 2019-07-15 2019-10-18 百度在线网络技术(北京)有限公司 音量调节方法、终端设备、存储介质及电子设备
CN111260864A (zh) * 2018-11-30 2020-06-09 珠海格力电器股份有限公司 语音播报的控制方法、装置和空调

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040193422A1 (en) * 2003-03-25 2004-09-30 International Business Machines Corporation Compensating for ambient noise levels in text-to-speech applications
JP2008292762A (ja) * 2007-05-24 2008-12-04 Kenwood Corp 音声発生装置およびその制御方法、ならびに音声発生装置用プログラム
CN103347115A (zh) * 2013-06-29 2013-10-09 青岛歌尔声学科技有限公司 一种控制电子产品的输出音量的方法和装置以及一种手机
CN103543979A (zh) * 2012-07-17 2014-01-29 联想(北京)有限公司 一种输出语音的方法、语音交互的方法及电子设备
CN105407217A (zh) * 2015-10-26 2016-03-16 南京步步高通信科技有限公司 移动终端音乐播放的方法及移动终端
CN106331298A (zh) * 2015-06-30 2017-01-11 上海卓易科技股份有限公司 一种移动终端及其铃音智能调节方法
CN107395883A (zh) * 2017-07-17 2017-11-24 广东欧珀移动通信有限公司 语音信号调节方法、通信终端及计算机可读存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103780748A (zh) * 2012-10-25 2014-05-07 三星电子(中国)研发中心 移动终端及其情景模式自动切换方法
CN105654950B (zh) * 2016-01-28 2019-07-16 百度在线网络技术(北京)有限公司 自适应语音反馈方法和装置
CN106782544A (zh) * 2017-03-29 2017-05-31 联想(北京)有限公司 语音交互设备及其输出方法
CN107094206A (zh) * 2017-06-30 2017-08-25 苏州大学 一种通信控制装置
CN107621800A (zh) * 2017-10-27 2018-01-23 成都常明信息技术有限公司 一种基于年龄调节音量的智能语音机器人

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040193422A1 (en) * 2003-03-25 2004-09-30 International Business Machines Corporation Compensating for ambient noise levels in text-to-speech applications
JP2008292762A (ja) * 2007-05-24 2008-12-04 Kenwood Corp 音声発生装置およびその制御方法、ならびに音声発生装置用プログラム
CN103543979A (zh) * 2012-07-17 2014-01-29 联想(北京)有限公司 一种输出语音的方法、语音交互的方法及电子设备
CN103347115A (zh) * 2013-06-29 2013-10-09 青岛歌尔声学科技有限公司 一种控制电子产品的输出音量的方法和装置以及一种手机
CN106331298A (zh) * 2015-06-30 2017-01-11 上海卓易科技股份有限公司 一种移动终端及其铃音智能调节方法
CN105407217A (zh) * 2015-10-26 2016-03-16 南京步步高通信科技有限公司 移动终端音乐播放的方法及移动终端
CN107395883A (zh) * 2017-07-17 2017-11-24 广东欧珀移动通信有限公司 语音信号调节方法、通信终端及计算机可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
TATSUHITO HASEGAWA等: ""Analysis of Actual Smartphone Logs for Predicting the User"s Routine Settings of Application Volume"", 《2015 IEEE INTERNATIONAL CONFERENCE ON SYSTEMS, MAN, AND CYBERNETICS》 *
李振华: ""校园自动化广播系统的设计与实现"", 《科技广场》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109087671A (zh) * 2018-09-20 2018-12-25 重庆先特服务外包产业有限公司 政府综合热线服务平台
CN109147802A (zh) * 2018-10-22 2019-01-04 珠海格力电器股份有限公司 一种播放语速调节方法及装置
CN109660655A (zh) * 2018-11-13 2019-04-19 珠海格力电器股份有限公司 音量调节方法、装置、终端及计算机可读介质
CN109660655B (zh) * 2018-11-13 2020-07-24 珠海格力电器股份有限公司 音量调节方法、装置、终端及计算机可读介质
CN111260864A (zh) * 2018-11-30 2020-06-09 珠海格力电器股份有限公司 语音播报的控制方法、装置和空调
CN110060682A (zh) * 2019-04-28 2019-07-26 Oppo广东移动通信有限公司 音箱控制方法和装置
CN110060682B (zh) * 2019-04-28 2021-10-22 Oppo广东移动通信有限公司 音箱控制方法和装置
CN110248021A (zh) * 2019-05-10 2019-09-17 百度在线网络技术(北京)有限公司 一种智能设备音量控制方法及系统
CN110347366A (zh) * 2019-07-15 2019-10-18 百度在线网络技术(北京)有限公司 音量调节方法、终端设备、存储介质及电子设备
CN110347367A (zh) * 2019-07-15 2019-10-18 百度在线网络技术(北京)有限公司 音量调节方法、终端设备、存储介质及电子设备
CN110347366B (zh) * 2019-07-15 2023-08-08 百度在线网络技术(北京)有限公司 音量调节方法、终端设备、存储介质及电子设备

Also Published As

Publication number Publication date
CN108335700B (zh) 2021-07-06

Similar Documents

Publication Publication Date Title
CN108335700A (zh) 语音调节方法、装置、语音交互设备及存储介质
CN111223497B (zh) 一种终端的就近唤醒方法、装置、计算设备及存储介质
CN110347367B (zh) 音量调节方法、终端设备、存储介质及电子设备
CN104394491B (zh) 一种智能耳机、云服务器以及音量调节方法和系统
CN104954555B (zh) 一种音量调节方法及系统
CN111862942B (zh) 普通话和四川话的混合语音识别模型的训练方法及系统
CN108922525B (zh) 语音处理方法、装置、存储介质及电子设备
CN102333157A (zh) 用于移动终端的通话语音记录方法、装置及移动终端
US9929709B1 (en) Electronic device capable of adjusting output sound and method of adjusting output sound
CN108235208A (zh) 用于运行助听器设备的方法
CN112767908B (zh) 基于关键声音识别的主动降噪方法、电子设备及存储介质
CN102857650B (zh) 动态调整语音的方法
CN106231123A (zh) 语音通话方法及装置
CN110197663B (zh) 一种控制方法、装置及电子设备
JP7222354B2 (ja) 情報処理装置、情報処理端末、情報処理方法、および、プログラム
CN109584877B (zh) 语音交互控制方法和装置
CN114154636A (zh) 数据处理方法、电子设备及计算机程序产品
CN114664303A (zh) 连续语音指令快速识别控制系统
CN106791252A (zh) 一种来电铃声的播放方法及装置
CN112885341A (zh) 一种语音唤醒方法、装置、电子设备和存储介质
CN101399874A (zh) 手机铃声音量加强装置及方法
US20230305797A1 (en) Audio Output Modification
US11610596B2 (en) Adjustment method of sound output and electronic device performing the same
TWI748215B (zh) 聲音輸出之調整方法及執行該調整方法之電子裝置
CN112399004B (zh) 声音输出的调整方法及执行该调整方法的电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20191231

Address after: Room 802, building B1, R & D building 62-1, xiyongxuecheng Avenue, Shapingba District, Chongqing

Applicant after: Chongqing Hezhan Microelectronics Co.,Ltd.

Address before: 200233 A109 room A, building 3, 7 GUI Qing Road, Xuhui District, Shanghai.

Applicant before: SHANGHAI SIYU INTELLIGENT TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230331

Address after: Room 101, Building 20, Shidai Road, Haining Economic Development Zone, Haining City, Jiaxing City, Zhejiang Province, 314000

Patentee after: Zhejiang everything workshop Intelligent Technology Co.,Ltd.

Address before: 401332 Room 802, building B1, R & D building 62-1, xiyongxuecheng Avenue, Shapingba District, Chongqing

Patentee before: Chongqing Hezhan Microelectronics Co.,Ltd.