CN112637733B - 一种自动调节语音设备音量的方法、装置和语音设备 - Google Patents

一种自动调节语音设备音量的方法、装置和语音设备 Download PDF

Info

Publication number
CN112637733B
CN112637733B CN202011445568.6A CN202011445568A CN112637733B CN 112637733 B CN112637733 B CN 112637733B CN 202011445568 A CN202011445568 A CN 202011445568A CN 112637733 B CN112637733 B CN 112637733B
Authority
CN
China
Prior art keywords
volume
distance
voice
user
voice equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011445568.6A
Other languages
English (en)
Other versions
CN112637733A (zh
Inventor
高丽
姜滨
迟小羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Goertek Techology Co Ltd
Original Assignee
Goertek Techology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Goertek Techology Co Ltd filed Critical Goertek Techology Co Ltd
Priority to CN202011445568.6A priority Critical patent/CN112637733B/zh
Publication of CN112637733A publication Critical patent/CN112637733A/zh
Application granted granted Critical
Publication of CN112637733B publication Critical patent/CN112637733B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • GPHYSICS
    • G08SIGNALLING
    • G08CTRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
    • G08C23/00Non-electrical signal transmission systems, e.g. optical systems
    • G08C23/04Non-electrical signal transmission systems, e.g. optical systems using light waves, e.g. infrared
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2400/00Loudspeakers
    • H04R2400/01Transducers used as a loudspeaker to generate sound aswell as a microphone to detect sound
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/01Aspects of volume control, not necessarily automatic, in sound systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请公开了一种自动调节语音设备音量的方法、装置和语音设备。所述方法包括:获取所述语音设备与用户之间的当前距离;根据所述语音设备内事先存储的距离与音量的关系曲线自动调节所述语音设备的音量至所述当前距离对应的音量。本申请实现了自动调节语音设备的音量,避免了音量太大时造成的用户听觉冲击,也避免了音量太小时来回调节音量或重复发送语音指令的麻烦,既提高了用户体验,又降低了产品功耗。

Description

一种自动调节语音设备音量的方法、装置和语音设备
技术领域
本申请涉及智能语音设备技术领域,具体涉及一种自动调节语音设备音量的方法、装置和语音设备。
背景技术
随着智能语音设备的普及,人们对智能语音设备的要求越来越高。目前的智能语音设备在被语音唤醒后,多是使用默认音量或用户上次设置过的音量。针对用户语音唤醒智能语音设备时距离设备较远或较近的情况,以及用户在使用智能语音设备进行音频播放或与设备进行互动时来回走动的情况,并不能实时地对设备进行音量调节,导致距离太近时音量太大造成用户听觉冲击,或距离较远时用户因听不清从而来回调节音量,或者误以为语音未被识别重复发送语音指令,从而导致用户体验不佳,也增加了设备功耗。
发明内容
鉴于上述问题,提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的一种自动调节语音设备音量的方法、装置和语音设备。
依据本申请的一个方面,提供了一种自动调节语音设备音量的方法,所述方法包括:
获取所述语音设备与用户之间的当前距离;
根据所述语音设备内事先存储的距离与音量的关系曲线,自动调节所述语音设备的音量至所述当前距离对应的音量。
依据本申请的另一方面,提供了一种自动调节语音设备音量的装置,所述装置包括:
距离获取单元,用于获取所述语音设备与用户之间的当前距离;
音量调节单元,用于根据所述语音设备内事先存储的距离与音量的关系曲线,自动调节所述语音设备的音量至所述当前距离对应的音量。
依据本申请的又一方面,提供了一种语音设备,所述语音设备上设置有多个红外探测器和多个拾音麦克风,所述语音设备包括存储器和处理器,所述存储器内事先存储有距离与音量的关系曲线、声压级与距离的关系模型库以及计算机可执行指令,所述处理器在执行所述计算机可执行指令时,实现上述任一项所述的自动调节语音设备音量的方法。
由上述可知,本申请的技术方案,通过获取语音设备与用户之间的当前距离,根据语音设备内事先存储的距离与音量的关系曲线,自动调节语音设备的音量至当前距离对应的音量,实现了可以根据语音设备与用户之间的当前距离自动调节语音设备的音量,避免了音量太大时造成的用户听觉冲击,也避免了音量太小时来回调节音量或重复发送语音指令的麻烦,既提高了用户体验,又降低了产品功耗。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本申请一个实施例的一种自动调节语音设备音量的方法的流程示意图;
图2示出了根据本申请一个实施例的三种红外探测器及拾音麦克风的布局示意图;
图3示出了根据本申请一个实施例的一种控制红外探测器开启或关闭的方法的流程示意图;
图4示出了根据本申请一个实施例的一种关闭红外探测器的场景示意图;
图5示出了根据本申请一个实施例的控制拾音麦克风声孔方向的两种场景示意图;
图6示出了根据本申请一个实施例的一种非自动调节语音设备音量的方法的流程示意图;
图7示出了根据本申请一个实施例的另一种自动调节语音设备音量的方法的流程示意图;
图8示出了本申请一个实施例的一种自动调节语音设备音量的装置的结构示意图;
图9示出了本申请一个实施例的一种语音设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本申请的示例性实施例。虽然附图中显示了本申请的示例性实施例,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本申请,并且能够将本申请的范围完整的传达给本领域的技术人员。
图1示出了根据本申请一个实施例的一种自动调节语音设备音量的方法的流程示意图。如图1所示,该方法包括:
步骤S110,获取语音设备与用户之间的当前距离。
本实施例中,可以通过红外探测器或拾音麦克风实时获取语音设备与用户之间的当前距离。
步骤S120,根据语音设备内事先存储的距离与音量的关系曲线,自动调节语音设备的音量至当前距离对应的音量。
本实施例中,根据等响曲线确定音量与声压级之间的对应关系以及声压级与距离之间关系,得到距离与音量之间的理论关系曲线,通过收集的大量的测试数据,对理论关系曲线进行修正,得到音量与距离的关系曲线并存储至语音设备内,其中该音量为最适宜人耳的音量或用户想要的音量。根据获取的语音设备与用户之间的当前距离,根据关系曲线可以得知当前距离对应的音量,从而自动将语音设备的音量调节至当前距离对应的音量。
综上所述,本申请的技术方案,通过事先建立距离与音量的关系曲线并存储至语音设备内,在获取语音设备与用户之间的当前距离后,根据关系曲线,即可得到与当前距离对应的音量,从而可以将语音设备的音量自动调节至与当前距离对应的音量。实现了智能调节和实时调节语音设备的音量,避免了音量太大时造成的用户听觉冲击,也避免了音量太小时来回调节音量或重复发送语音指令的麻烦,既提高了用户体验,同时也降低了产品功耗。
在本申请的一个实施例中,上述方法还包括:在获取到用户通过语音发送的音量调节指令时,将语音设备的音量调节至音量调节指令设置的第一音量,同时获取语音设备与用户发送音量调节指令的位置之间的第一距离,并记录下第一距离与第一音量的对应关系。当第一距离与第一音量的对应关系的记录次数达到预定次数阈值时,将对应关系记录到关系曲线中,以对关系曲线进行更新。
本实施例中,例如用户通过语音发出将此时音量调节到v1的音量调节指令,在获取到用户的该音量调节指令时,首先将语音设备的音量调节至v1。同时获取语音设备与用户发送音量调节指令时的位置之间的第一距离d1,并将v1与d1之间的对应关系记录到音量记录表中。如果用户在距离d1处将音量设置为v1的次数达到预定次数阈值,例如三次,则说明音量v1是用户在距离d1处喜欢的音量,则将关系曲线中距离d1对应的音量修改为v1,从而更新关系曲线,更好的适应用户喜好。
在本申请的一个实施例中,上述方法中的获取语音设备与用户之间的当前距离包括:
利用语音设备上设置的多个红外探测器和多个拾音麦克风,在一个或多个红外探测器探测到人体红外光谱的情况下,根据探测到的光谱计算语音设备与用户之间的当前距离,若有多个人体同时进入红外探测器的探测范围,选择计算出的最近距离作为语音设备与用户之间的当前距离;
在所有的红外探测器未探测到人体红外光谱的情况下,根据多个拾音麦克风采集到的声音信号计算用户的声压级值,查找事先存储的声压级与距离的关系模型库得到用户的声压级值对应的距离值,作为语音设备与用户之间的当前距离。
图2示出了根据本申请一个实施例的三种红外探测器及拾音麦克风的布局示意图。图2是以当前市场上主流的语音设备的形状为例,在语音设备的周边壳体上分别设置4个红外探测器和4个拾音麦克风。红外探测器和拾音麦克风的布局尽量呈现对称性,例如按照前后左右4个方向进行布局,从而对周围空间形成360°范围的监测。通过在语音设备的周边设置不少于4个的红外探测器和不少于4个的拾音麦克风,可以尽量形成多范围的监测。
本实施例中,在所有的红外探测器均未探测到人体红外光谱的情况下,则利用拾音麦克风对声音信号进行拾音,并计算拾音麦克风采集到的声音信号的幅度值(单位dBFS),拾音麦克风的灵敏度根据规格书已知,设为s1,拾音麦克风实际采集到的声音信号的幅度值设为s2,声压级设为P(单位dBSPL),则
p=s2-s1+94 (1)
距离与声压级之间的关系为:距离加倍则声压级衰减6dB,即:
p1-p2=20lg(r2/r1) (2)
其中,当r2/r1=2时,声压级衰减6dB。
本实施例中,根据理论值计算声压级与距离的对应关系,并将采集的大量的实测数据保存至数据库中,然后根据实际场景的实测数据通过对理论值计算的声压级与距离的对应关系进行修正,将修正后的声压级与距离的对应关系保存至数据库中,得到声压级与距离的关系模型库。根据拾音麦克风实时采集到的声音信号计算用户的声压级值,查找声压级与距离的关系模型库,即可得到该声压级值对应的距离值,并将该距离值作为语音设备与用户之间的当前距离。
图3示出了根据本申请一个实施例的一种控制红外探测器开启或关闭的方法的流程示意图,图4示出了根据本申请一个实施例的一种关闭红外探测器的场景示意图。
如图3所示,上述方法还包括:每隔预定时间判断语音设备是否被移动;如果语音设备被移动,则确保语音设备上设置的所有红外探测器处于开启状态;如果语音设备未被移动,则进一步判断每个开启的红外探测器的周边预定距离阈值内是否有遮挡物,如果有遮挡物且该遮挡物非人体时,则关闭与遮挡物相对应的方向上的红外探测器,保持其他红外探测器的开启状态,随时根据探测到的人体红外光谱计算语音设备与用户之间的当前距离,用于音量调节。
本实施例中,如图4所示,以在语音设备的周围设置4个红外探测器A、B、C、D,预定时间为3分钟为例进行说明。如果判断语音设备未被移动,同时语音设备的红外探测器D探测到语音设备的周围有遮挡物,且遮挡物与语音设备的距离小于预定距离阈值,例如0.5米,且该遮挡物非人体,则关闭与遮挡物相对应的方向上的红外探测器D。此时红外探测器D的探测作用并不大,通过关闭红外探测器D可节省功耗。其中,在实际应用中可以根据不同的产品及具体应用场景对预定距离阈值进行调整。
在本申请的一个实施例中,上述方法还包括:在多个拾音麦克风为可旋转麦克风时,根据一个或多个红外探测器探测到的人体红外光谱的情况,发送控制信号给多个拾音麦克风以调整多个拾音麦克风的声孔方向,控制每个拾音麦克风的声孔方向对向人体位置。如图5所示,图5示出了根据本申请一个实施例的控制拾音麦克风声孔方向的两种场景示意图,一种是拾音麦克风均匀分布在语音设备的圆形顶面,另一种是拾音麦克风均匀分布在语音设备的弧形顶面。采用本实施例,可以利用红外探测器对人体的探测结果提高拾音麦克风的拾音效果,减少环境噪音对人体语音的干扰。
在本申请的一个实施例中,上述方法还包括:为语音设备设置模式开关,当模式开关打开时,语音设备被设置为自动调节音量模式,当模式开关关闭时,语音设备被设置为非自动调节音量模式。通过设置模式开关,使语音设备可以自动调节音量,也可以非自动调节音量,增加了语音设备的音量调节方式,可以满足用户的不同需求,进一步提升了用户体验。
需要说明的是,无论在自动调节音量模式还是非自动调节音量模式下,均仍可以使用语音指令或手动设置音量的方式,从而满足多种用户场景的需求。
在本申请的一个实施例中,在语音设备被设置为非自动调节音量模式时,上述方法还包括:
在获取到用户通过语音发送的音量调节指令时,将语音设备的音量调节至音量调节指令设置的第二音量,同时获取语音设备与用户发送音量调节指令的位置之间的第二距离,并记录下第二距离与第二音量的对应关系;
当第二距离与第二音量的对应关系的记录次数达到预定次数阈值时,将对应关系记录到关系曲线中,以对关系曲线进行更新。
也即是说,在非自动调节音量模式下,仍可以根据用户的音量调节指令的记录更新距离与音量的关系曲线,从而更好的适应用户喜好。
需要说明的是,在实际应用中可以根据不同的产品、具体应用场景及用户需求对预定次数阈值进行调整。
图6示出了根据本申请一个实施例的一种非自动调节语音设备音量的方法的流程示意图。如图6所示,非自动调节语音设备音量的方法包括:
步骤S610,关闭模式开关,将语音设备设置为非自动调节音量模式。
步骤S620,关闭所有的红外探测器。
通过关闭所有的红外探测器可以节省功耗,当再次切换为自动调节音量模式时再打开所有的红外探测器。需要说明的是,如果语音设备使用的是旋转麦克风也可不关闭红外探测器,此时可以利用红外探测器对人体红外光谱的探测情况,调整拾音麦克风的声孔方向,控制每个拾音麦克风的声孔方向对向人体位置,以提高拾音麦克风的拾音效果。
步骤S630,用户通过语音发送音量调节指令,要求将音量调节至第二音量v2。
步骤S640,根据用户的音量调节指令,将语音设备的音量调节至第二音量v2,并同时获取语音设备与用户发送音量调节指令的位置之间的第二距离d2,将第二音量v2与第二距离d2之间的对应关系记录到音量记录表中,并查看当前音量记录表。
步骤S650,判断音量记录表中用户在该第二距离d2处将音量设置为第二音量v2的次数是否达到预定次数阈值。
步骤S660,如果用户在第二距离d2处将音量设置为第二音量v2的次数达到预定次数阈值,例如三次,则说明音量v2是用户在距离d2处喜欢的音量,则将关系曲线中第二距离d2对应的音量修改为第二音量v2,以更新关系曲线。
步骤S670,如果用户在第二距离d2处将音量设置为第二音量v2的次数没有达到预定次数阈值,则暂不进行任何处理操作。
图7示出了根据本申请一个实施例的另一种自动调节语音设备音量的方法的流程示意图。如图7所示,该方法包括:
步骤S701,打开模式开关,将语音设备设置为自动调节音量模式。
步骤S702,开启所有的红外探测器和拾音麦克风。
步骤S7031,所有的红外探测器均未探测到人体红外光谱情况下,利用拾音麦克风采集声音信号,并进行步骤704。
步骤S7032,一个或多个红外探测器探测到人体红外光谱的情况下,则进行步骤S705。
步骤S704,根据声压级值计算当前距离,并进行步骤S706。
具体地,根据多个拾音麦克风采集到的声音信号计算用户的声压级值,查找事先存储的声压级与距离的关系模型库得到用户的声压级值对应的距离值,作为语音设备与用户之间的当前距离。
步骤S705,根据探测到的光谱计算语音设备与用户之间的当前距离,并进行步骤S706。
步骤S706,根据距离与音量的关系曲线,将语音设备的音量设置为关系曲线中当前距离对应的第一音量。
步骤S707,语音设备在使用过程中,用户通过语音发出音量调节指令,要求将音量设置为第三音量。
步骤S708,根据用户的音量调节指令,将语音设备的音量调节为第三音量,并同时获取语音设备与用户发送音量调节指令的位置之间的第三距离,将第三音量与第三距离的对应关系记录到音量记录表中,并查看音量记录表。
步骤S709,判断音量记录表中第三距离对应的音量为第三音量的记录是否超过次数阈值。如果超过,则进行步骤710,如果未超过,则进行步骤711。
步骤S710,将关系曲线中第三距离对应的音量值修改为第三音量,以更新关系曲线。
步骤S711,暂不进行任何处理操作。
图8示出了本申请一个实施例的一种自动调节语音设备音量的装置的结构示意图。如图8所示,该自动调节语音设备音量的装置800包括:
距离获取单元810,用于获取语音设备与用户之间的当前距离。
音量调节单元820,用于根据语音设备内事先存储的距离与音量的关系曲线自动调节语音设备的音量至当前距离对应的音量。
在本申请的一个实施例中,上述装置800还包括:关系曲线更新模块一。
关系曲线更新模块一,用于在获取到用户通过语音发送的音量调节指令时,将语音设备的音量调节至音量调节指令设置的第一音量,同时获取语音设备与用户发送音量调节指令的位置之间的第一距离,并记录下第一距离与第一音量的对应关系;以及当第一距离与第一音量的对应关系的记录次数达到预定次数阈值时,使用该对应关系更新关系曲线。
在本申请的一个实施例中,上述装置800中的距离获取单元810具体用于:利用语音设备上设置的多个红外探测器和多个拾音麦克风,在一个或多个红外探测器探测到人体红外光谱的情况下,根据探测到的光谱计算语音设备与用户之间的当前距离,若有多个人体同时进入红外探测器的探测范围,选择计算出的最近距离作为语音设备与用户之间的当前距离;在所有的红外探测器未探测到人体红外光谱的情况下,根据多个拾音麦克风采集到的声音信号计算用户的声压级值,查找事先存储的声压级与距离的关系模型库得到用户的声压级值对应的距离值,作为语音设备与用户之间的当前距离。
在本申请的一个实施例中,上述装置800还包括:红外探测器控制单元。
红外探测器控制单元,用于每隔预定时间判断所述语音设备是否被移动;如果语音设备被移动,则确保语音设备上设置的所有红外探测器处于开启状态;如果智能语音设备未被移动,则进一步判断每个开启的红外探测器的周边预定距离阈值内是否有遮挡物,如果有遮挡物且该遮挡物非人体时,则关闭与遮挡物相对应的方向上的红外探测器。
在本申请的一个实施例中,上述装置800还包括:拾音麦克风控制单元。
拾音麦克风控制单元,用于在多个拾音麦克风为可旋转麦克风时,根据一个或多个红外探测器探测到的人体红外光谱的情况,发送控制信号给多个拾音麦克风以调整多个拾音麦克风的声孔方向,控制每个拾音麦克风的声孔方向对向人体位置。
在本申请的一个实施例中,上述装置800还包括:模式开关设置单元。
模式开关设置单元,用于为语音设备设置模式开关,当模式开关打开时,语音设备被设置为自动调节音量模式,当模式开关关闭时,语音设备被设置为非自动调节音量模式。
在本申请的一个实施例中,在语音设备被设置为非自动调节音量模式时,上述装置800还包括:关系曲线更新模块二。
关系曲线更新模块二,用于在获取到用户通过语音发送的音量调节指令时,将语音设备的音量调节至音量调节指令设置的第二音量,同时获取语音设备与用户发送音量调节指令的位置之间的第二距离,并记录下第二距离与第二音量的对应关系;以及当第二距离与第二音量的对应关系的记录次数达到预定次数阈值时,使用该对应关系更新关系曲线。
图9示出了本申请一个实施例的一种语音设备的结构示意图。如图9所示,该语音设备900上设置有多个红外探测器901和多个拾音麦克风902,语音设备包括存储器910和处理器920,存储器910内事先存储有距离与音量的关系曲线、声压级与距离的关系模型库以及计算机可执行指令,处理器920在执行计算机可执行指令时,实现上述的自动调节语音设备音量的方法。
存储器910可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器等。
当然,该语音设备还可能包括其他业务所需要的硬件,例如扬声器模块、通讯模块、接口模块等。语音设备内的所有硬件,可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图9中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
上述如本申请图9所示实施例揭示的语音设备执行的功能可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
需要说明的是,上述自动调节语音设备的各装置实施例及语音设备的具体实施方式可以参照前述对应方法实施例的具体实施方式进行,在此不再赘述。
综上所述,本申请的技术方案,在获取语音设备与用户之间的当前距离后,根据语音设备内事先存储的距离与音量的关系曲线得到与当前距离对应的音量,将语音设备的音量调节至与当前距离对应的音量,实现了自动实时调节语音设备的音量,避免了音量太大时造成的用户听觉冲击,也避免了音量太小时来回调节音量或重复发送语音指令的麻烦,既提高了用户体验,又降低了产品功耗。通过设置模式开关,使语音设备可以自动调节音量,也可以非自动调节音量,增加了语音设备的音量调节方式,可以满足用户的不同需求,进一步提升了用户体验。并且,通过记录用户通过音量调节指令调节音量的情形,根据音量和距离的对应关系出现的次数更新关系曲线,可以根据用户的喜好实时更新关系曲线,使关系曲线中记录的距离和音量的对应关系更加符合用户的喜好,提升用户体验。
需要说明的是:
在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本申请也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本申请的内容,并且上面对特定语言所做的描述是为了披露本申请的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本申请的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本申请并帮助理解各个发明方面中的一个或多个,在上面对本申请的示例性实施例的描述中,本申请的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本申请要求比在每个权利要求中所明确记载的特征更多的特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本申请的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本申请的范围之内并且形成不同的实施例。
应该注意的是上述实施例对本申请进行说明而不是对本申请进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本申请可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (8)

1.一种自动调节语音设备音量的方法,其特征在于,所述方法包括:
获取所述语音设备与用户之间的当前距离;
根据所述语音设备内事先存储的距离与音量的关系曲线,自动调节所述语音设备的音量至所述当前距离对应的音量;
利用所述语音设备上设置的多个红外探测器和多个拾音麦克风,
在所有的红外探测器未探测到人体红外光谱的情况下,根据多个拾音麦克风采集到的声音信号计算用户的声压级值,查找事先存储的声压级与距离的关系模型库得到所述用户的声压级值对应的距离值,作为所述语音设备与用户之间的当前距离;
在多个拾音麦克风为可旋转麦克风时,根据一个或多个红外探测器探测到的人体红外光谱的情况,发送控制信号给所述多个拾音麦克风以调整所述多个拾音麦克风的声孔方向,控制每个拾音麦克风的声孔方向对向人体位置;
所述方法还包括:每隔预定时间判断所述语音设备是否被移动;
如果所述语音设备被移动,则确保所述语音设备上设置的所有红外探测器处于开启状态;
如果所述语音设备未被移动,则进一步判断每个开启的红外探测器的周边预定距离阈值内是否有遮挡物,如果有遮挡物且该遮挡物非人体时,则关闭与所述遮挡物相对应的方向上的红外探测器。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
在获取到用户通过语音发送的音量调节指令时,将所述语音设备的音量调节至所述音量调节指令设置的第一音量,同时获取所述语音设备与用户发送所述音量调节指令的位置之间的第一距离,并记录下所述第一距离与所述第一音量的对应关系;
当所述第一距离与所述第一音量的对应关系的记录次数达到预定次数阈值时,使用所述对应关系更新所述关系曲线。
3.如权利要求1或2所述的方法,其特征在于,所述获取所述语音设备与用户之间的当前距离包括:
在一个或多个红外探测器探测到人体红外光谱的情况下,根据探测到的光谱计算所述语音设备与用户之间的当前距离,若有多个人体同时进入红外探测器的探测范围,选择计算出的最近距离作为所述语音设备与用户之间的当前距离。
4.如权利要求1所述的方法,其特征在于,所述方法还包括:
为所述语音设备设置模式开关,当所述模式开关打开时,所述语音设备被设置为自动调节音量模式,当所述模式开关关闭时,所述语音设备被设置为非自动调节音量模式。
5.如权利要求4所述的方法,其特征在于,在所述语音设备被设置为非自动调节音量模式时,所述方法还包括:
在获取到用户通过语音发送的音量调节指令时,将所述语音设备的音量调节至所述音量调节指令设置的第二音量,同时获取所述语音设备与用户发送所述音量调节指令的位置之间的第二距离,并记录下所述第二距离与所述第二音量的对应关系;
当所述第二距离与所述第二音量的对应关系的记录次数达到预定次数阈值时,使用所述对应关系更新所述关系曲线。
6.一种自动调节语音设备音量的装置,其特征在于,所述装置包括:
距离获取单元,用于获取所述语音设备与用户之间的当前距离;
音量调节单元,用于根据所述语音设备内事先存储的距离与音量的关系曲线,自动调节所述语音设备的音量至所述当前距离对应的音量;
所述语音设备上设置有多个红外探测器和多个拾音麦克风,
距离获取单元,用于在所有的红外探测器未探测到人体红外光谱的情况下,根据多个拾音麦克风采集到的声音信号计算用户的声压级值,查找事先存储的声压级与距离的关系模型库得到所述用户的声压级值对应的距离值,作为所述语音设备与用户之间的当前距离;
在多个拾音麦克风为可旋转麦克风时,根据一个或多个红外探测器探测到的人体红外光谱的情况,发送控制信号给所述多个拾音麦克风以调整所述多个拾音麦克风的声孔方向,控制每个拾音麦克风的声孔方向对向人体位置;
红外探测器控制单元,用于每隔预定时间判断所述语音设备是否被移动;如果语音设备被移动,则确保语音设备上设置的所有红外探测器处于开启状态;如果智能语音设备未被移动,则进一步判断每个开启的红外探测器的周边预定距离阈值内是否有遮挡物,如果有遮挡物且该遮挡物非人体时,则关闭与遮挡物相对应的方向上的红外探测器。
7.如权利要求6所述的装置,其特征在于,所述装置还包括:关系曲线更新模块一,
所述关系曲线更新模块一,用于在获取到用户通过语音发送的音量调节指令时,将所述语音设备的音量调节至所述音量调节指令设置的第一音量,同时获取所述语音设备与用户发送所述音量调节指令的位置之间的第一距离,并记录下所述第一距离与所述第一音量的对应关系;以及当所述第一距离与所述第一音量的对应关系的记录次数达到预定次数阈值时,使用所述对应关系更新所述关系曲线。
8.一种语音设备,其特征在于,所述语音设备上设置有多个红外探测器和多个拾音麦克风,所述语音设备包括存储器和处理器,所述存储器内事先存储有距离与音量的关系曲线、声压级与距离的关系模型库以及计算机可执行指令,所述处理器在执行所述计算机可执行指令时,实现权利要求1至5之任一项所述的自动调节语音设备音量的方法。
CN202011445568.6A 2020-12-08 2020-12-08 一种自动调节语音设备音量的方法、装置和语音设备 Active CN112637733B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011445568.6A CN112637733B (zh) 2020-12-08 2020-12-08 一种自动调节语音设备音量的方法、装置和语音设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011445568.6A CN112637733B (zh) 2020-12-08 2020-12-08 一种自动调节语音设备音量的方法、装置和语音设备

Publications (2)

Publication Number Publication Date
CN112637733A CN112637733A (zh) 2021-04-09
CN112637733B true CN112637733B (zh) 2023-02-28

Family

ID=75309594

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011445568.6A Active CN112637733B (zh) 2020-12-08 2020-12-08 一种自动调节语音设备音量的方法、装置和语音设备

Country Status (1)

Country Link
CN (1) CN112637733B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113645538B (zh) * 2021-08-04 2023-11-21 北京新科汇智科技发展有限公司 对讲机精准扩音联动系统
CN114063964A (zh) * 2021-10-29 2022-02-18 歌尔科技有限公司 音量补偿优化方法、装置、电子设备及可读存储介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104834237A (zh) * 2015-04-14 2015-08-12 广东小天才科技有限公司 一种通过距离检测线性调节音量大小的方法及装置
CN106331371A (zh) * 2016-09-14 2017-01-11 维沃移动通信有限公司 一种音量调节方法及移动终端
CN106534541A (zh) * 2016-11-15 2017-03-22 广东小天才科技有限公司 一种音量调节方法、装置及终端设备
CN107040661A (zh) * 2017-04-18 2017-08-11 广东欧珀移动通信有限公司 移动终端播放音量的控制方法、装置及移动终端
CN107920263A (zh) * 2016-10-11 2018-04-17 杭州萤石网络有限公司 音量调节方法及装置
CN108320742A (zh) * 2018-01-31 2018-07-24 广东美的制冷设备有限公司 语音交互方法、智能设备及存储介质
CN108966077A (zh) * 2018-06-19 2018-12-07 四川斐讯信息技术有限公司 一种音箱音量的控制方法及系统
CN109495649A (zh) * 2018-12-14 2019-03-19 深圳市沃特沃德股份有限公司 音量调节方法、系统及存储介质
CN109799968A (zh) * 2019-02-25 2019-05-24 努比亚技术有限公司 设备音量的调节方法、穿戴式设备及计算机可读存储介质
CN110248021A (zh) * 2019-05-10 2019-09-17 百度在线网络技术(北京)有限公司 一种智能设备音量控制方法及系统
CN110677776A (zh) * 2019-09-26 2020-01-10 恒大智慧科技有限公司 一种音量调节方法、装置、智能音箱及存储介质
CN110806849A (zh) * 2019-10-30 2020-02-18 歌尔科技有限公司 智能设备及其音量调节方法和计算机可读存储介质
CN111190566A (zh) * 2019-12-27 2020-05-22 拉克诺德(深圳)科技有限公司 音量控制方法、装置、计算机设备及存储介质
CN111510905A (zh) * 2020-05-04 2020-08-07 宋彦震 基于用户距离自适应调整播放器声音大小的方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104834237A (zh) * 2015-04-14 2015-08-12 广东小天才科技有限公司 一种通过距离检测线性调节音量大小的方法及装置
CN106331371A (zh) * 2016-09-14 2017-01-11 维沃移动通信有限公司 一种音量调节方法及移动终端
CN107920263A (zh) * 2016-10-11 2018-04-17 杭州萤石网络有限公司 音量调节方法及装置
CN106534541A (zh) * 2016-11-15 2017-03-22 广东小天才科技有限公司 一种音量调节方法、装置及终端设备
CN107040661A (zh) * 2017-04-18 2017-08-11 广东欧珀移动通信有限公司 移动终端播放音量的控制方法、装置及移动终端
CN108320742A (zh) * 2018-01-31 2018-07-24 广东美的制冷设备有限公司 语音交互方法、智能设备及存储介质
CN108966077A (zh) * 2018-06-19 2018-12-07 四川斐讯信息技术有限公司 一种音箱音量的控制方法及系统
CN109495649A (zh) * 2018-12-14 2019-03-19 深圳市沃特沃德股份有限公司 音量调节方法、系统及存储介质
CN109799968A (zh) * 2019-02-25 2019-05-24 努比亚技术有限公司 设备音量的调节方法、穿戴式设备及计算机可读存储介质
CN110248021A (zh) * 2019-05-10 2019-09-17 百度在线网络技术(北京)有限公司 一种智能设备音量控制方法及系统
CN110677776A (zh) * 2019-09-26 2020-01-10 恒大智慧科技有限公司 一种音量调节方法、装置、智能音箱及存储介质
CN110806849A (zh) * 2019-10-30 2020-02-18 歌尔科技有限公司 智能设备及其音量调节方法和计算机可读存储介质
CN111190566A (zh) * 2019-12-27 2020-05-22 拉克诺德(深圳)科技有限公司 音量控制方法、装置、计算机设备及存储介质
CN111510905A (zh) * 2020-05-04 2020-08-07 宋彦震 基于用户距离自适应调整播放器声音大小的方法

Also Published As

Publication number Publication date
CN112637733A (zh) 2021-04-09

Similar Documents

Publication Publication Date Title
CN112637733B (zh) 一种自动调节语音设备音量的方法、装置和语音设备
CN109780699B (zh) 转速控制方法及装置
US9357308B2 (en) System and method for dynamic control of audio playback based on the position of a listener
US11068235B2 (en) Volume adjustment method, terminal device, storage medium and electronic device
CN106782540B (zh) 语音设备及包括所述语音设备的语音交互系统
WO2019149160A1 (zh) 人机交互方法、装置、计算机设备和存储介质
WO2017215657A1 (zh) 音效处理方法及终端设备
WO2018058899A1 (zh) 一种智能终端的音量调节方法及其装置
CN108335700B (zh) 语音调节方法、装置、语音交互设备及存储介质
TWI790236B (zh) 音量調節方法、裝置、電子設備及存儲介質
JP2019175455A (ja) ワイヤレススピーカの再生モードの切り替え方法、装置及びワイヤレススピーカ
CN113840211A (zh) 自动调节蓝牙耳机音量的方法、装置及蓝牙耳机
WO2021159369A1 (zh) 一种用于降噪的助听方法、装置、芯片、耳机及存储介质
US11546688B2 (en) Loudspeaker device, method, apparatus and device for adjusting sound effect thereof, and medium
WO2022017006A1 (zh) 视频处理方法、装置、终端设备及计算机可读存储介质
CN113010139B (zh) 一种投屏方法、装置及电子设备
CN105872205A (zh) 一种信息处理方法及装置
CN105812581A (zh) 音量自动调节方法及装置
CN114442503B (zh) 智慧家居联动管理方法及系统
CN106375809B (zh) 一种音量调节方法、装置及存储介质
CN109803106B (zh) 基于黑板的录播系统、拍摄方法、存储介质及录播黑板
WO2018081927A1 (zh) 音量调整的方法、装置和电子设备
US20220182029A1 (en) Apparatus and method for automatic volume control with ambient noise compensation
CN114697445B (zh) 一种音量调节方法、终端及可读存储介质
CN113660599B (zh) 扬声器的控制方法、装置、移动终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant