CN114664320A - 一种音量调节方法、电子设备和可读存储介质 - Google Patents

一种音量调节方法、电子设备和可读存储介质 Download PDF

Info

Publication number
CN114664320A
CN114664320A CN202210322505.4A CN202210322505A CN114664320A CN 114664320 A CN114664320 A CN 114664320A CN 202210322505 A CN202210322505 A CN 202210322505A CN 114664320 A CN114664320 A CN 114664320A
Authority
CN
China
Prior art keywords
voice
sound
data
sampling
effective value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210322505.4A
Other languages
English (en)
Inventor
郭在康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Goertek Intelligent Technology Co Ltd
Original Assignee
Goertek Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Goertek Intelligent Technology Co Ltd filed Critical Goertek Intelligent Technology Co Ltd
Priority to CN202210322505.4A priority Critical patent/CN114664320A/zh
Publication of CN114664320A publication Critical patent/CN114664320A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response

Abstract

本申请提供了一种音量调节方法、电子设备和可读存储介质。音量调节方法包括采集声音数据;对所述声音数据中的语音数据进行一次采样,根据所述一次采样形成的样本计算语音有效值,并将所述语音有效值与预设值进行比较;若所述语音有效值大于所述预设值,电子设备停止播放声音;若所述语音有效值小于所述预设值,对所述声音数据进行二次采样,根据所述二次采样形成的样本计算声音有效值,并根据所述声音有效值调整电子设备播放声音的音量。本申请通过对采集的声音数据进行处理和计算,能够自动调节设备的音量,使设备播放声音的音量与外界噪声环境相适应,以使用户能够清楚地识别设备播放的声音。

Description

一种音量调节方法、电子设备和可读存储介质
技术领域
本申请属于电子设备技术领域,具体地,涉及一种音量调节方法、电子设备和可读存储介质。
背景技术
随着科学技术的发展,各式各样的电子设备不断在人们的生活中出现,为人们提供了极大的便利。但是,诸如智能音箱、AR(Augmented Reality增强现实)设备、VR(VirtualReality虚拟现实)设备、耳机等在播放声音时,由于外界噪音环境的影响使设备播放的声音被外界噪音覆盖,从而影响用户听到设备播放的声音,此时,需要手动调整设备的播放声音的音量,使设备播放的声音能够被用户听到;另外外界噪声环境不稳定,噪音时大时小。导致用户需要不断调节设备播放声音的大小,为用户带来不便,影响用户体验。
发明内容
本申请旨在提供一种音量调节方法、电子设备和可读存储介质,解决现有发声设备需要用户不断调节播放声音的大小来适应外界噪声环境的问题。
第一方面,本申请提供了一种音量调节方法,包括:
采集声音数据;
对所述声音数据中的语音数据进行一次采样,根据所述一次采样形成的样本计算语音有效值,并将所述语音有效值与预设值进行比较;
若所述语音有效值大于所述预设值,电子设备停止播放声音;若所述语音有效值小于所述预设值,对所述声音数据进行二次采样,根据所述二次采样形成的样本计算声音有效值,并根据所述声音有效值调整电子设备播放声音的音量。
可选地,电子设备包括外放设备,所述声音数据还包括噪声数据和外放数据;对所述声音数据进行二次采样包括:
消除所述外放数据,并根据所述声音数据中的所述语音数据和所述噪声数据进行二次采样。
可选地,所述消除所述外放数据,包括:
通过回声消除法消除所述声音数据中的所述外放数据。
可选地,所述对所述声音数据进行二次采样,根据所述二次采样形成的样本计算声音有效值,包括:
对预定时间内的声音数据以预定的采样频率进行二次采样,并根据采集的样本计算声音有效值。
可选地,所述预定时间为5秒和/或所述采样频率为48kHz。
可选地,所述采集声音数据包括:通过电子设备上设置的麦克风阵列采集所述声音数据。
可选地,所述根据所述一次采样形成的样本计算语音有效值,包括:对所述一次采样形成的样本的幅值进行均方根计算,得到的值为所述语音有效值。
可选地,所述根据所述二次采样形成的样本计算声音有效值,包括:对所述二次采样形成的样本的幅值进行均方根计算,得到的值为所述声音有效值。
第二方面,本申请提供了一种电子设备,用于执行以上所述的音量调节方法。
可选地,所述电子设备包括:
镜腿和镜框,所述镜腿设置在所述镜框上;
麦克风阵列,所述麦克风阵列包括多个麦克风,多个所述麦克风分布在所述镜腿和/或所述镜框上。
可选地,电子设备还包括提示组件,所述麦克风阵列能够判断语音方向,在所述麦克风阵列判断出所述语音方向的状态下,所述提示组件作出响应。
第三方面,本申请提供了一种电子设备,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如以上所述的音量调节方法的步骤。
第四方面,本申请提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如以上所述的音量调节方法的步骤。
申请的一个技术效果在于,通过对采集的声音数据进行处理和计算,能够自动调节设备的音量,使设备播放声音的音量与外界噪声环境相适应,以使用户能够清楚地识别设备播放的声音。
通过以下参照附图对本申请的示例性实施例的详细描述,本申请的其它特征及其优点将会变得清楚。
附图说明
被结合在说明书中并构成说明书的一部分的附图示出了本申请的实施例,并且连同其说明一起用于解释本申请的原理。
图1是本申请提供的一种音量调节方法的流程图;
图2是应用上述音量调节方法的智能眼镜的结构示意图。
附图标记:
1、镜腿;2、镜框;3、麦克风。
具体实施方式
现在将参照附图来详细描述本申请的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本申请的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本申请及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
第一方面,本申请提供了一种音量调节方法,如图1所示,在该方法中需要采集声音数据。在电子设备运行的过程中实时采集该电子设备周围的声音数据,便于在后续步骤中对采集到的声音数据进行处理。具体可以为,通过设备上的音频输入装置对设备周围的声音进行采集并形成用于后续分析的声音数据,比如,通过设置在设备上的麦克风3实时录音,后续对录制的声音数据进行处理。
具体地,所述设备可以为一AR眼镜,在AR眼镜上设置有麦克风3和处理模块。在AR眼镜运行过程中,麦克风3实时录制AR眼镜周围的声音并形成声音数据,AR眼镜的处理模块接收上述声音数据进行处理。
该方法需要对所述声音数据中的语音数据进行一次采样,根据所述一次采样形成的样本计算语音有效值,并将所述语音有效值与预设值进行比较。根据声音数据中的语音数据进行采样、计算,并与预设值进行比较,通过比较结果能够判断电子设备的用户是否与他人进行谈话,进而控制电子设备是否播放声音,根据语音数据对用户是否在交谈状态的判断较为准确,能够减少电子设备出现误判的情况,避免降低用户的使用体验。
需要说明的是,声音数据中的语音数据可以通过特定的算法或者特定的部件进行筛选,将声音数据中除语音数据的噪音去除。所述语音数据特指谈话声,具体为,所述声音数据是通过采集电子设备周围的声音而得到的数据,而电子设备周围的声音既包括周围环境形成的噪音,比如过路人的谈话声、车辆行驶发出的声音等,也包括电子设备用户的谈话声,本申请中语音数据为上文中提到的所有的谈话声。所述一次采样可以为在单位时间内对连续的语音数据在多个时间节点进行抽取形成离散的多个第一数据,该多个离散的第一数据为一次采样形成的样本。所述语音有效值与所述预设值属于相同或者相似的概念,代表谈话声音的强弱。人为设定一预设值作为参照,当谈话的声音大于预设值,则电子设备判断用户处于谈话状态,当谈话的声音小于预设值,则电子设备判断用户处于非谈话状态。比如,用户未进行谈话,语音数据中仅有路人的谈话声,此时根据该仅有路人谈话声的语音数据计算的语音有效值小于预设值,电子设备判断用户未进行谈话。
具体地,所述电子设备为AR眼镜,在AR眼镜上设置有麦克风3和处理模块。在AR眼镜运行过程中,麦克风3实时录制AR眼镜周围的声音并形成声音数据,AR眼镜的处理模块接收上述的声音数据,并通过处理模块对上述的声音数据中的语音数据进行采样、计算,并与预设值进行比较。
可选地,所述对所述声音数据进行二次采样,根据所述二次采样形成的样本计算声音有效值,包括对预定时间内的语音数据以预定的采样频率进行一次采样。能够避免一次采样并计算的速度过快,使电子设备对比较结果的反馈比较频繁,影响用户体验。比如,当路人在谈话的声音比较大且刚好路过用户身边时,如果采样并计算的速度过快,会使设备误判为用户处于交谈状态,进而对电子设备进行调整,而该调整是不被需要的,此时,会影响客户的使用体验;如果适当延长连续的语音数据的时长并增大采样频率,能够使设备更加准确地判断用户是否处于交谈状态,从而更加准确地调整电子设备。比如设置成采集5秒的语音数据,采样频率为48KHz。也就是说,在一次采样中共采集了48K*5个离散的数据,然后根据上述离散的数据计算语音有效值,并用计算结果与预设值进行比较,能够比较准确地判断用户是否处于谈话状态。
若所述语音有效值大于所述预设值,电子设备判断用户处于交谈状态,则电子设备停止播放声音,能够避免电子设备播放的声音影响用户交谈,达到电子设备根据外界环境自行调整电子设备的使用状态,提高了用户的使用体验。
进一步地,在电子设备停止播放声音后,电子设备继续执行采集声音数据,对所述声音数据中的语音数据进行一次采样,根据所述一次采样形成的样本计算语音有效值,并将所述语音有效值与预设值进行比较的步骤,此时采样并计算出的语音有效值小于预设值时,电子设备继续播放。在用户交谈完毕后,电子设备能够自行恢复播放声音的状态,进一步提高了用户的使用体验。
若所述语音有效值小于所述预设值,对所述声音数据进行二次采样,根据所述二次采样形成的样本计算声音有效值,并根据所述声音有效值调整电子设备播放声音的音量。
需要说明的是,所述二次采样可以为在单位时间内对连续的声音数据在多个时间节点进行抽取形成离散的多个第二数据,该多个离散的第二数据为二次采样形成的样本。所述声音有效值代表电子设备周围环境中存在的声音的强弱。声音有效值与电子设备播放声音的音量为一一对应关系,当计算出一特定的声音有效值时,电子设备自动将音量调整到与特定的声音有效值相对应的音量。其中,所述声音有效值可以为特定的一个数值或者为一个特定的数值范围。
本申请通过对采集的声音数据进行处理和计算,能够自动调节设备的音量,使设备播放声音的音量与外界噪声环境相适应,以使用户能够清楚地识别设备播放的声音。并且在与外人交谈时,电子设备能够自行停止声音的播放,保证电子设备不会影响用户的交谈,提高了电子设备的智能化。
可选地,所述设备包括外放设备,所述外放设备包括音箱等能够将声音传播一定距离的能够外放声音的设备。当上述外放设备通过外放的形式工作时,外放设备能够采集自身周围环境中的声音数据,此时,所述声音数据包括语音数据、噪声数据和外放数据,所述语音数据为电子设备周围的谈话声或者用户自身的谈话声等,所述噪声数据包括电子设备周围车辆行驶的声音或者建筑工地形成的声音等,所述外放数据为电子设备本身通过外放形式播放的声音。对所述声音数据进行二次采样包括消除声音数据中的所述外放数据,并根据所述声音数据中的所述语音数据和所述噪声数据进行二次采样。
在二次采样时,将外放数据消除,仅利用所述语音数据和所述噪声数据进行二次采样,能够防止电子设备形成正反馈引起的啸叫。具体地,在不对外放数据进行消除的情况下,当电子设备周围的声音整体增大,声音有效值增大,则电子设备的外放的音量增大,而电子设备的外放的音量增大又会使电子设备周围的声音进一步增大,进而进一步增大电子设备的外放的音量,理论上会如此无限循环,导致电子设备播放的声音会无限增大。而如果在二次采样时消除外放数据,只对所述语音数据和所述噪声数据进行采样并计算,就不会出现上述问题,保证了电子设备工作的可靠性。其中,在电子设备周围没有谈话声时,语音数据为零,不影响电子设备采集的声音数据中包括语音数据。
可选地,对预定时间内的声音数据以预定的采样频率进行二次采样,并根据采集的样本计算声音有效值。能够避免二次采样并计算的速度过快,使电子设备对计算结果的反馈比较频繁,影响用户体验。比如,当电子设备周围的声音突然增大并很快恢复正常时,如果二次采样并计算的速度过快,会使设备的音量突然增大然后降低,出现电子设备的音量突变的情况,而该种情况是不被需要的,此时,会影响客户的使用体验;如果适当延长连续的声音数据的时长并增大采样频率,能够使设备的音量调节更加平稳,不会出现电子设备的音量忽高忽低的情况,保证了用户的使用体验。
可选地,所述预定时间为5秒和/或所述采样频率为48kHz。比如,预定时间为5秒以及所述采样频率为48kHz,也就是说,在二次采样中共采集了48K*5个离散的数据,然后根据上述离散的数据计算声音有效值,能够使电子设备声音的调整较为平稳。
可选地,通过回声消除法消除所述声音数据中的所述外放数据。将回声消除法创造性地应用到本申请中用于消除电子设备收集的声音信号中的语音信号,确保在二次采样并计算的过程中仅针对语音数据和噪声数据,进而能够避免电子设备形成正反馈引起的啸叫,保证了用户的使用体验。其中,回声消除法可以通过自适应滤波器实现,其已为现有技术,此处不再赘述。具体地,所述电子设备为AR眼镜,上述处理过程也可以在AR眼镜的处理模块中进行。
可选地,所述采集声音数据包括通过设备上设置的麦克风3阵列采集所述声音数据。麦克风3阵列由多个麦克风3在电子设备上按照一定空间分布组合而成。麦克风3阵列在算法的控制下能够搜索到讲话者的位置,在搜索到讲话者的位置之后可以将波束指向当前的讲话者,以捕捉讲话者的声音,能够使麦克风3阵列采集到的声音数据中的语音数据较为明确,使电子设备能够更加准确地判断使用者是否处于谈话状态。
具体地,电子设备可以为AR眼镜,多个麦克风3可以分布在AR眼镜的镜腿1或者镜框2上,相邻两个麦克风3的距离或者多个麦克风3之间的布局根据麦克风3阵列算法的不同而不同。比如,在第一算法下,每个麦克风3之间的距离为不超过2cm,而在第二算法下,每个麦克风3之间的距离为不超过5cm。
可选地,所述根据所述一次采样形成的样本计算语音有效值,包括对所述一次采样形成的样本的幅值进行均方根计算,得到的值为所述语音有效值。每个一次采样的样本对应的值为声音的强度值,比如45分贝,将所有一次采样得到的值进行均方根计算,进而得到语音有效值。能够通过数据的形式可靠判断电子设备的用户是否处于交谈状态。
可选地,所述根据所述二次采样形成的样本计算声音有效值,包括对所述二次采样形成的样本的幅值进行均方根计算,得到的值为所述声音有效值。每个二次采样的样本对应的值为声音的强度值,比如50分贝,将所有二次采样得到的值进行均方根计算,进而得到声音有效值。能够通过数据的形式可靠判断外界环境的状态并根据外界环境的状态进行电子设备音量的调节。比如,当外界环境的交谈声和噪声较大时,电子设备能够自行调高其音量,以使用户能够清晰地识别电子设备播放的声音;当外界环境的交谈声和噪声较小时,电子设备能够自行调低其音量,保证电子设备的声音刚好处于用户能够清晰地识别电子设备播放的声音,避免电子设备播放的声音过大。
第二方面,本申请提供了一种电子设备,用于执行以上所述的音量调节方法。
可选地,电子设备包括镜腿1、镜框2和麦克风3阵列。也就是说,电子设备为一智能眼镜,所述镜腿1用于将该智能眼镜佩戴在用户头上,用户的眼睛能够与镜框2上安装的镜片相对。所述镜腿1设置在所述镜框2上,所述麦克风3阵列包括多个麦克风3,多个所述麦克风3分布在所述镜腿1和/或所述镜框2上。能够保证麦克风3阵列在空间上分布的合理性,保证本申请能够可靠工作。
具体地,如图2所示,所述镜腿1包括第一镜腿1和第二镜腿1,第一镜腿1和第二镜腿1分别设置在所述镜框2的两侧。所述第一镜腿1和所述第二镜腿1在长度方向的中部分别设置有一个麦克风3,所述镜框2的上边沿靠近所述第一镜腿1和所述第二镜腿1的部分分别设置有一个麦克风3,所述镜框2的上边沿的中部设置有一麦克风3,所述镜框2的下边沿设置有两个麦克风3,该两个麦克风3在镜框2下边沿上对称设置。
可选地,电子设备还包括提示组件,所述麦克风阵列能够判断语音方向,在所述麦克风阵列判断出所述语音方向的状态下,所述提示组件作出响应,以便于用户与对方交流。
所述提示组件可以包括扬声器、显示器、振动器等中的一种或者几种。
在提示组件为上述列举的部件中的一种时,提示组件作出单一的提示。比如,当提示组件为扬声器时,麦克风阵列判断语音的方向在用户右边,则扬声器发出语音方向在右边的提示声。同理,提示组件为显示器时,显示器显示语音方向。
在提示组件为上述列举的部件中的多种时,提示组件作出组合式提示。比如,当提示组件为显示器和扬声器时,扬声器发出语音方向的提示音,同时,显示器显示语音方向。又比如,所述提示组件为显示器和摄像模组时,摄像模组采集外界图像,显示器用于显示摄像模组采集的图像,且显示器提示语音方向,便于用户在佩戴本申请的电子设备时能够知道声音来源并且能够通过显示器看到对方,便于交流。
第三方面,本申请提供了一种电子设备,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如以上所述的音量调节方法的步骤。
该电子设备根据所执行的方法实施例的实施主体,可以是服务器,也可以是终端设备,在此不做限定。
在一个实施例中,以上装置实施例中的任意一个模块都可以由处理器实现。
第四方面,本申请提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如以上所述的音量调节方法的步骤。
本说明书的一个实施例或者多个实施例可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本说明书的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本说明书实施例操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本说明书的各个方面。
这里参照根据本说明书实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本说明书的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本说明书的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人物来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
虽然已经通过例子对本申请的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上例子仅是为了进行说明,而不是为了限制本申请的范围。本领域的技术人员应该理解,可在不脱离本申请的范围和精神的情况下,对以上实施例进行修改。本申请的范围由所附权利要求来限定。

Claims (13)

1.一种音量调节方法,其特征在于,包括:
采集声音数据;
对所述声音数据中的语音数据进行一次采样,根据所述一次采样形成的样本计算语音有效值,并将所述语音有效值与预设值进行比较;
若所述语音有效值大于所述预设值,电子设备停止播放声音;若所述语音有效值小于所述预设值,对所述声音数据进行二次采样,根据所述二次采样形成的样本计算声音有效值,并根据所述声音有效值调整电子设备播放声音的音量。
2.根据权利要求1所述的音量调节方法,其特征在于,电子设备包括外放设备,所述声音数据还包括噪声数据和外放数据;对所述声音数据进行二次采样包括:
消除所述外放数据,并根据所述声音数据中的所述语音数据和所述噪声数据进行二次采样。
3.根据权利要求2所述的音量调节方法,其特征在于,所述消除所述外放数据,包括:
通过回声消除法消除所述声音数据中的所述外放数据。
4.根据权利要求1所述的音量调节方法,其特征在于,所述对所述声音数据进行二次采样,根据所述二次采样形成的样本计算声音有效值,包括:
对预定时间内的声音数据以预定的采样频率进行二次采样,并根据采集的样本计算声音有效值。
5.根据权利要求4所述的音量调节方法,其特征在于,所述预定时间为5秒和/或所述采样频率为48kHz。
6.根据权利要求1所述的音量调节方法,其特征在于,所述采集声音数据包括:通过电子设备上设置的麦克风阵列采集所述声音数据。
7.根据权利要求1所述的音量调节方法,其特征在于,所述根据所述一次采样形成的样本计算语音有效值,包括:对所述一次采样形成的样本的幅值进行均方根计算,得到的值为所述语音有效值。
8.根据权利要求1所述的音量调节方法,其特征在于,所述根据所述二次采样形成的样本计算声音有效值,包括:对所述二次采样形成的样本的幅值进行均方根计算,得到的值为所述声音有效值。
9.一种电子设备,其特征在于,用于执行权利要求1-8任一项所述的音量调节方法的步骤。
10.根据权利要求9所述的电子设备,其特征在于,包括:
镜腿和镜框,所述镜腿设置在所述镜框上;
麦克风阵列,所述麦克风阵列包括多个麦克风,多个所述麦克风分布在所述镜腿和/或所述镜框上。
11.根据权利要求10所述的电子设备,其特征在于,电子设备还包括提示组件,所述麦克风阵列能够判断语音方向,在所述麦克风阵列判断出所述语音方向的状态下,所述提示组件作出响应。
12.一种电子设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-8任一项所述的音量调节方法的步骤。
13.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-8任一项所述的音量调节方法的步骤。
CN202210322505.4A 2022-03-29 2022-03-29 一种音量调节方法、电子设备和可读存储介质 Pending CN114664320A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210322505.4A CN114664320A (zh) 2022-03-29 2022-03-29 一种音量调节方法、电子设备和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210322505.4A CN114664320A (zh) 2022-03-29 2022-03-29 一种音量调节方法、电子设备和可读存储介质

Publications (1)

Publication Number Publication Date
CN114664320A true CN114664320A (zh) 2022-06-24

Family

ID=82033122

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210322505.4A Pending CN114664320A (zh) 2022-03-29 2022-03-29 一种音量调节方法、电子设备和可读存储介质

Country Status (1)

Country Link
CN (1) CN114664320A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023025221A1 (zh) * 2021-08-26 2023-03-02 所乐思(深圳)科技有限公司 智能眼镜、自动控制音量的方法及装置和智能眼镜系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023025221A1 (zh) * 2021-08-26 2023-03-02 所乐思(深圳)科技有限公司 智能眼镜、自动控制音量的方法及装置和智能眼镜系统

Similar Documents

Publication Publication Date Title
US11095985B2 (en) Binaural recording for processing audio signals to enable alerts
CN106162427B (zh) 一种声音获取元件的指向性调整方法和装置
KR102622499B1 (ko) 오디오 시스템을 위한 수정된 오디오 경험을 생성
US20210217433A1 (en) Voice processing method and apparatus, and device
EP3799035A1 (en) Acoustic program, acoustic device, and acoustic system
US10461712B1 (en) Automatic volume leveling
KR20160123218A (ko) 이어폰 능동 노이즈 제어
CN113241085A (zh) 回声消除方法、装置、设备及可读存储介质
CN114664320A (zh) 一种音量调节方法、电子设备和可读存储介质
US11694700B2 (en) Method, apparatus and device for processing sound signal
US11410669B2 (en) Asymmetric microphone position for beamforming on wearables form factor
CN113038337B (zh) 一种音频播放方法、无线耳机和计算机可读存储介质
CN111627456B (zh) 噪音排除方法、装置、设备及可读存储介质
CN107087208B (zh) 一种全景视频播放方法、系统及存储装置
US11032659B2 (en) Augmented reality for directional sound
US20200344545A1 (en) Audio signal adjustment
CN115243134A (zh) 信号处理方法、装置、智能头戴设备及介质
US20230320903A1 (en) Ear-worn device and reproduction method
US11513762B2 (en) Controlling sounds of individual objects in a video
JP2022095689A (ja) 音声データノイズ低減方法、装置、機器、記憶媒体及びプログラム
CN113810828A (zh) 音频信号处理方法、装置、可读存储介质及耳机
CN115842980A (zh) 一种应用于vr的环境音透传方法、装置、设备和存储介质
CN114758669B (zh) 音频处理模型的训练、音频处理方法、装置及电子设备
CN115657995A (zh) 声音信号的处理方法、处理装置、智能头戴设备及介质
WO2024077452A1 (zh) 音频处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination