CN112116923A - 自动调节系统音量的方法、装置、终端设备及存储介质 - Google Patents
自动调节系统音量的方法、装置、终端设备及存储介质 Download PDFInfo
- Publication number
- CN112116923A CN112116923A CN202011165546.4A CN202011165546A CN112116923A CN 112116923 A CN112116923 A CN 112116923A CN 202011165546 A CN202011165546 A CN 202011165546A CN 112116923 A CN112116923 A CN 112116923A
- Authority
- CN
- China
- Prior art keywords
- audio data
- sound
- volume
- mixed audio
- environmental
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 230000007613 environmental effect Effects 0.000 claims abstract description 36
- 238000001228 spectrum Methods 0.000 claims abstract description 24
- 238000004364 calculation method Methods 0.000 claims abstract description 9
- 102100032219 Cathepsin D Human genes 0.000 claims description 7
- 101000869010 Homo sapiens Cathepsin D Proteins 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 101001080825 Homo sapiens PH and SEC7 domain-containing protein 1 Proteins 0.000 claims description 4
- 102100027472 PH and SEC7 domain-containing protein 1 Human genes 0.000 claims description 4
- 101001080808 Homo sapiens PH and SEC7 domain-containing protein 2 Proteins 0.000 claims description 3
- 102100027455 PH and SEC7 domain-containing protein 2 Human genes 0.000 claims description 3
- 238000005314 correlation function Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 101100136727 Caenorhabditis elegans psd-1 gene Proteins 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/034—Automatic adjustment
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/028—Voice signal separating using properties of sound source
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明提供一种自动调节系统音量的方法、装置、终端设备及存储介质,其中方法包括:采集混合音频数据并通过编码译码器的单独一路模拟输入/输出口发送到主芯片;主芯片通过对混合音频数据进行相关谱计算,分离出环境音频数据;根据环境音频数据获得环境声音的幅度,利用环境声音的幅度和系统声音的对应关系,获得系统声音的音量值;根据获得的系统声音的音量值,自动调结系统声音的音量。本发明能自动提取并分离环境声音,根据环境声音与系统声音之间的关系,实现系统声音的自动调节,提高了用户体验。
Description
技术领域
本发明涉及图像画面和音频信号设备终端的音量控制技术领域,特别涉及一种自动调节系统音量的方法、装置、终端设备及存储介质。
背景技术
目前市面上使用电子技术传送图像画面和音频信号的终端设备,如电视、智能手机、一体机的系统音量都是通过遥控器、控制面板去手动调节。而不同环境、不同时间段的环境声音差异较大,需要调节系统音量来满足用户正常体验。系统音量的预设值不能满足多种场景,也不能自适应调节。每次环境音变化时都需要手动调节终端设备系统音量比较麻烦,影响用户体验。因此,亟需对现有技术进行改进,实现自动调节系统音量。
发明内容
本发明的目的是提供一种自动调节系统音量的方法、装置、终端设备及存储介质,可以解决现有技术中当环境声音变化时,需要手动调节终端设备系统音量,影响用户体验的问题。
本发明的目的是通过以下技术方案实现的:
第一方面,本发明提供一种自动调节系统音量的方法,包括以下步骤:
步骤S1、采集混合音频数据并通过编码译码器的单独一路模拟输入/输出口发送到主芯片;
步骤S2、主芯片通过对混合音频数据进行相关谱计算,分离出环境音频数据;
步骤S3、根据环境音频数据获得环境声音的幅度,利用环境声音的幅度和系统声音的对应关系,获得系统声音的音量值;
步骤S4、根据获得的系统声音的音量值,自动调结系统声音的音量。
进一步的,所述的步骤S2具体包括:
步骤S201、计算混合音频的频域数据和系统声音的频域数据;
步骤S202、混合音频数据的自相关谱PSD计算;
步骤S203、混合音频数据与系统音频数据的互相关谱计算;
步骤S204、提取环境音频数据。
进一步的,所述的混合音频的频域数据和系统声音的频域数据的计算公式为:
F1=FFT(han_win×T1);
F2=FFT(han_win×T2);其中:
F1为混合音频的频域数据,F2为系统音频的频域数据,FFT将时域转换为频域的运算符,han_win是汉宁窗系数。
进一步的,所述的混合音频数据的自相关谱计算公式为:
PSD=∑|F1|2,其中:
F1为混合音频的频域数据。
进一步的,所述的步骤S203中互相关谱的计算公式为:
CPSD=∑(|F1|×|F2|*),其中:
F1为混合音频的频域数据,F2为系统音频的频域数据,*是复数的共轭运算。
进一步的,提取环境音频数据的函数表达式为:
CPSD为混合音频数据与系统音频数据的互相关谱;PSD1为混合音频数据自相关谱;PSD2为系统音频数据自相关谱。
第二方面,本发明提供一种自动调节系统音量的装置,包括:
混合声音采集模块,用于采集混合音频数据;
编码译码器,利用其空闲通道将混合音频数据发送给主芯片;
主芯片,从混合音频数据中分离出环境音频数据,获得环境声音的幅度;利用环境声音的幅度和系统声音的对应关系,获得系统声音的音量值;
系统声音自动调节模块,根据系统声音的音量值调节系统声音。
第三方面,本发明提供一种终端,包括上述自动调节系统音量的装置。
第四方面,本发明提供一种终端,被配置为可以执行上述自动调节系统音量的方法。
第五方面,本发明提供一种存储介质,所述的存储介质存储有计算机程序,其特征在于,运行所述计算机程序,可以执行上述自动调节系统音量的方法。
本发明的自动调节系统音量的方法、装置、终端设备及存储介质,能自动提取并分离环境声音,根据环境声音与系统声音之间的关系,实现系统声音的自动调节,提高了用户体验。
附图说明
图1为本发明的自动调节系统音量的方法步骤图;
图2为环境声音的幅度和系统声音的对应关系曲线;
图3为本发明的自动调节系统音量方法的框架流程图。
具体实施方式
下面结合附图对本公开实施例进行详细描述。
以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
本发明的自动调节系统音量的方法,包括以下步骤:
步骤S1、采集混合音频数据并通过编码译码器(下文称Codec)的单独一路模拟输入/输出口发送到主芯片。
本发明的目的是实现终端设备的系统自动音量调节功能,系统音量与环境音量息息相关,要实现此功能,需要实时获取环境音量大小作为参考。本发明的实施例中,是通过咪头采集所在环境的混合音频数据,此时混合音频数据中包含了环境音频数据和设备终端播放的系统声音的系统音频数据。混合音频数据为模拟电压信号。Codec将模拟电压信号转换为数字信号后发送给主芯片。
有线/无线麦克风在一体机上的使用越来越普遍,为了达到更好的录音效果一般会利用单独的Codec对主芯片i2s信号和模拟MIC信号进行混音输出,而Codec模块一般有多路模拟/数字信号输入/输出口,可以利用其中一路空闲的模拟输入通道进行环境声音的传输。
步骤S2、主芯片通过对混合音频数据进行相关谱计算,分离出环境音频数据。
进一步的,在本申请的优选实施方式中,所述的步骤S2具体包括:
步骤S201、计算混合音频的频域数据和系统声音的频域数据。
Codec模拟通道采集的外部声音数据中包含了环境声音和终端设备通过喇叭播放出来的媒体声音(即系统声音)。系统音频数据为系统已知量,其对应的时域数据T2也为已知量。混合音频的频域数据可通过Codec得到,为已知量,其对应的时域数据T1也为已知量。通过频域加窗和傅里叶变换处理获取对应的频域数据F1和F2,公式为:
F1=FFT(han_win×T1) (1)
F2=FFT(han_win×T2) (2)
其中F1为混合音频的频域数据,F2为系统音频的频域数据,FFT将时域转换为频域的运算符,han_win是汉宁窗系数。通过汉宁窗的加窗运算,每帧128个数据乘以汉宁窗系数,用来防止后面时频转换时发生频谱混叠。
步骤S202、混合音频数据的自相关谱PSD1计算,计算公式为:
PSD1=∑|F1|2 (3)
同理,PSD2=∑|F2|2为系统音频数据的自相关谱。
步骤S203、混合音频数据与系统音频数据的互相关谱CPSD计算,计算公式为:
CPSD=∑(|F1|×|F2|*) (4)
符号*是复数的共轭运算。
步骤S204、提取环境音频数据。
采用频域相关性函数进行环境音频数据的提取,具体函数表达式为:
CPSD:数据互相关谱;PSD1:混合音频数据自相关谱;PSD2:系统音频数据自相关谱。采用相关性函数估计信噪比函数SNR,当相关性高时,混合音和系统声的相关性高、估计信噪比函数的值高;而当相关性函数相关性低,估计信噪比函数估计值低;并用估计信噪比函数计算增益函数。
增益函数G的计算公式是:
计算环境声的频域数据公式为:F1_new=G*F1;
计算环境声的时域数据公式为:T1_new=IFFT(F1_new)。
IFFT代表快速傅里叶反变换。
步骤S3、根据环境音频数据获得环境声音的幅度,利用环境声音的幅度和系统声音的对应关系,获得系统声音的音量值。
从环境声的时域波形中获得音量特征,公式如下:
其中Si为该帧的i个采样点,n为该帧总的采样点数,它的单位是分贝(Decibels),是一个对数强度值。
需要在实际测试环境中根据环境音幅度(volume)调试对应的系统声音的音量值,生成环境声音的幅度和系统声音的对应关系。环境声音的幅度和系统声音的对应关系中具体到某一分贝的环境音对应某个系统音。这个对应关系可以是一个声音曲线,如图2所示。
步骤S4、根据获得的系统声音的音量值,自动调结系统声音的音量。
该步骤是通过系统声音自动调节模块来实现的。结合图2说明,如果环境音达到60dB,对应的系统音量为系统音量最大值的100%。如果环境音是20dB,对应的系统音量约为系统音量最大值的22%。
本发明还提供一种自动调节系统音量的装置,包括:
混合声音采集模块,用于采集混合音频数据,所述的混合音频数据包括环境音频数据和系统音频数据。
编码译码器,利用其空闲通道将混合音频数据发送给主芯片。
主芯片,从混合音频数据中分离出环境音频数据,获得环境声音的幅度。利用环境声音的幅度和系统声音的对应关系,获得系统声音的音量值。
系统声音自动调节模块,根据系统声音的音量值调节系统声音。
本发明还提供一种终端,所述终端至少包括上述自动调节系统音量的装置。所述终端被配置为可以执行上述自动调节系统音量的方法。
本发明还提供一种存储介质,所述的存储介质存储有计算机程序,运行该计算机程序,可以执行上述自动调节系统音量的方法。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接或彼此可通讯;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
以上仅为说明本发明的实施方式,并不用于限制本发明,对于本领域的技术人员来说,凡在本发明的精神和原则之内,不经过创造性劳动所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.自动调节系统音量的方法,其特征在于,包括以下步骤:
步骤S1、采集混合音频数据并通过编码译码器的单独一路模拟输入/输出口发送到主芯片;
步骤S2、主芯片通过对混合音频数据进行相关谱计算,分离出环境音频数据;
步骤S3、根据环境音频数据获得环境声音的幅度,利用环境声音的幅度和系统声音的对应关系,获得系统声音的音量值;
步骤S4、根据获得的系统声音的音量值,自动调结系统声音的音量。
2.根据权利要求1所述的自动调节系统音量的方法,其特征在于,所述的步骤S2具体包括:
步骤S201、计算混合音频的频域数据和系统声音的频域数据;
步骤S202、混合音频数据的自相关谱PSD计算;
步骤S203、混合音频数据与系统音频数据的互相关谱计算;
步骤S204、提取环境音频数据。
3.根据权利要求2所述的自动调节系统音量的方法,其特征在于,所述的混合音频的频域数据和系统声音的频域数据的计算公式为:
F1=FFT(han_win×T1);
F2=FFT(han_win×T2);其中:
F1为混合音频的频域数据,F2为系统音频的频域数据,FFT将时域转换为频域的运算符,han_win是汉宁窗系数。
4.根据权利要求2所述的自动调节系统音量的方法,其特征在于,所述的混合音频数据的自相关谱计算公式为:
PSD=∑|F1|2,其中:
F1为混合音频的频域数据。
5.根据权利要求2所述的自动调节系统音量的方法,其特征在于,所述的步骤S203中互相关谱的计算公式为:
CPSD=∑(|F1|×|F2|*),其中:
F1为混合音频的频域数据,F2为系统音频的频域数据,*是复数的共轭运算。
7.自动调节系统音量的装置,其特征在于,包括:
混合声音采集模块,用于采集混合音频数据;
编码译码器,利用其空闲通道将混合音频数据发送给主芯片;
主芯片,从混合音频数据中分离出环境音频数据,获得环境声音的幅度;利用环境声音的幅度和系统声音的对应关系,获得系统声音的音量值;
系统声音自动调节模块,根据系统声音的音量值调节系统声音。
8.一种终端,其特征在于,包括权利要求7所述的自动调节系统音量的装置。
9.一种终端,其特征在于,被配置为可以执行权利要求1至6任一项所述的自动调节系统音量的方法。
10.一种存储介质,所述的存储介质存储有计算机程序,其特征在于,运行所述计算机程序,可以执行权利要求1至6任一项所述的自动调节系统音量的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011165546.4A CN112116923A (zh) | 2020-10-27 | 2020-10-27 | 自动调节系统音量的方法、装置、终端设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011165546.4A CN112116923A (zh) | 2020-10-27 | 2020-10-27 | 自动调节系统音量的方法、装置、终端设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112116923A true CN112116923A (zh) | 2020-12-22 |
Family
ID=73794995
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011165546.4A Withdrawn CN112116923A (zh) | 2020-10-27 | 2020-10-27 | 自动调节系统音量的方法、装置、终端设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112116923A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112669872A (zh) * | 2021-03-17 | 2021-04-16 | 浙江华创视讯科技有限公司 | 一种音频数据的增益方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010156738A (ja) * | 2008-12-26 | 2010-07-15 | Pioneer Electronic Corp | 音量調節装置、音量調節方法、音量調節プログラムおよび音量調節プログラムを格納した記録媒体 |
CN102195584A (zh) * | 2010-03-12 | 2011-09-21 | 哈曼贝克自动系统股份有限公司 | 音频信号响度级的自动校正 |
CN107105095A (zh) * | 2017-04-25 | 2017-08-29 | 努比亚技术有限公司 | 一种声音处理方法及移动终端 |
CN109036447A (zh) * | 2018-08-08 | 2018-12-18 | 西安艾润物联网技术服务有限责任公司 | 智能语音音量调节方法、系统、装置及存储介质 |
CN109741758A (zh) * | 2019-01-14 | 2019-05-10 | 杭州微纳科技股份有限公司 | 一种双麦克风语音降噪方法 |
CN110995925A (zh) * | 2019-11-27 | 2020-04-10 | 广东以诺通讯有限公司 | 一种调节音量大小的方法、系统、移动终端及存储介质 |
CN111048118A (zh) * | 2019-12-24 | 2020-04-21 | 大众问问(北京)信息科技有限公司 | 一种语音信号处理方法、装置及终端 |
-
2020
- 2020-10-27 CN CN202011165546.4A patent/CN112116923A/zh not_active Withdrawn
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010156738A (ja) * | 2008-12-26 | 2010-07-15 | Pioneer Electronic Corp | 音量調節装置、音量調節方法、音量調節プログラムおよび音量調節プログラムを格納した記録媒体 |
CN102195584A (zh) * | 2010-03-12 | 2011-09-21 | 哈曼贝克自动系统股份有限公司 | 音频信号响度级的自动校正 |
CN107105095A (zh) * | 2017-04-25 | 2017-08-29 | 努比亚技术有限公司 | 一种声音处理方法及移动终端 |
CN109036447A (zh) * | 2018-08-08 | 2018-12-18 | 西安艾润物联网技术服务有限责任公司 | 智能语音音量调节方法、系统、装置及存储介质 |
CN109741758A (zh) * | 2019-01-14 | 2019-05-10 | 杭州微纳科技股份有限公司 | 一种双麦克风语音降噪方法 |
CN110995925A (zh) * | 2019-11-27 | 2020-04-10 | 广东以诺通讯有限公司 | 一种调节音量大小的方法、系统、移动终端及存储介质 |
CN111048118A (zh) * | 2019-12-24 | 2020-04-21 | 大众问问(北京)信息科技有限公司 | 一种语音信号处理方法、装置及终端 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112669872A (zh) * | 2021-03-17 | 2021-04-16 | 浙江华创视讯科技有限公司 | 一种音频数据的增益方法及装置 |
CN112669872B (zh) * | 2021-03-17 | 2021-07-09 | 浙江华创视讯科技有限公司 | 一种音频数据的增益方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2907323B1 (en) | Method and apparatus for audio interference estimation | |
CN106664473B (zh) | 信息处理装置、信息处理方法和程序 | |
US8682002B2 (en) | Systems and methods for transducer calibration and tuning | |
CN109313909B (zh) | 评估麦克风阵列一致性的方法、设备、装置和系统 | |
Tagliasacchi et al. | SEANet: A multi-modal speech enhancement network | |
US20110251704A1 (en) | Adaptive environmental noise compensation for audio playback | |
CN102549659A (zh) | 抑制音频信号中的噪声 | |
US7844452B2 (en) | Sound quality control apparatus, sound quality control method, and sound quality control program | |
EP2986034A1 (en) | Audio system equalization for portable media playback devices | |
US20160140977A1 (en) | Noise cancellation method | |
CN112954563B (zh) | 信号处理方法、电子设备、装置及存储介质 | |
CN111354368B (zh) | 补偿处理后的音频信号的方法 | |
CN113282265A (zh) | 终端的均衡参数配置方法、电子设备及存储介质 | |
CN112116923A (zh) | 自动调节系统音量的方法、装置、终端设备及存储介质 | |
KR20190012003A (ko) | 청각 인지 속성에 기반하여 디지털 오디오 신호의 이득을 조정하는 전자 장치 및 방법 | |
CN105764008A (zh) | 一种调试扩声系统传输频率特性的方法及装置 | |
CN112382305B (zh) | 调节音频信号的方法、装置、设备和存储介质 | |
WO2020023856A1 (en) | Forced gap insertion for pervasive listening | |
US20240170000A1 (en) | Signal processing device, signal processing method, and program | |
Czyżewski et al. | Adaptive personal tuning of sound in mobile computers | |
CN109378012B (zh) | 用于单通道语音设备录制音频的降噪方法及系统 | |
WO2020063798A1 (zh) | 一种回声消除方法、装置及智能音箱 | |
JP2015070291A (ja) | 集音・放音装置、音源分離ユニット及び音源分離プログラム | |
US20120158809A1 (en) | Compensation Filtering Device and Method Thereof | |
US20240071398A1 (en) | Delay estimation using frequency spectral descriptors |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20201222 |
|
WW01 | Invention patent application withdrawn after publication |