CN113674758A - 基于智能手机的风噪声的判断方法、装置以及电子设备 - Google Patents
基于智能手机的风噪声的判断方法、装置以及电子设备 Download PDFInfo
- Publication number
- CN113674758A CN113674758A CN202110777462.4A CN202110777462A CN113674758A CN 113674758 A CN113674758 A CN 113674758A CN 202110777462 A CN202110777462 A CN 202110777462A CN 113674758 A CN113674758 A CN 113674758A
- Authority
- CN
- China
- Prior art keywords
- microphone
- wind noise
- data
- shannon entropy
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000015654 memory Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 5
- 238000003491 array Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/45—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Telephone Function (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明公开了一种基于智能手机的风噪声的判断方法、装置以及电子设备,其中,判断方法包括:获取麦克风一段连续时间内收集的数据;对所述数据进行加窗处理;对每个窗口内的数据计算香农熵的值,得出香农熵序列;将所述香农熵序列中的值与设定阈值进行对比从而确定是否存在风噪声;该判断方法通过对移动设备自带的麦克风获取的数据进行加窗处理,进而计算数据的香农熵,通过香农熵与设定阈值的比较来判断移动设备的周围是否存在风噪声,不需要使用额外的设备。
Description
技术领域
本发明涉及风噪声检测领域,特别涉及一种风噪声的判断方法、装置以及电子设备。
背景技术
在移动设备录制音频时,除了声波会引起麦克风振动外,麦克风周围不确定的风也会引起麦克风的不规则振动,从而减低语音等有效信息的清晰度。
熵在信息论中代表着随机事件的不确定程度,一个系统越是有序则熵越小,越是无序则熵越大。在传统的语音信号处理领域中,熵被作为区分语音信号和噪声信号的特征。风信号作为一种典型的噪音信号,具有很强的不确定度,故可以用熵来区分风信号和语音信号,但熵作为一种特征来检测风信号的存在性尚未被应用。
移动设备在录制视频或者音频时,风噪声会对录制结果产生比较大的影响,特别是对于一些人通过感官判断不出来的风噪声,然而常见的测量仪器有翼状风速仪、风杯风速仪、超声波测风仪等。但这些都需要引入额外的硬件设备,缺乏通用性。在不添加外部设备时,只利用移动设备通过软件计算和判断出风存在性的方法,对语音增强等有着重要的意义。
发明内容
为了解决上述问题,本发明提供一种能够仅仅通过移动设备自带的麦克风来测量风噪声的方法。
为了实现上述目的,本发明提供的技术方案是一种基于智能手机的风噪声的判断方法,包括:
获取麦克风一段连续时间内收集的数据;
对所述数据进行加窗处理;
对每个窗口内的数据计算香农熵的值,得出香农熵序列;
将所述香农熵序列中的值与设定阈值进行对比从而确定是否存在风噪声。
在上述判断方法中,进一步的,所述香农熵的值由公式(1)计算得出
其中,其中P(x)=P{X=x},即X=x的概率。
在上述判断方法中,进一步的,
P(x)=C(x)/S (2)
其中,C(x)为值x在窗口期出现的次数,S为窗口内的数值个数;
在上述判断方法中,作为优选的一种技术方案,所述窗口长度为0.5s,窗口滑动步长为0.01s。
在上述判断方法中,作为优选的一种技术方案,所述麦克风在收集并储存数据时,使用两个mData数组,每个数组存放一段时间的数据,当一个mData数组存满,记录此刻的UNIX时间戳,同时用另一个数组存,并将UNIX时间戳和数组的数据存入文件中。
在上述判断方法中,进一步的,将所述香农熵序列中的值与设定阈值进行对比从而确定是否存在风噪声,进一步包括:
若香农熵的值大于设定阈值则判断为设备麦克风周围存在风;
若香农熵的值小于设定阈值则判断为设备麦克风周围不存在风。
在上述判断方法中,作为优选的一种技术方案,在采样率为22050时,所述设定阈值为11-13。
第二方面,本发明提供一种基于智能手机的风噪声的判断装置,包括:
获取单元,用于获取麦克风一段连续时间内收集的数据;
处理单元,用于对所述数据进行加窗处理;
计算单元,用于对每个窗口内的数据计算香农熵的值;
对比单元,用于将所述香农熵序列中的值与设定阈值进行对比从而确定是否存在风噪声。
第三方面,本发明提供一种电子设备,包括:一个或多个处理器;存储器;其中,所述存储器中存储有一个或多个计算机程序,所述一个或多个计算机程序包括指令,当所述指令被所述电子设备执行时,使得所述电子设备执行上述任意一项所述的基于智能手机的风噪声的判断方法。
本发明相对于现有技术的有益效果是:该判断方法通过对移动设备自带的麦克风获取的数据进行加窗处理,进而计算数据的香农熵,通过香农熵与设定阈值的比较来判断移动设备的周围是否存在风噪声,不需要使用额外的设备,这样还可以保证移动设备录制视频或者音频的质量。
附图说明
图1是本发明提供的一种基于智能手机的风噪声的判断方法的流程图;
图2是只有风噪声时的熵值的折线图;
图3是有风噪声和语音时的熵值的折线图;
图4是有风噪声和背景噪声时的熵值的折线图;
图5是本发明提供的一种基于智能手机的风噪声的判断方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其他的步骤或元素。
除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本申请的范围。同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
参照图1,本实施例提供一种基于智能手机的风噪声的判断方法,包括以下步骤:
S10:获取麦克风一段连续时间内收集的数据;所述麦克风为智能手机的麦克风;
具体的,在本实施中,通过Oboe库调用android的Native层(本地服务),再调用设备麦克风进行音频录制,从而实现低延迟的数据采集。存储数据时,使用两个mData数组,每个数组可以存放一分钟的数据。当一个数组存满,记录此刻的UNIX时间戳,同时用另一个数组存。将时间戳和数组的数据存入文件中。文件名的时间是通过java.util.Date()获得系统当前的时间和日期,即开始记录数据的时间。写入文件的函数每500ms被唤醒一次。当采集时间不足一分钟时,将提示“数据采集时间过短,未生成文件”。保存的文件以“年-月-日-时-分-秒-时长.txt”的文件名保存,文件每一行记录了一分钟的数据。
在此需要说明的是,该麦克风为移动设备上自带的麦克风。
S20:对所述数据进行加窗处理;
在本实施例中,采样率为22050,选取窗口长度为0.5s,窗口滑动步长为0.01s。
S30:对每个窗口内的数据计算香农熵的值,得出香农熵序列;
具体的,对于一个选定的窗口,首先对离散化的数据进行计数统计,即得出一个包含所有出现过的数值的集合,然后用频率代替概率的方法计算出所有的P(x),即用公式(2)计算P(x)
P(x)=C(x)/S (2)
其中,C(x)为值x在窗口期出现的次数,S为窗口内的数值个数;
最后,用公式(1)计算香农熵的值
其中,其中P(x)=P{X=x},即X=x的概率。
S40:将所述香农熵序列中的值与设定阈值进行对比从而确定是否存在风噪声。
具体的,若香农熵的值大于设定阈值则判断为设备麦克风周围存在风;若香农熵的值小于设定阈值则判断为设备麦克风周围不存在风。
在此需要说明的是,设定阈值为11-13,在本实施中,采用12。
实验中,共采集了四组音频数据,每组数据时长为20分钟,采样模式为双通道,采样频率为22050Hz。数据分别包含纯风噪、风噪与语音、风噪与背景噪音等三种情况,其中纯风噪数据两组。我们分别对三类数据在时域上求其熵随时间变化的折线图。我们采用长度为1s,步长0.01s的窗口作为求熵的基本单位,分别求其顶部麦克风、底部麦克风和二者相减后的值的熵。
参照图2-4,图中,横坐标的时间是0.01秒1刻度,6000刻度代表1分钟,另外,最上方为移动设备底部麦克风的数据,中间为顶部麦克风的数据,底部为顶部加上底部麦克风的数据。具体的,在有风时,三种情况下的熵的值都稳定在13附近,无风时,熵值迅速下降;在无风时,参照图2,纯风噪数据的熵稳定在11附近,;参照图3,带语音的风噪数据的熵在10.5-11.5波动,参照图4,带背景噪音的风噪数据的熵在11-12波动。同时,在有风转无风时,熵的值的变化非常迅速,能够很快从13跌落到12一下,因此合理的阈值因设置12-12.5之间,这里我们选择12作为阈值。
在另外一实施例中,本发明提供一种基于智能手机的风噪声的判断装置,包括:
获取单元100,用于获取麦克风一段连续时间内收集的数据;在此需要说明的是,由于具体的获取方式以及过程在上述一种风噪声的判断方法的步骤S10中已经详细阐述,故在此不再赘述。
处理单元200,用于对所述数据进行加窗处理;在此需要说明的是,由于具体的处理方式以及过程在上述一种风噪声的判断方法的步骤S20中已经详细阐述,故在此不再赘述。
计算单元300,用于对每个窗口内的数据计算香农熵的值;在此需要说明的是,由于具体的计算方式以及过程在上述一种风噪声的判断方法的步骤S30中已经详细阐述,故在此不再赘述。
对比单元400,用于将所述香农熵序列中的值与设定阈值进行对比从而确定是否存在风噪声,在此需要说明的是,由于具体的对比方式以及过程在上述一种风噪声的判断方法的步骤S40中已经详细阐述,故在此不再赘述。。
另外,本申请实施例提供一种电子设备,包括:一个或多个处理器;一个或多个存储器;一个或多个应用程序;以及一个或多个计算机程序,上述各器件可以通过一个或多个通信总线连接。其中,该一个或多个计算机程序被存储在上述存储器中并被配置为被该一个或多个处理器执行,该一个或多个计算机程序包括指令,上述指令可以用于执行上述应实施例中图1所示的步骤S10-S40。
应当理解的是电子设备中还可以包括显示屏、触摸传感器等器件,本申请实施例对此不做任何限制。
另外,本发明实施例还提供一种计算机可读存储介质,其中,该计算机可读存储介质可存储有程序,该程序执行时包括上述方法实施例中记载的任何一种基于智能手机的风噪声的判断方法的部分或全部步骤。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上参照附图描述了根据本发明的实施例的用于风噪声的判断方法的示例性流程图。应指出的是,以上描述中包括的大量细节仅是对本发明的示例性说明,而不是对本发明的限制。在本发明的其他实施例中,该方法可具有更多、更少或不同的步骤,且各步骤之间的顺序、包含、功能等关系可以与所描述和图示的不同。
Claims (10)
1.一种基于智能手机的风噪声的判断方法,其特征在于,包括:
获取麦克风一段连续时间内收集的数据;所述麦克风为智能手机的麦克风;
对所述数据进行加窗处理;
对每个窗口内的数据计算香农熵的值,得出香农熵序列;
将所述香农熵序列中的值与设定阈值进行对比从而确定是否存在风噪声。
3.根据权利要求2所述的判断方法,其特征在于:
P(x)=C(x)/S (2)
其中,C(x)为值x在窗口期出现的次数,S为窗口内的数值个数。
4.根据权利要求1-3中任意一项所述的判断方法,其特征在于:所述窗口长度为0.5s,窗口滑动步长为0.01s。
5.根据权利要求1所述的判断方法,其特征在于,所述麦克风在收集并储存数据时,使用两个mData数组,每个数组存放一段时间的数据,当一个mData数组存满,记录此刻的UNIX时间戳,同时用另一个数组存,并将UNIX时间戳和数组的数据存入文件中。
6.根据权利要求1所述的判断方法,其特征在于,将所述香农熵序列中的值与设定阈值进行对比从而确定是否存在风噪声,进一步包括:
若香农熵的值大于设定阈值则判断为设备麦克风周围存在风;
若香农熵的值小于设定阈值则判断为设备麦克风周围不存在风。
7.根据权利要求1或6所述的判断方法,其特征在于:在采样率为22050时,所述设定阈值为11-13。
8.一种基于智能手机的风噪声的判断装置,其特征在于,包括:
获取单元,用于获取麦克风一段连续时间内收集的数据;所述麦克风为智能手机的麦克风;
处理单元,用于对所述数据进行加窗处理;
计算单元,用于对每个窗口内的数据计算香农熵的值;
对比单元,用于将所述香农熵序列中的值与设定阈值进行对比从而确定是否存在风噪声。
9.一种电子设备,其特征在于,包括:一个或多个处理器;存储器;其中,所述存储器中存储有一个或多个计算机程序,所述一个或多个计算机程序包括指令,当所述指令被所述电子设备执行时,使得所述电子设备执行如权利要求1-7中任一项所述的基于智能手机的风噪声的判断方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的基于智能手机的风噪声的判断方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110777462.4A CN113674758B (zh) | 2021-07-09 | 2021-07-09 | 基于智能手机的风噪声的判断方法、装置以及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110777462.4A CN113674758B (zh) | 2021-07-09 | 2021-07-09 | 基于智能手机的风噪声的判断方法、装置以及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113674758A true CN113674758A (zh) | 2021-11-19 |
CN113674758B CN113674758B (zh) | 2024-07-05 |
Family
ID=78538740
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110777462.4A Active CN113674758B (zh) | 2021-07-09 | 2021-07-09 | 基于智能手机的风噪声的判断方法、装置以及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113674758B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100020986A1 (en) * | 2008-07-25 | 2010-01-28 | Broadcom Corporation | Single-microphone wind noise suppression |
CN102239705A (zh) * | 2008-12-05 | 2011-11-09 | 音频专用集成电路公司 | 风噪声检测方法和系统 |
US20120123771A1 (en) * | 2010-11-12 | 2012-05-17 | Broadcom Corporation | Method and Apparatus For Wind Noise Detection and Suppression Using Multiple Microphones |
CN104040627A (zh) * | 2011-12-22 | 2014-09-10 | 欧胜软件方案公司 | 用于风噪声检测的方法和设备 |
CN105118515A (zh) * | 2015-07-03 | 2015-12-02 | 中国科学院上海微系统与信息技术研究所 | 一种基于麦克风阵列的风噪声检测方法 |
CN109982228A (zh) * | 2019-02-27 | 2019-07-05 | 维沃移动通信有限公司 | 一种麦克风故障检测方法及移动终端 |
US20210201936A1 (en) * | 2019-12-30 | 2021-07-01 | Texas Instruments Incorporated | Background noise estimation and voice activity detection system |
-
2021
- 2021-07-09 CN CN202110777462.4A patent/CN113674758B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100020986A1 (en) * | 2008-07-25 | 2010-01-28 | Broadcom Corporation | Single-microphone wind noise suppression |
CN102239705A (zh) * | 2008-12-05 | 2011-11-09 | 音频专用集成电路公司 | 风噪声检测方法和系统 |
US20120123771A1 (en) * | 2010-11-12 | 2012-05-17 | Broadcom Corporation | Method and Apparatus For Wind Noise Detection and Suppression Using Multiple Microphones |
CN104040627A (zh) * | 2011-12-22 | 2014-09-10 | 欧胜软件方案公司 | 用于风噪声检测的方法和设备 |
CN105118515A (zh) * | 2015-07-03 | 2015-12-02 | 中国科学院上海微系统与信息技术研究所 | 一种基于麦克风阵列的风噪声检测方法 |
CN109982228A (zh) * | 2019-02-27 | 2019-07-05 | 维沃移动通信有限公司 | 一种麦克风故障检测方法及移动终端 |
US20210201936A1 (en) * | 2019-12-30 | 2021-07-01 | Texas Instruments Incorporated | Background noise estimation and voice activity detection system |
Also Published As
Publication number | Publication date |
---|---|
CN113674758B (zh) | 2024-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106486131B (zh) | 一种语音去噪的方法及装置 | |
CN109313909B (zh) | 评估麦克风阵列一致性的方法、设备、装置和系统 | |
US9620105B2 (en) | Analyzing audio input for efficient speech and music recognition | |
Castellana et al. | Discriminating pathological voice from healthy voice using cepstral peak prominence smoothed distribution in sustained vowel | |
US20140180682A1 (en) | Noise detection device, noise detection method, and program | |
CN103617801B (zh) | 语音检测方法、装置及电子设备 | |
CN104965773A (zh) | 终端、卡顿检测方法、装置及游戏卡顿检测方法、装置 | |
CN110600048B (zh) | 音频校验方法、装置、存储介质及电子设备 | |
JP6182895B2 (ja) | 処理装置、処理方法、プログラム及び処理システム | |
CN112712816B (zh) | 语音处理模型的训练方法和装置以及语音处理方法和装置 | |
CN108937866A (zh) | 睡眠状态的监测方法及装置 | |
CN110390947A (zh) | 声源位置的确定方法、系统、设备和存储介质 | |
CN113259832A (zh) | 麦克风阵列的检测方法、装置、电子设备及存储介质 | |
US11170760B2 (en) | Detecting speech activity in real-time in audio signal | |
CN109767784B (zh) | 鼾声识别的方法及装置、存储介质和处理器 | |
CN108093356B (zh) | 一种啸叫检测方法及装置 | |
CN113674758A (zh) | 基于智能手机的风噪声的判断方法、装置以及电子设备 | |
CN110556128B (zh) | 一种语音活动性检测方法、设备及计算机可读存储介质 | |
CN112423019A (zh) | 调整音频播放速度的方法、装置、电子设备及存储介质 | |
CN104581538B (zh) | 消除噪音的方法和装置 | |
US10109298B2 (en) | Information processing apparatus, computer readable storage medium, and information processing method | |
CN114678038A (zh) | 音频噪声检测方法、计算机设备和计算机程序产品 | |
CN114420165A (zh) | 音频电路测试方法、装置、设备及存储介质 | |
CN115995234A (zh) | 音频降噪方法、装置、电子设备及可读存储介质 | |
JP2019053121A (ja) | 音声処理プログラム、音声処理方法および音声処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |