CN113596700A - 终端麦克风的测试方法、装置、移动终端和存储介质 - Google Patents
终端麦克风的测试方法、装置、移动终端和存储介质 Download PDFInfo
- Publication number
- CN113596700A CN113596700A CN202111041447.XA CN202111041447A CN113596700A CN 113596700 A CN113596700 A CN 113596700A CN 202111041447 A CN202111041447 A CN 202111041447A CN 113596700 A CN113596700 A CN 113596700A
- Authority
- CN
- China
- Prior art keywords
- microphone
- user
- mobile terminal
- frequency
- low
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012360 testing method Methods 0.000 title description 3
- 238000001514 detection method Methods 0.000 claims abstract description 61
- 238000001228 spectrum Methods 0.000 claims abstract description 58
- 230000000903 blocking effect Effects 0.000 claims abstract description 34
- 241000209140 Triticum Species 0.000 claims abstract description 22
- 235000021307 Triticum Nutrition 0.000 claims abstract description 22
- 238000000034 method Methods 0.000 claims description 40
- 230000006870 function Effects 0.000 claims description 37
- 230000003595 spectral effect Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 10
- 238000001914 filtration Methods 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 8
- 239000012634 fragment Substances 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 4
- 238000009432 framing Methods 0.000 claims description 4
- 230000003247 decreasing effect Effects 0.000 claims description 2
- 230000036961 partial effect Effects 0.000 claims description 2
- 238000012790 confirmation Methods 0.000 claims 1
- 230000007423 decrease Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 8
- 210000001260 vocal cord Anatomy 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 235000009561 snack bars Nutrition 0.000 description 1
- GOLXNESZZPUPJE-UHFFFAOYSA-N spiromesifen Chemical compound CC1=CC(C)=CC(C)=C1C(C(O1)=O)=C(OC(=O)CC(C)(C)C)C11CCCC1 GOLXNESZZPUPJE-UHFFFAOYSA-N 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
- H04R29/004—Monitoring arrangements; Testing arrangements for microphones
Landscapes
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Telephone Function (AREA)
Abstract
本发明涉及一种移动终端麦克风的检测方法、装置、移动终端和存储介质,所述方法包括:当所述移动终端麦克风开启时,连续获取麦克风采集的音频,根据所述音频,生成音频对应的频谱。获取所述频谱高频谱段能量及低频谱段能量,并获取所述高频谱段与所述低频谱段能量差值。若所述高频谱段能量值与所述低频谱段能量值之间的差值高于阈值,通知所述移动终端发生堵麦。本发明提供的检测方法可以实现在应用开启录音功能时自动记录检测麦克风所对应的声音通道是否处于堵塞状态,提高使用的便捷程度。
Description
技术领域
本申请涉及移动终端检测技术领域,更具体地,涉及一种移动终端的麦克风检测方法、装置、移动终端及存储介质。
背景技术
科技的进步让手机和平板电脑等移动终端已经成为人们日常生活和工作中必不可少的通讯工具,而在使用移动终端进行通话、语音或视频聊天时等过程中都需要用到麦克风来记录声音,因此麦克风是手机终端中必不可少的组成部件。用户在日常通话或其他活动中,持有设备使用时手指会不经意堵塞麦克风。目前的移动终端提供的检测方法是在专门的应用程序中,需要由用户手动开启判断麦克风及其对应的声音通道是否堵塞的检测程序,使用较为不便。
发明内容
鉴于上述问题,本发明提出了一种移动终端的麦克风检测方法、装置、移动终端及存储介质,可以对移动终端的麦克风的堵塞程度进行检测。
第一方面,一种移动终端麦克风的检测方法,其特征在于,所述方法包括:获取麦克风采集的音频,确定所述音频的高频谱段能量值及低频谱段能量值,若所述高频谱段能量值与所述低频谱段能量值之间的差值高于阈值,通知所述移动终端发生堵麦。
第二方面,本发明提供了一种移动终端的麦克风检测装置,其特征在于,所述装置包括:第一检测模块,用于检测所述麦克风的录音功能是否开启。获取模块,当所述录音功能开启时,所述麦克风通过对应的声音通道获取外界声音片段。第二检测模块,当所述录音功能开启时,检测所述声音通道是否堵塞。通知模块,当所述声音通道的检测结果为堵塞时,通知用户。
第三方面,本发明提供了一种移动终端,其特征在于,包括:处理器,存储器,用于存储所述处理器的可执行指令。其中,所述处理器配置为经由执行所述可执行指令来执行如第一方面所述的方法。
第四方面,本发明提供了一种计算机可读取存储介质。其特征在于,所述计算机可读取存储介质中存储有计算机程序,所述计算机程序可被处理器调用执行如第一方面所述的方法。
本发明提供的方案可以实现在移动终端开启录音状态时,通过麦克风获取外界声音的同时开启麦克风所对应的声音通道的堵塞检测,如果麦克风所对应的声音通道经过堵塞算法检测之后确认为堵塞状态,则会发送通知给用户,从而实现自动开启检测麦克风所对应的声音通道,减少了用户操作的繁琐程度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付岀创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1示出了根据本发明一个实施例的移动终端的麦克风检测方法流程图;
图2示出了根据本发明另一个实施例的移动终端的麦克风检测方法流程图;
图3示出了根据本发明另一个实施例的移动终端的麦克风检测方法界面示意图;
图4示出了根据本发明另一个实施例的移动终端的麦克风检测方法界面示意图;
图5示出了根据本发明一个实施例的移动终端的麦克风检测装置的一种架构框图;
图6示出了根据本发明一个实施例的移动终端的麦克风检测装置的第二检测模块的流程图;
图7示出了根据本发明一个实施例的移动终端的一种架构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
请参阅图1,图1示出了本申请一个实施例提供的移动终端的麦克风检测方法的流程示意图。可以实现获取外界声音的同时,开启对麦克风所对应的声音通道是否堵塞检测的算法。因此,本发明提供的技术方案对麦克风的录音功能是否开启进行检测,将麦克风的录音功能开启作为开启对麦克风所对应的声音通道是否堵塞的检测算法的起始标识。下面将针对图1所示的流程进行详细的阐述,,所示移动终端的麦克风检测方法具体可以包括以下步骤:
步骤S101,获取麦克风采集的音频。
本发明提供的技术方案中,移动终端在开启麦克风的录音功能时,获取麦克风采集的音频。
移动终端可以是手机、平板电脑、笔记本电脑可穿戴设备等包含有麦克风的电子终端,在此并不作限定。
可以理解的是,移动终端上的麦克风可以是一个或多个,本发明对于麦克风的数量和类型并不作限定,只要属于可以接收外界传输的声音即属于本发明所保护的麦克风定义范围之列。
可以理解的是,本发明对于麦克风所处的位置并未进行特别限定,麦克风相对于移动终端所处的位置可以位于底部、顶部或背部,前述麦克风相对于移动终端所处的位置均属于本发明所保护的范围。
可以理解的是,录音功能是指能够接收外界传输的声音的功能,包括打开“录音”APP、进行移动通信通话、进行语音输入转化为文字、游戏过程中的语音聊天等可以获取外界声音信息的情况,具体APP可以通过用户手动添加白名单给予权限的方式设置。声音也并不是仅指人类的语音,物体通过震动在介质中传播的符合一般声音或声响定义的均属于本发明保护的录音范围之类,本发明所保护的录音功能中涉及的声音并不必然要求属于普通人类可以听见并辨别的范围之内。
步骤S102,确定所述音频的高频谱段能量值及低频谱段能量值。
录音功能开启时,麦克风可以通过对应的声音通道获取外界声音片段,而检测声音通道是否堵塞可以通过获取外界声音并进行频率分析得出结果,通过对音频片段的处理获得所拾取声音片段的频谱,确定所述音频的高频谱段能量值及低频谱段能量值。
上述获取音频的高频谱段与低频谱段的方法包括对麦克风获取的录音数据(PCM格式)进行分帧、下采样并加窗处理、FFT傅里叶变换,以计算信号的功率谱。对得到的功率谱进行插值计算(interpolation)以细化频率分辨率,分别统计低频谱段和高频谱段的能量值。上述获取低频谱段和高频谱段的方法可以利用滤波器分别进行低通滤波、高通滤波。
可以理解的是,麦克风所在的移动终端上需要与外界通过声音通道进行连通并接受和传输外界的声音片段,麦克风与声音通道的位置并未做特别限定,麦克风可能与声音通道正对或存在一定角度的偏移,此外麦克风的数量与声音通道的数量可能不一致。麦克风的数量可能多于声音通道的数量也有可能少于声音通道的数量、声音通道的形状可能为圆台或圆柱或棱柱,只要能够实现本发明中麦克风与外界声音进行传输的功能即可认定属于本发明保护的声音通道的概念之内,本发明对此均无做出特别限定,上述所列举的情况都属于本发明保护范围内。
可以理解的是,本发明对所涉及的声音片段的长度和内容并未做特别限定,声音片段只要满足堵塞算法的检测需求均可视为满足本发明要求的声音片段。
可以理解的是,本发明所并未对检测所述声音通道是否堵塞算法进行特别限定,本发明的一些实施例中检测所述声音通道是否堵塞算法包括高通滤波、低通滤波、带通滤波以及相关的求平均及运算组合匹配等内容。
步骤S103,若所述高频谱段能量值与所述低频谱段能量值之间的差值高于阈值,通知所述移动终端发生堵麦。
计算低频频谱段能量与高频谱段能量之间的差值,,并与一固定阈值(经验值,如-40dB)进行比较记录比较结果。相较于不堵麦的情况,堵麦状态下,频谱的低频谱段能量增加或不变,高频谱段能量下降,差值变大。当差值大于所述阈值时即可认定为发生堵麦情况,通知所述移动终端发生堵麦。
在本申请的另一实施方式中,在上述方法计算低频谱段能量与高频谱段能量之间的差值判断麦克风堵麦的基础上,可将声带谱段(voiceBand)与另外一固定阈值(经验值,如-50dB)进行比较进而判断当前麦克风是否处于拾音状态,也即当前是否有人进行讲话。由于正常讲话人声的交流频率在[300,3400]HZ之间,所以通过将这一范围内频谱与固定经验阈值比较就可以判断当前是否有人讲话。综合所述低频谱段能量与高频谱段能量之间的差值以及声带谱段与阈值的比较结果,就可以进而判断当前场景是堵麦讲话,还是单纯堵麦不讲话。
所述声音通道的检测结果包括堵塞和非堵塞两种结果,当所述声音通道的检测结果为堵塞时,通知用户所述声音通道堵塞。
可以理解的是,本发明并未对通知用户的方式做出特别限定,在本发明的一些实施例中,通知用戶的方式包括提出警告、弹窗、文字提示、图片提示等方式,上述提示方式均属于本发明所保护的范围之列。
可以理解的是,本发明的一些实施例并未对当所述声音通道的检测结果为非堵塞时是否通知进行限定,在本发明的一些实施例中当所述声音通道的检测结果为非堵塞时通知用户,在本发明的另一些实施例中当所述声音通道的检测结果为非堵塞时不通知用户,上述实施例均属于本发明保护范围之内。
请参阅图2,图2示出了根据本发明另一个实施例的移动终端的麦克风检测方法流程图;
S201、S202,获取麦克风采集的音频,确定所述音频的高频谱段能量值及低频谱段能量值的详细内容如上图1所述相同,此处不再赘述。
在本申请一实施例中,步骤S203,若所述高频谱段能量与所述低频谱段能量值之间的差值高于阈值,则发生堵麦。其中,当所述录音功能开启时,所述麦克风通过对应的声音通道获取外界声音片段,并检测所述声音通道是否堵塞。
步骤S204,获取所述声音通道的堵塞时间长度,当所述堵塞时间长度大于或等于第一时间段时,通知用户发生堵麦。
检测所述方法包括获取所述声音通道的堵塞时间长度,当所述堵塞时间长度大于或等于第一时间段时,判断此时应以弹窗方式通知用户。在此实施例中,堵塞时间长度作为提示堵麦的影响因素。所述声音通道的堵塞时间检测的结果包括大于第一时间段和小于第一时间段。所述声音通道的堵塞时间长度从首次检测到发生堵塞情况时开始计算。
例如,在一些实施例中,获取所述声音通道的堵塞时间长度为3.5s,第一时间段为3s,此时所述堵塞时间长度大于或等于第一时间段,则判断所述声音通道的检测结果为堵塞。
例如,在一些实施例中,获取所述声音通道的堵塞时间长度为2.5s,第一时间段为3s,此时所述堵塞时间长度小于第一时间段,则判断所述声音通道的检测结果为非堵塞。
通过此种方式当用户在短时间手指堵住麦克风后若能及时调整手指位置,露出麦克风拾音通道则不会打扰用户,增强用户使用移动设备时的体验感。
上述所述的堵塞时间长度可以理解为一系列满足堵塞检测结果的帧集合,具体的堵塞检测方法在下文中会详细表述。可以理解的是,本发明并未对声音通道的堵塞时间长度、第一时间段做出特别限定,上述实施例均属于本发明的保护范围之内。
如步骤S205,在一些实施例中,获取堵塞时长比例,当所述堵塞时长比例大于或等于第一比例值时,通知用户设备发生堵麦。检测获取所述声音通道的堵塞时间长度和录音的部分时长或总时长,得到堵塞比例,当所述堵塞比例大于或等于第一比例值时,判断此时应通知用户。堵塞比例的计算方法为声音通道的堵塞时间长度除以录音的总时长。
例如,在一些实施例中,获取所述声音通道的堵塞时间长度为4s,录音的总时长为10s,第一比例值为50%,此时堵塞比例为40%,则判断所述声音通道的检测结果为非堵塞。
例如,在一些实施例中,获取所述声音通道的堵塞时间长度为6s,录音的总时长为10s,第一比例值为50%,此时堵塞比例为60%,则判断所述声音通道的检测结果非堵塞。
本实施例中录音总时长可以理解为从麦克风拾取外界声音开始,即录音开始到过程中任一时刻的时间长度。具体而言也即是满足判断结果为堵塞的帧数除以总帧数的比例超过某一阈值。具体的堵塞判定方式下文中会详细阐述,可以理解的是,本发明并未对声音通道的堵塞时间长度、录音的总时长、第一比例值做出特别限定,上述实施例均属于本发明的保护范围之内。
请参阅图3和图4,图3示出了根据本发明另一个实施例的移动终端的麦克风检测方法界面示意图。图4示出了根据本发明另一个实施例的移动终端的麦克风检测方法界面示意图。
在本申请提供的另一实施方式中,当确认通知用户设备发生堵麦时,以弹窗的方式通知用户,所述弹窗方式包括模态弹窗或非模态弹窗。当所述弹窗的方式为模态弹窗时,如图4所示,向所述用户发送请求是否禁用所述麦克风。当用户确认禁止所述麦克风时,则所述麦克风功能关闭,当用户确认忽略所述麦克风弹窗堵塞提醒时,则所述麦克风功能继续运行。所谓模态弹窗是指用户必须进行操作行为,强制用户必须进行操作,否则不可以进行其他操作的弹窗。而与之相对的非模态弹窗,如图3所示,则为不影响用户操作,用户可以不予回应,通常有时间限制,出现一段时间就会自动消失的弹窗。
在一些实施例中,当所述声音通道的检测结果为堵塞时,以弹窗的方式通知用户,所述弹窗的方式包括模态弹窗或非模态弹窗。弹窗的类型一般可以分为两种,非模态弹窗一般被设计成用来告诉用户信息内容而无需用户进行相关操作,非模态弹窗的类型包括Toast/HUD、Snackbar。图3属于非模态弹窗,用户无需对弹窗进行额外的操作。
而模态弹窗除了告诉用户信息内容外还需要用户进行功能操作,模态弹窗会打断用户的操作行为,强制用户必须进行操作,否则不可以进行其他操作,模态弹窗的类型包括Alerts/dialog、Actionbar、Popover等类型。图4属于模态弹窗,用户必须针对图4的模态弹窗输入实质性操作,例如点击“禁用”按钮可以实现在检测到麦克风所对应的声音通道堵塞时禁用麦克风的效果,而点击“忽视”则可以在本次开启录音功能的过程中忽视麦克风所对应的声音通道堵塞,当下一次开启录音功能时,本发明提供的麦克风堵塞检测方法可以重复进行。可以理解的是,本发明并未对弹窗的方式进行限定,上述的模态弹窗和非模态弹窗都属于本发明所保护的范围之列。
在一些实施例中,当所述声音通道的检测结果为非堵塞时,不向所述用户发送所述通知。对于所述声音通道的检测结果为非堵塞时,不向所述用户发送所述通知从而实现降低用户被打扰的频率的效果,从而避免用户在正常使用中被无实质影响的通知内容所打扰,提升用户使用的投入程度。
在一些实施例中,当所述声音通道的检测结果为堵塞时,以弹窗的方式通知用户,当所述弹窗的方式为模态弹窗时,向所述用户发送请求是否禁用所述麦克风,用户必须主动向移动终端输入实质性的信息,例如用户选择“禁用”时,可以禁用所述麦克风,实现在录音功能开启时快速检测并自动通知用户,无需用户手动开启麦克风所对应的声音通道是否堵塞的检测功能,提高用户使用的便捷程度。通过模态弹窗的形式可以明确提醒用户注意,同时要求用户以模态交互的形式进行信息传递,表明用户对于麦克风堵塞的态度和倾向,同时给与用户选择的权利。当用户必须使用录音功能时,即使麦克风所对应的声音通道堵塞导致声音质量不佳,仍然应当提供录音功能,用户此时可以选择“忽视”选项。当用户对于麦克风声音质量要求较高时,则可以选择禁止使用麦克风并进行声音通道的清理工作,此时用户则可以选择“禁用”选项。
当所述弹窗的方式为非模态弹窗时,系统自动提醒用户当前麦克风处于堵塞状态,提醒用户手指放置位置或有其他异物阻塞麦克风导音孔。此时用户不需要对弹窗结果进行任何交互操作,弹窗提示会在超过预设时间后自动消失,或者在用户触击其他屏幕区域后消失亦或者用户调整手指位置让出麦克风拾音通道后堵塞消除而自动消失。对于非模态弹窗,用户可自行决定是退出录音或者通话应用清理灰尘异物还是调整调整手指位置继续进行通话录音。同时,当用户消除非模态弹窗后若再一次检测道堵麦情形,则会再次弹窗予以提示。所述非模态弹窗可以为小弹框的形式出现,持续1-2秒自动消失。所述小弹框可以出现在屏幕任意位置,只能放文字不能带图标,同时文字要精简不宜太长。在本申请一实施例中,可以透过所述弹窗对其他屏幕控件进行操作,不影响用户正常使用,弹窗的位置在此不做限定,可以在屏幕的上方也可以在屏幕底部或屏幕中央。
请参阅图5,在一些实施例中,本发明提供了一种移动终端的麦克风测试装置50,所述装置包括:第一检测模块501,用于检测所述麦克风的录音功能是否开启。获取模块503,当所述录音功能开启时,所述麦克风通过对应的声音通道获取外界声音片段。第二检测模块505,当所述录音功能开启时,检测所述声音通道是否堵塞。通知模块507,当所述声音通道的检测结果为堵塞时,通知用户。
请参阅图6,图6示出了根据本发明一个实施例的移动终端的麦克风检测装置的第二检测模块的流程图。
如图所示,第二检测模块的具体实施方法。堵麦检测模块采用[0,200]HZ低频带(Low Band)、[2000,f0/2]HZ高频带(High Band)(其中f0为信号采样率)、高低两个频段的能量差值,以及[300,3400]HZ声带(Voice Band)能量值作为区分麦克风堵塞的检测特征值,实施步骤如下:
在步骤S601中,获取麦克风录音数据PCM格式,也就是俗称的wav文件对录音数据进行分帧(Frame)处理。对语音信号进行处理需要借助于傅里叶变换,然而傅里叶变换要求的输入信号则必须是平稳的。对于现实中的信号而言从宏观角度而言显然是不平稳的,然而从微观角度而言在比较短的时间内可以截取一小段信号看作是一段平稳信号,这时就可以对这一小段信号进行傅里叶变换,截取出来的一小段信号就叫一帧。每一帧的长度宏观上必须能够保证帧内信号是平稳的,在一帧的期间内口型不能有明显变化,即一帧的长度应当小于一个音素的长度,一般情况下帧长一般取为小于50毫秒。从微观上来看,一帧又必须包括足够多的振动周期,因为傅里叶变换是要分析频率的,只有重复足够多次才能分析频率。既然一帧要包含多个周期,所以一般取至少20毫秒。
在步骤S602中,对分帧后的数据进行下采样(Resample),采样率降至8000HZ,此步骤用于去除掉频率过高部分频段,为后续计算过程减少负担出去无用计算信息。下采样后的数据进行加窗处理。
在步骤S603中,将采样得到的频率内分帧得到的每一帧信号进行加窗操作,即与一个窗函数相乘。窗函数一般为一个类开口向下的抛物线函数,两端值趋近于0,中心峰值为1。窗函数种类有多种且均为现有方式,在此不做限定。加窗的目的是让一帧信号的幅度在两端渐变到0,以便于进行傅里叶变换,可以让频谱上的各个峰更细,减轻频谱泄漏。
加窗的代价是一帧信号两端的部分被削弱了,没有像中央的部分那样得到重视。弥补的办法是,帧不要背靠背地截取,而是相互重叠一部分。相邻两帧的起始位置的时间差叫做帧移,常见的取法是取为帧长的一半,或者固定取为10毫秒。
在步骤S604中,加窗后的帧数据进行FFT傅里叶变换,计算信号的功率谱。
频谱的横轴是频率,纵轴是幅度,频谱上的一个个小峰称为精细结构,它们在横轴上的间距就是基频,它体现了语音的音高——峰越稀疏,基频越高,音高也越高。
在步骤S605中对得到的功率谱进行插值计算(Interpolation),细化频率分辦率并分别统计低频均值频谱,高频均值频谱,声带频谱三个频段的平均功率大小。通过对频谱进行滤波操作,通过低频滤波得到低频均值频谱,高频滤波得到高频频谱、声带滤波得到声带频谱。其中,正常人声音交流频率在[300,3400]HZ之间。
在步骤S606中,计算低频均值频谱与高频均值频谱之间的差值,并与一固定阈值(经验值,如-40dB)进行比较记录比较结果。而在步骤S607中,声带频谱与另外一固定阈值进行比较(经验值,如-50dB),记录比较结果。通过对于不同场景下如在室内安静环境、噪声环境、低频噪声轰鸣环境、白噪声、粉噪声等环境下测量测量麦克堵塞前后及有无拾音条件下音频特征变化,可以发现在各种环境下,堵麦前后音频特征中高频和低频信号会出现特定的上扬和下降变化。例如,当周围外界环境处于安静状态时,相较于不堵麦的情况,堵麦状态下频谱的低频谱段能量增加或不变,高频谱段能量下降,差值变大。在其他环境下也可以发现类似堵麦状态与频带能量之间的关系,在此不一一列举。
综合上述内容,可以总结出堵麦讲话场景与频带能量变化之间的关系如表一所示。
表一
通过计算低频均值频谱与高频均值频谱之间的差值变化即可以对麦克风是否发生堵塞进行判断。
在步骤S607中,基于上述方法判断出麦克风是否堵麦的基础上,还可以通过声带频谱与另外一固定阈值进行比较进而判断当前麦克风是否处于拾音状态,也即当前是否有人进行讲话。由于正常讲话人声的交流频率在[300,3400]HZ之间,所以通过将这一范围内频谱与固定经验阈值比较就可以判断当前是否有人讲话。结合S607的判断结果与S606的判断结果即可进一步在麦克风是否发生堵塞的基础上判断当前是堵麦讲话场景还是堵麦不讲话场景。
在步骤S608中,将步骤S606和步骤S607的比较结果输入第二检测模块(Predicate)进行麦克风堵塞判定。判定方法包括但不限于:
1、对步骤S606和步骤S607的比较结果做逻辑与运算判定。
2、对步骤S606和步骤S607的比较结果分配不同的权重,并进行求和,根据求和结果进行判定。
3、通过统计一段时间内(如5秒),步骤S606和步骤S607的比较结果满足条件所占的百分比,通过百分比进行堵麦判定。
具体的判定方法包括但不限于以上三种方式。通过判定模块进行判定后可以得到当前麦克风是处于堵麦讲话、堵麦不讲话、不堵麦讲话、不堵麦不讲话中的具体哪一状态。
通过此种添加声带频率阈值比较的方式可以作为对上述只进行对高频均值频谱、低频均值频谱进行差值运算和阈值比较的实施例判定方法的补充,提高检测准确度。
请参考图7其示出了本申请实施例提供的一种电子设备的结构框图。该电子设备70可以是上述移动终端,也可以是上述检测终端。本申请中的电子设备70可以包括一个或多个如下部件:处理器701、存储器702。其中一个或多个应用程序可以被存储在存储器702中,并被配置为由一个或多个处理器701执行,一个或多个应用程序配置用于执行如前述方法实施例所描述的方法。
处理器701可以包括一个或者多个处理核。处理器701利用各种接口和线路连接整个电子设备70内的各个部分,通过运行或执行存储在存储器702内的指令、程序、代码集或指令集,以及调用存储在存储器702内的数据,执行电子设备70的各种功能和处理数据。可选地,处理器701可以采用数字信号处理(igital Signal processing,DSP)、现场可编程门阵列Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable logicArray,PLA)中的至少一种硬件形式来实现。处理器701可集成中央处理器(CentralProcessing unit,CPU、移动终端的麦克风检测器,GPU(Graphics processing Unit)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等,GPU用于负责显示内容的渲染和绘制,调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器701中,单独通过一块通信芯片进行实现。
存储器702可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only memory)。存储器702可用于存储指令、程序、代码、代码集或指令集。存储器702可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储电子设备70在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。
另外,本申请示出了本申请实施例提供的一种计算机可读存储介质的结构框图。该计算机可读介质中存储有程序代码,所述程序代码可被处理器调用执行上述方法实施例中所描述的方法。
计算机可读存储介质可以是诸如闪存、EEPROM电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地,计算机可读存储介质包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质具有执行上述方法中的任何方法步骤的程序代码的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码可以例如以适当形式进行压缩。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员当理解;其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技术方案的木质脱离本申请各实施例技术方案的精神和范围。
Claims (13)
1.一种移动终端麦克风的检测方法,其特征在于,所述方法包括:
获取麦克风采集的音频;
确定所述音频的高频谱段能量值及低频谱段能量值;
若所述高频谱段能量值与所述低频谱段能量值之间的差值高于阈值,通知所述移动终端发生堵麦。
2.根据权利要求1所述的检测方法,其特征在于,在所述获取麦克风采集的音频之后,所述方法还包括:
对所述音频进行分帧处理,得到连续的多帧数据;
通过对所述多帧数据的下采样,并对下采样之后的多帧数据进行加窗处理;
对加窗处理后的数据进行傅里叶变换,得到所述音频的多个频谱段能量值。
3.根据权利要求2所述的检测方法,其特征在于,所述下采样包括:
截取所述音频对应的频谱,获取的数据频率小于8000HZ频段。
4.根据权利要求1所述的检测方法,其特征在于,所述获取高频谱段能量及低频谱段能量包括:
对所述频谱进行滤波处理,获得频率大于2000HZ高频谱段和频率小于50HZ的低频谱段。
5.根据权利要求1所述的检测方法,其特征在于,所述高频谱段能量值与所述低频谱段能量值之间的差值高于阈值,包括:
所述低频谱段能量值增加,所述高频谱段能量值下降:或
所述低频谱段能量值不变,所述高频谱段能量值下降。
6.根据权利要求5所述的检测方法,其特征在于,所述当所述高频谱段能量、低频谱段能量及所述能量差值之间满足预设关系时,通知用户设备发生堵麦,还包括:
获取所述声音通道的堵塞时间长度;
当所述堵塞时间长度大于或等于第一时间段时,通知用户设备发生堵麦。
7.根据权利要求5所述的检测方法,其特征在于,所述当所述高频谱段能量、低频谱段能量及所述能量差值之间满足预设关系时,通知用户设备发生堵麦,还包括:
获取所述声音通道的堵塞时间长度和录音的部分总时长,得到堵塞时长比例;
当所述堵塞时长比例大于或等于第一比例值时,通知用户设备发生堵麦。
8.根据权利要求6或7所述的检测方法,其特征在于,所述通知用户设备发生堵麦,包括:
当确认通知用户设备发生堵麦时,以弹窗的方式通知用户;
所述弹窗方式包括模态弹窗或非模态弹窗。
9.根据权利要求8所述的检测方法,其特征在于,所述方法还包括:
所述弹窗方式为模态弹窗时,向所述用户发送请求是否禁用所述麦克风。
10.根据权利要求9所述的检测方法,其特征在于,所述方法还包括:
当用户确认禁用所述麦克时,则所述麦克风功能关闭;
当用户允许使用所述麦克风时,则所述麦克风功能正常运行。
11.一种移动终端的麦克风检测装置,其特征在于,所述装置包括:
第一检测模块,用于检测所述麦克风的录音功能是否开启;
获取模块,当所述录音功能开启时,所述麦克风通过对应的声音通道获取外界声音片段;
第二检测模块,当所述录音功能开启时,检测所述声音通道是否堵塞;
通知模块,当所述声音通道的检测结果为堵塞时,通知用户。
12.一种移动终端,其特征在于,包括:
处理器;
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-7任一项所述的方法。
13.一种计算机可读取存储介质,其特征在于,所述计算机可读取存储介质中存储有计算机程序,所述计算机程序可被处理器调用执行如权利要求1-10任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111041447.XA CN113596700B (zh) | 2021-09-06 | 2021-09-06 | 终端麦克风的测试方法、装置、移动终端和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111041447.XA CN113596700B (zh) | 2021-09-06 | 2021-09-06 | 终端麦克风的测试方法、装置、移动终端和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113596700A true CN113596700A (zh) | 2021-11-02 |
CN113596700B CN113596700B (zh) | 2023-12-05 |
Family
ID=78241472
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111041447.XA Active CN113596700B (zh) | 2021-09-06 | 2021-09-06 | 终端麦克风的测试方法、装置、移动终端和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113596700B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106911996A (zh) * | 2017-03-03 | 2017-06-30 | 广东欧珀移动通信有限公司 | 麦克风状态的检测方法、装置及终端设备 |
WO2020019821A1 (zh) * | 2018-07-26 | 2020-01-30 | Oppo广东移动通信有限公司 | 麦克风堵孔检测方法及相关产品 |
-
2021
- 2021-09-06 CN CN202111041447.XA patent/CN113596700B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106911996A (zh) * | 2017-03-03 | 2017-06-30 | 广东欧珀移动通信有限公司 | 麦克风状态的检测方法、装置及终端设备 |
WO2020019821A1 (zh) * | 2018-07-26 | 2020-01-30 | Oppo广东移动通信有限公司 | 麦克风堵孔检测方法及相关产品 |
Also Published As
Publication number | Publication date |
---|---|
CN113596700B (zh) | 2023-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10554826B2 (en) | Method and apparatus for adjusting volume of user terminal, and terminal | |
US10516776B2 (en) | Volume adjusting method, system, apparatus and computer storage medium | |
CN107105367B (zh) | 一种音频信号处理方法及终端 | |
EP2278356B1 (en) | Apparatus and method for detecting usage profiles of mobile devices | |
KR20140141916A (ko) | 사용자 기기의 알림 기능 운용 방법 및 장치 | |
CN109361995B (zh) | 一种电器设备的音量调节方法、装置、电器设备和介质 | |
CN110519450B (zh) | 超声波处理方法、装置、电子设备及计算机可读介质 | |
JP7073592B1 (ja) | オーディオ露出を管理するためのユーザインタフェース | |
US20180350378A1 (en) | Detecting and reducing feedback | |
CN108986839A (zh) | 减少音频信号中的噪声 | |
CN105976829A (zh) | 声音处理装置、声音处理方法 | |
CN111526247A (zh) | 显示语音文本的方法及装置 | |
WO2017166495A1 (zh) | 一种语音信号处理方法及装置 | |
US20230290335A1 (en) | Detection of live speech | |
CN113596700B (zh) | 终端麦克风的测试方法、装置、移动终端和存储介质 | |
CN109274826B (zh) | 语音播放模式的切换方法、装置、终端和计算机可读存储介质 | |
US20090313010A1 (en) | Automatic playback of a speech segment for media devices capable of pausing a media stream in response to environmental cues | |
JP2009522851A (ja) | 音声通信における音響フィードバックの抑制 | |
CN106293607A (zh) | 自动切换音频输出模式的方法及系统 | |
CN112735455A (zh) | 声音信息的处理方法和装置 | |
CN112384975A (zh) | 使用辅助信号的音频装置的传输控制 | |
CN104754120B (zh) | 一种终端 | |
JP7404568B1 (ja) | プログラム、情報処理装置、及び情報処理方法 | |
WO2023197296A1 (en) | Hand-free method for operating a device with an operating interface | |
EP4303874A1 (en) | Providing a measure of intelligibility of an audio signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |