CN113613159A - 麦克风吹气信号检测方法、装置和系统 - Google Patents

麦克风吹气信号检测方法、装置和系统 Download PDF

Info

Publication number
CN113613159A
CN113613159A CN202110958267.1A CN202110958267A CN113613159A CN 113613159 A CN113613159 A CN 113613159A CN 202110958267 A CN202110958267 A CN 202110958267A CN 113613159 A CN113613159 A CN 113613159A
Authority
CN
China
Prior art keywords
frame
microphone
short
signal
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110958267.1A
Other languages
English (en)
Other versions
CN113613159B (zh
Inventor
沙永涛
宋辉
孙作为
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seashell Housing Beijing Technology Co Ltd
Original Assignee
Beijing Fangjianghu Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Fangjianghu Technology Co Ltd filed Critical Beijing Fangjianghu Technology Co Ltd
Priority to CN202110958267.1A priority Critical patent/CN113613159B/zh
Publication of CN113613159A publication Critical patent/CN113613159A/zh
Application granted granted Critical
Publication of CN113613159B publication Critical patent/CN113613159B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/004Monitoring arrangements; Testing arrangements for microphones
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请提供了一种麦克风吹气信号检测方法、装置和系统。所述方法包括:获取通过麦克风采集的信号;对输入的信号进行分帧处理,以得到至少一帧;获取每一帧的短时能量;根据每一帧的短时能量计算每一帧的时域因子;获取每一帧的各频点谱包络值的平均误差;根据每一帧的各频点谱包络值的平均误差计算每一帧的频域因子;若存在时域因子大于第一预设阈值,且频域因子大于第二预设阈值的帧时,确定所述信号包括麦克风吹气信号;否则,确定所述信号包括麦克风吹气信号。该方法能够准确检测出麦克风吹气信号。

Description

麦克风吹气信号检测方法、装置和系统
技术领域
本公开实施例涉及一种麦克风吹气信号检测方法、装置和系统。
背景技术
随着人工智能技术的成熟与发展,智能语音设备应用越来越广泛,语音操控也越来越得到人们的认可,语音操控的方式也变得越来越多,如已有的唤醒词、命令词等已有不少学者进行研究,将用户对着麦克风吹气的信号作为某个系统或操作的指令信号也将是增加用户与智能语音设备交互方式的一种选择。
在实现本申请的过程中,发明人发现如何确定采集到的信号是否为麦克风吹气信号是一件困难的事情。
发明内容
有鉴于此,本申请提供一种麦克风吹气信号检测方法、装置和系统,能够准确检测出麦克风吹气信号。
为解决上述技术问题,本申请的技术方案是这样实现的:
在一个实施例中,提供了一种麦克风吹气信号检测方法,所述方法包括:
获取通过麦克风采集的信号;
确定所述信号是否包括麦克风吹气信号;
其中,所述确定所述信号是否包括麦克风吹气信号,包括:
对输入的信号进行分帧处理,以得到至少一帧;
获取每一帧的短时能量;
根据每一帧的短时能量计算每一帧的时域因子;
获取每一帧的各频点谱包络值的平均误差;
根据每一帧的各频点谱包络值的平均误差计算每一帧的频域因子;
若存在时域因子大于第一预设阈值,且频域因子大于第二预设阈值的帧时,确定所述信号包括麦克风吹气信号;否则,确定所述信号不包括麦克风吹气信号。
在另一个实施例中,提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述麦克风吹气信号检测方法的步骤。
在另一个实施例中,提供了一种检测系统,所述系统包括:
麦克风以及所述的电子设备,其中,所述麦克风与所述电子设备信号连接。
在另一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述麦克风吹气信号检测方法的步骤。
在另一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现所述麦克风吹气信号检测的方法。
由上面的技术方案可见,上述实施例中在确定采集到的信号是否包括麦克风吹气信号时,通过计算采集到的信号的每一帧的时域因子和频域因子,根据每一帧的时域因子和频域因子确定所述信号是否包括麦克风吹气信号。该方案不需要预先训练模型,且从时域和频域两方面检测所述信号,能够准确检测出麦克风吹气信号。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例中确定采集到的信号是否包括麦克风吹气信号的流程示意图;
图2为本申请实施例中计算每一帧的时域因子的流程示意图;
图3为本申请实施例中计算每一帧的频域因子的流程示意图;
图4为本申请实施例中计算滑动窗内的频点对应短时功率谱的平均值的流程示意图;
图5为本申请实施例中计算滑动窗内的频点的短时功率谱的平均值对应的估计值的流程示意图;
图6为本申请实施例一中麦克风吹气信号检测流程示意图;
图7为本申请实施例二中麦克风吹气信号检测流程示意图;
图8为本申请实施例中麦克风吹气信号检测装置结构示意图;
图9为本发明实施例提供的电子设备的实体结构示意图;
图10为本申请实施例提供的麦克风吹气信号检测系统示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其他步骤或单元。
下面以具体实施例对本发明的技术方案进行详细说明。下面几个具体实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
本申请实施例中提供一种麦克风吹气信号检测方法,在确定采集到的信号是否包括麦克风吹气信号时,通过计算采集到的信号的每一帧的时域因子和频域因子,根据每一帧的时域因子和频域因子确定所述信号是否包括麦克风吹气信号。该方案不需要预先训练模型,且从时域和频域两方面检测所述信号,能够准确检测出麦克风吹气信号。
本申请实施例中确定采集到的信号是否包括麦克风吹气信号时的相关处理过程可以封装在一个模型中,也可以不封装,依次执行相关步骤即可。
本申请实施例中以按照相关步骤执行确定采集到的信号是否包括麦克风吹气信号为例。
下面结合附图,详细说明确定采集到的信号是否包括麦克风吹气信号的过程。
参见图1,图1为本申请实施例中确定采集到的信号是否包括麦克风吹气信号的流程示意图。具体步骤为:
步骤101,对输入的信号进行分帧处理,以得到至少一帧。
对信号进行分帧处理,记为xm(n),其中,n=1,2,…,N,N为帧长,m=1,2,…M为帧索引。
xm(n)表示第m帧第n个采样点的采样值。
步骤102,获取每一帧的短时能量。
本申请实施例中具体实现时,可以通过如下两种,但不限于下述两种方式计算每一帧的短时能量:
第一种:通过下式计算每一帧的短时能量:
Figure BDA0003221129740000041
其中,S(m)表示第m帧的短时能量。
第二种:通过下式计算每一帧的短时能量:
Figure BDA0003221129740000042
其中,S(m)表示第m帧的短时能量。
步骤103,根据每一帧的短时能量计算每一帧的时域因子。执行步骤106。
参见图2,图2为本申请实施例中计算每一帧的时域因子的流程示意图。具体步骤为:
步骤201,获取每一帧的短时能量。
步骤202,若确定当前帧的短时能量不小于第三预设阈值,则当前帧的时域因子为前一帧的时域因子与第一预设数值的和,结束本流程。
本申请实施例中的第一预设数值可以根据实际需要设置,对此不进行限制,如可设置为1。
针对第一帧的时域因子可以根据实际应用场景设置初始值。
当前帧为第m帧时,若确定S(m)不小于第三预设阈值,则当前帧的时域因子F1(m)为:F1(m-1)+第一预设数值;其中,F1(m-1)为第m-1帧的时域因子。
其中,第三预设阈值的设置不受限制,根据实际应用场景设置,如可以设置为:13000000。
步骤203,若确定当前帧的短时能量小于第三预设阈值,则当前帧的时域因子为第二预设数值。
当前帧为第m帧时,若确定S(m)小于第三预设阈值,则当前帧的时域因子为第二预设数值,这里的第二预设数值可以根据实际需要设置,如0。
步骤202和步骤203的实现即为若短时能量大于第三预设阈值时,会累加时域因子;否则,将时域因子置为0,或置为某个较小的数值,是对时域因子的减少。
至此,完成每一帧的时域因子的计算。
步骤104,获取每一帧的各频点谱包络值的平均误差。
步骤105,根据每一帧的各频点谱包络值的平均误差计算每一帧的频域因子。
参见图3,图3为本申请实施例中计算每一帧的频域因子的流程示意图。具体步骤为:
步骤301,计算每一帧中的每个频点的短时功率谱。
计算每一帧中的每个频点的短时功率谱的方式如下:
可选用短时傅里叶变换、子带分解等方法将时域信号变换到频域,记为Xm(k),表示第m帧第k个频点的频点值。
利用下式计算短时功率谱:
Pm(k)=|Xm(k)|2
其中,Pm(k)表示第m帧第k个频点的短时功率谱。
步骤302,计算滑动窗内的频点的短时功率谱的平均值,以及对应的估计值。
参见图4,图4为本申请实施例中计算滑动窗内的频点对应短时功率谱的平均值的流程示意图。具体步骤为:
步骤401,计算每一帧的平滑能量。
通过下式计算每一帧信号的平滑能量:
Figure BDA0003221129740000061
其中,Savg(m)表示第m帧信号的平滑能量,Savg(m-1)表示第m-1帧信号的平滑能量,α为设置的上升平滑因子,可以但不限于取[0.85,1.0)中的数值,β为设置的下降平滑因子,可以但不限于取[0.0,0.15]中的数值。
步骤402,将当前帧的短时能量,同当前帧的平滑能量与比例因子的乘积以及第五预设阈值中较大的数值进行比较。
该窗口滑动到当前帧第m帧时,滑动窗内频点k的短时功率谱记为:
Pw-n(L,k)=[Pm-L+1(k),Pm-L+2(k),…,Pm(k)]
其中,L为窗长。
第五预设阈值的设置不受限制,根据实际应用场景设置,如可以设置为:2700000。
步骤403,若当前帧的短时能量大,保持当前帧的所有频点对应的短时功率谱不变。执行步骤405。
步骤404,若当前帧的平滑能量与比例因子的乘积,以及第五预设阈值中较大的数值大或与之相同,则将当前帧的所有频点对应的短时功率谱置为0。
利用下式对滑动窗内短时功率谱进行调整,对于滑动窗内每个频点k均作如下操作:
Figure BDA0003221129740000071
其中,Thr2为用于判断是否将当前帧能量用于滑动窗计算的阈值,即上述步骤中的第五预设阈值,γ为平滑能量因子。
步骤405,将所述所有帧的该频点的短时功率谱的均值与第六预设阈值中的较大的值作为滑动窗内该频点对应的短时功率谱的平均值。
第六预设阈值的设置不受限制,根据实际应用场景设置,如可以设置为:1。
通过下式将各频带滑动窗内短时功率谱求均值,其中Thr3为设定的最小平均短时功率谱阈值,必须为非负数,具体数值可结合实际情况设定,即上述步骤中的第六预设阈值:
Figure BDA0003221129740000072
至此完成短时功率谱的平均值的计算。
参见图5,图5为本申请实施例中计算滑动窗内的频点的短时功率谱的平均值对应的估计值的流程示意图。具体步骤为:
步骤501,将所述滑动窗内的频点的短时功率谱的平均值转换为dB值。
通过下式将均值转换为dB值:
Pavg_dB(k)=10×log10(Pavg(k))
步骤502,使用所述频点和所述dB值进行直线拟合,获得斜率和截距。
本申请实施例中进行直线拟合时,不限制拟合方式,如可以使用最小二乘法为例对(k,Pavg_dB(k))进行直线拟合;得到直线的斜率σ与截距b,其中,频点k及其对应的Pavg_dB(k)可选用全部或部分频点,选择部分频点时,如可以选择k=[k1,k2],具体实现时可结合实际情况来选定。
步骤503,根据所述斜率和截距计算所述滑动窗内的频点的短时功率谱的平均值对应的估计值。
通过下式计算获得Pavg_dB(k)的估计值:
Pest_dB(k)=σ×k+b
至此,完成估计值的计算。
步骤303,根据所述滑动窗内的频点对应的短时功率谱的平均值和所述估计值计算各频点谱包络值的平均误差。
通过下式计算各频点谱包络值的平均误差E(m):
Figure BDA0003221129740000081
这里的k1,k2可以根据实际需要设置,也可以是对应进行线性拟合的区间,对此不进行限制。
步骤304,确定当前帧的各频点谱包络值的平均误差是否小于第四预设阈值,如果是,执行步骤305;否则,执行步骤306。
第四预设阈值的设置不受限制,根据实际应用场景设置,如可以设置为:10。
步骤305,当前帧的频域因子为前一帧的频域因子与第三预设数值的和,结束本流程。
步骤306,当前帧的频域因子为第四预设数值。
通过下式确定当前帧的频域因子:
Figure BDA0003221129740000082
其中,Thr4为符合吹气误差的判决阈值,符合条件则频域指标项F2(m)为:F2(m-1)+第三预设数值,如1;其中,F2(m-1)为第m-1帧的频域因子;不符合的置为第四预设数值,如0。
步骤103同步骤104的执行不分先后顺序,可以并列执行,也可以选择一个先执行,另一个后执行。
步骤106,确定是否存在时域因子大于第一预设阈值,且频域因子大于第二预设阈值的帧,如果是,执行步骤107;否则,执行步骤108。
第一预设阈值和第二预设阈值的设置不进行限制,可以根据实际需要设置,第一预设阈值如可以设置为:12,第二预设阈值如可以设置为:10。
步骤107,确定所述信号包括麦克风吹气信号。结束本流程。
步骤108,确定所述信号不包括麦克风吹气信号。
本申请实施例中给出的针对第一预设阈值到第六预设阈值之间的举例数值是针对采集到的信号幅度范围:[-32768,32767]给出的一种举例,但不限于上述举例。
至此,完成确定信号中是否包括麦克风吹气信号过程。
实施例一
参见图6,图6为本申请实施例一中麦克风吹气信号检测流程示意图。具体步骤包括:
步骤601,获取通过麦克风采集的信号。
这里采集的信号可以实时采集到的,也可以是预先采集存储的信号,该信号是通过麦克风采集到的。
步骤602,确定所述信号是否包括麦克风吹气信号。
其中,所述确定所述信号是否包括麦克风吹气信号,包括:
对输入的信号进行分帧处理,以得到至少一帧;
获取每一帧的短时能量;
根据每一帧的短时能量计算每一帧的时域因子;
获取每一帧的各频点谱包络值的平均误差;
根据每一帧的各频点谱包络值的平均误差计算每一帧的频域因子;
若存在时域因子大于第一预设阈值,且频域因子大于第二预设阈值的帧时,确定所述信号包括麦克风吹气信号;否则,确定所述信号不包括麦克风吹气信号。
本实施例中在确定采集到的信号是否包括麦克风吹气信号时,通过计算采集到的信号的每一帧的时域因子和频域因子,根据每一帧的时域因子和频域因子确定所述信号是否包括麦克风吹气信号。该方案不需要预先训练模型,且从时域和频域两方面检测所述信号,能够准确检测出麦克风吹气信号。
实施例二
参见图7,图7为本申请实施例二中麦克风吹气信号检测流程示意图。具体步骤包括:
步骤701,获取通过麦克风采集的信号。
这里采集的信号可以实时采集到的,也可以是预先采集存储的信号,该信号是通过麦克风采集到的。
步骤702,确定所述信号是否包括麦克风吹气信号。
将采集到的信号输入到预设信号检测模型中,所述预设信号检测模型输出检测结果,输出的检查结果为:该信号为麦克风吹气信号,或该信号不为麦克风吹气信号。根据该结果确定当前获取的信号是否为麦克风吹气信号。
其中,所述确定所述信号是否包括麦克风吹气信号,包括:
对输入的信号进行分帧处理,以得到至少一帧;
获取每一帧的短时能量;
根据每一帧的短时能量计算每一帧的时域因子;
获取每一帧的各频点谱包络值的平均误差;
根据每一帧的各频点谱包络值的平均误差计算每一帧的频域因子;
若存在时域因子大于第一预设阈值,且频域因子大于第二预设阈值的帧时,确定所述信号包括麦克风吹气信号;否则,确定所述信号不包括麦克风吹气信号。
步骤703,若确定所述信号包括麦克风吹气信号,则根据配置信息确定麦克风吹气信号对应的指令。
本申请实施例中在配置信息中配置麦克风吹气信号对应的指令,但是不限于配置的具体指令,根据实际需要进行设置。
步骤704,根据所述指令执行对应的操作。
如针对麦克风吹气信号配置的对应指令为关闭麦克风,则确定所述信号包括麦克风吹气信号时,执行对应操作为关闭麦克风。
如针对麦克风吹气信号配置的对应指令为录音,则确定所述信号包括麦克风吹气信号时,执行对应操作为开始录音。
上述指令,以及对应操作仅为一种举例,具体实现时不限于上述举例。
本申请实施例中在确定采集到的信号是否包括麦克风吹气信号时,通过计算采集到的信号的每一帧的时域因子和频域因子,根据每一帧的时域因子和频域因子确定所述信号是否包括麦克风吹气信号。该方案不需要预先训练模型,且从时域和频域两方面检测所述信号,能够准确检测出麦克风吹气信号,并根据检测结果进行指令操作。
基于同样的发明构思,本申请实施例中还提供一种麦克风吹气信号检测装置。参见图8,图8为本申请实施例中麦克风吹气信号检测装置结构示意图。所述装置包括:获取单元801和确定单元802;
所述获取单元,用于获取通过麦克风采集的信号;
所述确定单元,用于确定所述获取单元获取的信号是否包括麦克风吹气信号;
其中,所述确定单元,具体用于确定所述信号是否包括麦克风吹气信号时,执行如下操作:
对输入的信号进行分帧处理,以得到至少一帧;
获取每一帧的短时能量;
根据每一帧的短时能量计算每一帧的时域因子;
获取每一帧的各频点谱包络值的平均误差;
根据每一帧的各频点谱包络值的平均误差计算每一帧的频域因子;
若存在时域因子大于第一预设阈值,且频域因子大于第二预设阈值的帧时,确定所述信号包括麦克风吹气信号;否则,确定所述信号不包括麦克风吹气信号。
在另一个实施例中,
所述确定单元,具体用于根据每一帧的短时能量计算每一帧的时域因子时,执行如下操作:
若确定当前帧的短时能量不小于第三预设阈值,则当前帧的时域因子为前一帧的时域因子与第一预设数值的和;
若确定当前帧的短时能量小于第三预设阈值,则当前帧的时域因子为第二预设数值。
在另一个实施例中,
所述确定单元,具体用于根据每一帧的各频点谱包络值的平均误差计算每一帧的频域因子时,执行如下操作:
确定当前帧的各频点谱包络值的平均误差是否小于第四预设阈值,如果是,当前帧的频域因子为前一帧的频域因子与第三预设数值的和;否则,当前帧的频域因子为第四预设数值。
在另一个实施例中,
所述确定单元,具体用于获取每一帧的各频点谱包络值的平均误差时,执行如下操作:
计算每一帧中的每个频点的短时功率谱;
计算滑动窗内的频点对应的短时功率谱的平均值,以及对应的估计值;
根据所述滑动窗内的频点对应的短时功率谱的平均值和所述估计值计算各频点谱包络值的平均误差。
在另一个实施例中,
所述确定单元,具体用于计算滑动窗内的频点对应的短时功率谱的平均值时,执行如下操作:
基于每一帧的短时能量,计算每一帧的平滑能量;
若当前帧的短时能量大于当前帧的平滑能量与比例因子的乘积,以及第五预设阈值中较大的数值时,保持当前帧的所有频点对应的短时功率谱不变;否则,将当前帧的所有频点对应的短时功率谱置为0;
将所述所有帧的该频点的短时功率谱的均值与第六预设阈值中的较大的值作为滑动窗内该频点对应的短时功率谱的平均值。
在另一个实施例中,
所述确定单元,具体用于计算所述滑动窗内的频点的短时功率谱的平均值对应的估计值时,执行如下操作:
将所述滑动窗内的频点的短时功率谱的平均值转换为dB值;
使用所述频点和所述dB值进行直线拟合,获得斜率和截距;
根据所述斜率和截距计算所述滑动窗内的频点的短时功率谱的平均值对应的估计值。
在另一个实施例中,所述装置还包括:处理单元;
所述处理单元,用于若所述确定单元确定所述信号为麦克风吹气信号,则根据配置信息确定所述麦克风吹气信号对应的指令;并根据所述指令执行对应的操作。
上述实施例的单元可以集成于一体,也可以分离部署;可以合并为一个单元,也可以进一步拆分成多个子单元。
在另一个实施例中,还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述麦克风信号检测方法的步骤。
在另一个实施例中,还提供一种计算机可读存储介质,其上存储有计算机指令,所述指令被处理器执行时可实现所述麦克风信号检测方法中的步骤。
在另一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现所述麦克风吹气信号检测的方法。
图9为本发明实施例提供的电子设备的实体结构示意图。如图9所示,该电子设备可以包括:处理器(Processor)910、通信接口(Communications Interface)920、存储器(Memory)930和通信总线940,其中,处理器910,通信接口920,存储器930通过通信总线940完成相互间的通信。处理器910可以调用存储器930中的逻辑指令,以执行如下方法:
获取通过麦克风采集的信号;
确定所述信号是否包括麦克风吹气信号;
其中,所述确定所述信号是否包括麦克风吹气信号,包括:
对输入的信号进行分帧处理,以得到至少一帧;
获取每一帧的短时能量;
根据每一帧的短时能量计算每一帧的时域因子;
获取每一帧的各频点谱包络值的平均误差;
根据每一帧的各频点谱包络值的平均误差计算每一帧的频域因子;
若存在时域因子大于第一预设阈值,且频域因子大于第二预设阈值的帧时,确定所述信号包括麦克风吹气信号;否则,确定所述信号不包括麦克风吹气信号。
此外,上述的存储器930中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
参见图10,图10为本申请实施例提供的麦克风吹气信号检测系统示意图。所述系统包括:
麦克风以及图9所述的电子设备,其中,所述麦克风与所述电子设备信号连接。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (11)

1.一种麦克风吹气信号检测方法,其特征在于,所述方法包括:
获取通过麦克风采集的信号;
确定所述信号是否包括麦克风吹气信号;
其中,所述确定所述信号是否包括麦克风吹气信号,包括:
对输入的信号进行分帧处理,以得到至少一帧;
获取每一帧的短时能量;
根据每一帧的短时能量计算每一帧的时域因子;
获取每一帧的各频点谱包络值的平均误差;
根据每一帧的各频点谱包络值的平均误差计算每一帧的频域因子;
若存在时域因子大于第一预设阈值,且频域因子大于第二预设阈值的帧时,确定所述信号包括麦克风吹气信号;否则,确定所述信号不包括麦克风吹气信号。
2.根据权利要求1所述的方法,其特征在于,所述根据每一帧的短时能量计算每一帧的时域因子,包括:
若确定当前帧的短时能量不小于第三预设阈值,则当前帧的时域因子为前一帧的时域因子与第一预设数值的和;
若确定当前帧的短时能量小于第三预设阈值,则当前帧的时域因子为第二预设数值。
3.根据权利要求1所述的方法,其特征在于,所述根据每一帧的各频点谱包络值的平均误差计算每一帧的频域因子,包括:
确定当前帧的各频点谱包络值的平均误差是否小于第四预设阈值,如果是,当前帧的频域因子为前一帧的频域因子与第三预设数值的和;否则,当前帧的频域因子为第四预设数值。
4.根据权利要求1所述的方法,其特征在于,所述获取每一帧的各频点谱包络值的平均误差,包括:
计算每一帧中的每个频点的短时功率谱;
计算滑动窗内的频点对应的短时功率谱的平均值,以及对应的估计值;
根据所述滑动窗内的频点对应的短时功率谱的平均值和所述估计值计算各频点谱包络值的平均误差。
5.根据权利要求4所述的方法,其特征在于,所述计算滑动窗内的频点对应的短时功率谱的平均值,包括:
基于每一帧的短时能量,计算每一帧的平滑能量;
若当前帧的短时能量大于当前帧的平滑能量与比例因子的乘积,以及第五预设阈值中较大的数值时,保持当前帧的所有频点对应的短时功率谱不变;否则,将当前帧的所有频点对应的短时功率谱置为0;
将所述所有帧的该频点的短时功率谱的均值与第六预设阈值中的较大的值作为滑动窗内该频点对应的短时功率谱的平均值。
6.根据权利要求4所述的方法,其特征在于,计算所述滑动窗内的频点的短时功率谱的平均值对应的估计值,包括:
将所述滑动窗内的频点的短时功率谱的平均值转换为dB值;
使用所述频点和所述dB值进行直线拟合,获得斜率和截距;
根据所述斜率和截距计算所述滑动窗内的频点的短时功率谱的平均值对应的估计值。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述方法还包括:
若确定所述信号为麦克风吹气信号,则根据配置信息确定所述麦克风吹气信号对应的指令;
根据所述指令执行对应的操作。
8.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7任一项所述的方法。
9.一种检测系统,其特征在于,所述系统包括:
麦克风以及如权利要求8所述的电子设备,其中,所述麦克风与所述电子设备信号连接。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7任一项所述的方法。
11.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-7任一项所述的方法。
CN202110958267.1A 2021-08-20 2021-08-20 麦克风吹气信号检测方法、装置和系统 Active CN113613159B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110958267.1A CN113613159B (zh) 2021-08-20 2021-08-20 麦克风吹气信号检测方法、装置和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110958267.1A CN113613159B (zh) 2021-08-20 2021-08-20 麦克风吹气信号检测方法、装置和系统

Publications (2)

Publication Number Publication Date
CN113613159A true CN113613159A (zh) 2021-11-05
CN113613159B CN113613159B (zh) 2023-07-21

Family

ID=78308981

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110958267.1A Active CN113613159B (zh) 2021-08-20 2021-08-20 麦克风吹气信号检测方法、装置和系统

Country Status (1)

Country Link
CN (1) CN113613159B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060107824A1 (en) * 2004-11-19 2006-05-25 Nintendo Co., Ltd. Storage medium storing breath blowing determining program, breath blowing determining apparatus, breath blowing determining method, storage medium storing game program, game apparatus, and game control method
WO2011082535A1 (en) * 2010-01-08 2011-07-14 Nokia Corporation User input
US20140309992A1 (en) * 2013-04-16 2014-10-16 University Of Rochester Method for detecting, identifying, and enhancing formant frequencies in voiced speech
CN109814094A (zh) * 2019-02-01 2019-05-28 中国科学院声学研究所东海研究站 一种多目标水声定位时延估计算法
CN111009257A (zh) * 2019-12-17 2020-04-14 北京小米智能科技有限公司 一种音频信号处理方法、装置、终端及存储介质
WO2020248308A1 (zh) * 2019-06-12 2020-12-17 腾讯音乐娱乐科技(深圳)有限公司 音频爆音检测方法、装置和存储介质
CN112102851A (zh) * 2020-11-17 2020-12-18 深圳壹账通智能科技有限公司 语音端点检测方法、装置、设备及计算机可读存储介质
CN112969134A (zh) * 2021-02-07 2021-06-15 深圳市微纳感知计算技术有限公司 麦克风异常检测方法、装置、设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060107824A1 (en) * 2004-11-19 2006-05-25 Nintendo Co., Ltd. Storage medium storing breath blowing determining program, breath blowing determining apparatus, breath blowing determining method, storage medium storing game program, game apparatus, and game control method
WO2011082535A1 (en) * 2010-01-08 2011-07-14 Nokia Corporation User input
US20140309992A1 (en) * 2013-04-16 2014-10-16 University Of Rochester Method for detecting, identifying, and enhancing formant frequencies in voiced speech
CN109814094A (zh) * 2019-02-01 2019-05-28 中国科学院声学研究所东海研究站 一种多目标水声定位时延估计算法
WO2020248308A1 (zh) * 2019-06-12 2020-12-17 腾讯音乐娱乐科技(深圳)有限公司 音频爆音检测方法、装置和存储介质
CN111009257A (zh) * 2019-12-17 2020-04-14 北京小米智能科技有限公司 一种音频信号处理方法、装置、终端及存储介质
CN112102851A (zh) * 2020-11-17 2020-12-18 深圳壹账通智能科技有限公司 语音端点检测方法、装置、设备及计算机可读存储介质
CN112969134A (zh) * 2021-02-07 2021-06-15 深圳市微纳感知计算技术有限公司 麦克风异常检测方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李记龙;王雪琰;翟玉爽;黄敏燕;冯海泓;: "鲁棒性的水下高精度时延估计算法" *

Also Published As

Publication number Publication date
CN113613159B (zh) 2023-07-21

Similar Documents

Publication Publication Date Title
WO2019101123A1 (zh) 语音活性检测方法、相关装置和设备
CN107610708B (zh) 识别声纹的方法及设备
CN108847217A (zh) 一种语音切分方法、装置、计算机设备及存储介质
CN110648691B (zh) 基于语音的能量值的情绪识别方法、装置和系统
US20170154640A1 (en) Method and electronic device for voice recognition based on dynamic voice model selection
WO2021114733A1 (zh) 一种分频段进行处理的噪声抑制方法及其系统
CN110428842A (zh) 语音模型训练方法、装置、设备及计算机可读存储介质
CN107305774A (zh) 语音检测方法和装置
CN110047519B (zh) 一种语音端点检测方法、装置及设备
CN106653047A (zh) 一种音频数据的自动增益控制方法与装置
CN103559888A (zh) 基于非负低秩和稀疏矩阵分解原理的语音增强方法
CN111192599B (zh) 一种降噪方法及装置
CN107274911A (zh) 一种基于声音特征的相似度分析方法
CN113223536B (zh) 声纹识别方法、装置及终端设备
WO2017045429A1 (zh) 一种音频数据的检测方法、系统及存储介质
CN112786057B (zh) 一种声纹识别方法、装置、电子设备及存储介质
CN112562648A (zh) 基于元学习的自适应语音识别方法、装置、设备及介质
EP4189677B1 (en) Noise reduction using machine learning
CN112712816B (zh) 语音处理模型的训练方法和装置以及语音处理方法和装置
CN109376363A (zh) 一种基于耳机的实时语音翻译方法及装置
CN111540342A (zh) 一种能量阈值调整方法、装置、设备及介质
US10522160B2 (en) Methods and apparatus to identify a source of speech captured at a wearable electronic device
CN106297795B (zh) 语音识别方法及装置
CN104364845A (zh) 处理装置、处理方法、程序、计算机可读信息记录介质以及处理系统
CN111161713A (zh) 一种语音性别识别方法、装置及计算设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220121

Address after: 100085 Floor 101 102-1, No. 35 Building, No. 2 Hospital, Xierqi West Road, Haidian District, Beijing

Applicant after: Seashell Housing (Beijing) Technology Co.,Ltd.

Address before: 101399 room 24, 62 Farm Road, Erjie village, Yangzhen, Shunyi District, Beijing

Applicant before: Beijing fangjianghu Technology Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant