CN114125128B - 防窃听的录音方法、装置和终端 - Google Patents
防窃听的录音方法、装置和终端 Download PDFInfo
- Publication number
- CN114125128B CN114125128B CN202111504471.2A CN202111504471A CN114125128B CN 114125128 B CN114125128 B CN 114125128B CN 202111504471 A CN202111504471 A CN 202111504471A CN 114125128 B CN114125128 B CN 114125128B
- Authority
- CN
- China
- Prior art keywords
- audio
- signal
- voice
- energy
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 73
- 230000005236 sound signal Effects 0.000 claims abstract description 98
- 230000007613 environmental effect Effects 0.000 claims description 23
- 238000012545 processing Methods 0.000 claims description 10
- 238000005311 autocorrelation function Methods 0.000 claims description 9
- 238000009432 framing Methods 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 230000002265 prevention Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 210000001260 vocal cord Anatomy 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 210000004704 glottis Anatomy 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 210000004916 vomit Anatomy 0.000 description 1
- 230000008673 vomiting Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/64—Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations
- H04M1/65—Recording arrangements for recording a message from the calling party
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04K—SECRET COMMUNICATION; JAMMING OF COMMUNICATION
- H04K3/00—Jamming of communication; Counter-measures
- H04K3/40—Jamming having variable characteristics
- H04K3/42—Jamming having variable characteristics characterized by the control of the jamming frequency or wavelength
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04K—SECRET COMMUNICATION; JAMMING OF COMMUNICATION
- H04K3/00—Jamming of communication; Counter-measures
- H04K3/80—Jamming or countermeasure characterized by its function
- H04K3/82—Jamming or countermeasure characterized by its function related to preventing surveillance, interception or detection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/68—Circuit arrangements for preventing eavesdropping
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Circuit For Audible Band Transducer (AREA)
- Telephone Function (AREA)
Abstract
本申请公开了一种防窃听的录音方法、装置和终端,属于电子技术领域。一种防窃听的录音方法包括:处于录音状态时,获取人声音频;根据所述人声音频,确定音频信号特征;根据所述音频信号特征,生成超声波干扰信号;发射所述超声波干扰信号。
Description
技术领域
本申请属于电子技术领域,具体涉及一种防窃听的录音方法、装置和终端。
背景技术
随着科技的发展,各类窃听设备越来越多。在终端的录音功能上加载防窃听功能,成为人们保护录音内容的重要手段。
目前防窃听的录音方法通常包括:通过将固定频率的随机噪声信号调制至固定频率的超声波载波,以生成超声波干扰信号,并将生成的超声波干扰信号发射。从而使得窃听设备仅能接收到覆盖录音音频的超声波干扰信号,无法获取超声波干扰信号覆盖下的录音音频,实现防窃听目的。
然而,由于随机噪声信号和超声波载波的频率固定,因此,可能会存在超声波干扰信号无法覆盖录音音频的情况,防窃听效果较差。
发明内容
本申请实施例的目的是提供一种防窃听的录音方法、装置和终端,能够解决防窃听效果较差的问题。
为了解决上述技术问题,本申请是这样实现的:
第一方面,本申请实施例提供了一种防窃听的录音方法,所述方法包括:
处于录音状态时,获取人声音频;
根据所述人声音频,确定音频信号特征;
根据所述音频信号特征,生成超声波干扰信号;
发射所述超声波干扰信号。
可选的,所述根据所述音频信号特征,生成超声波干扰信号,包括:
生成与所述音频信号特征相匹配的噪声信号,以及生成与所述音频信号特征相匹配的超声波载波;
将所述噪声信号调制至所述超声波载波,得到所述超声波干扰信号。
可选的,所述音频信号特征至少包括:音频频率范围和音频能量;所述噪声信号包括:随机噪声信号;所述生成与所述音频信号特征相匹配的噪声信号,包括:
生成信号频率位于所述音频频率范围内的随机噪声信号;
将所述随机噪声信号的能量调整至大于所述音频能量的数值,得到调整后的随机噪声信号。
可选的,所述音频信号特征还包括:音频基音频率;所述噪声信号还包括:纯音噪声信号;所述生成与所述音频信号特征相匹配的噪声信号,还包括:
生成信号频率低于所述音频基音频率的纯音噪声信号;
将所述纯音噪声信号的能量调整至大于所述音频能量的数值,得到调整后的纯音噪声信号。
可选的,所述音频信号特征至少包括:音频能量;所述生成与所述音频信号特征相匹配的超声波载波,包括:
将所述超声波载波的能量调整至大于所述音频能量的数值,得到调整后的超声波载波。
可选的,所述获取人声音频,包括:
获取环境音频,所述环境音频包括:所述超声波干扰信号和所述人声音频;
过滤所述环境音频中的所述超声波干扰信号,得到所述人声音频。
可选的,所述根据所述人声音频,确定音频信号特征,包括:
将所述人声音频进行傅里叶变换处理,得到所述人声音频的频域信号;
将所述频域信号分布的频率范围作为所述音频频率范围;
对所述人声音频进行分帧处理,得到多个音频帧;
计算各所述音频帧的短时平均能量的平均值,作为所述音频能量。
第二方面,本申请实施例提供了一种防窃听的录音装置,所述装置包括:
获取模块,用于处于录音状态时,获取人声音频;
确定模块,用于根据所述人声音频,确定音频信号特征;
生成模块,用于根据所述音频信号特征,生成超声波干扰信号;
发射模块,用于发射所述超声波干扰信号。
第三方面,本申请实施例提供了一种终端,该终端包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
本申请实施例中,在处于录音状态时,通过根据获取的人声音频,确定音频信号特征。并根据音频信号特征生成超声波干扰信号,并发射生成的超声波干扰信号。从而使得窃听设备拾取超声波干扰信号而不拾取覆盖于超声波干扰信号下的人声音频,达到防窃听的目的。并且,由于超声波干扰信号是根据人声音频的音频信号特征生成的,这就使得发射的超声波干扰信号可以根据人声音频自适应调整。因此,相较于相关技术,保障了超声波干扰信号对人声音频的覆盖程度,避免了超声波干扰信号无法覆盖人声音频的情况,提高了防窃听效果。
附图说明
图1是本申请实施例提供的一种终端的结构示意图。
图2是本申请实施例提供的一种防窃听的录音方法的流程图。
图3是本申请实施例提供的一种音频信号特征分析方法的流程图。
图4是本申请实施例提供的一种超声波干扰信号生成方法的流程图。
图5是本申请实施例提供的另一种终端的结构示意图。
图6是本申请实施例提供的一种防窃听的录音装置的框图。
图7是本申请实施例提供的一种电子设备的框图。
图8是本申请实施例提供的一种终端的硬件结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的防窃听的录音方法进行详细地说明。
请参考图1,其示出了本申请实施例提供的一种终端的结构示意图。如图1所示,该终端包括:终端主体、扬声器101以及麦克风。扬声器101和麦克风均设置于终端主体上。扬声器101可以用于发射超声波干扰信号,该超声波干扰信号根据本申请实施例提供的防窃听的录音方法生成。麦克风可以用于在终端处于录音状态的情况下,采集终端对应的用户的人声音频。当然,由于扬声器和麦克风处于同一环境中,因此,麦克风可以还用于采集超声波干扰信号。可选地,终端包括的麦克风的数量可以为多个。图1以终端包括两个麦克风(102A和102B)为例说明。该两个麦克风可以主麦克风102A以及副麦克风102B。
请参考图2,其示出了本申请实施例提供的一种防窃听的录音方法的流程图。防窃听的录音方法可以应用于终端。可选的,该终端可以为图1所示的终端,本申请实施例以本申请实施例提供的防窃听的录音方式应用于图1所示的终端为例进行说明。如图2所示,防窃听的录音方法包括:
步骤201、处于录音状态时,获取人声音频。
本申请实施例中,用户在想要录音时可以控制终端处于录音状态,以使得终端可以通过麦克风获取人声音频。
可选的,终端可以实时判断人声音频中是否包括用户语音音频,以判断当前用户是否发出声音。在人声音频不包括用户语音音频时,表明当前用户没有发声,终端可以控制扬声器停止发射超声波干扰信号,以使得终端暂停执行本申请实施例提供的防窃听的录音方法,减少终端运算开销。在人声音频包括用户语音音频时,表明当前用户发出声音,终端可以执行下述步骤以控制扬声器发射生成的超声波干扰信号,实现终端的防窃听功能。
示例的,终端可以将用户语音音频输入人声识别模型,得到识别结果。在识别结果指示人声音频不包括用户语音音频时,控制扬声器停止发射超声波干扰信号。在识别结果指示人声音频包括用户语音音频时,执行下述步骤以控制扬声器发射生成的超声波干扰信号。其中,人声识别模型可以是根据包括用户语音音频的人声音频作为正样本,以及不包括用户语音音频的人声音频作为负样本对机器模型训练得到。
步骤202、根据人声音频,确定音频信号特征。
本申请实施例中,音频信号特征可以包括多种用于反映音频特征的信息。根据音频信号特征包括的内容不同,终端根据人声音频确定音频信号特征的方式也不同。本申请实施例以以下两种为例进行说明。
在第一种可选的情况下,如图3所示,音频信号特征可以至少包括音频频率范围以及音频能量。终端根据人声音频,确定音频信号特征的过程可以包括:
步骤301、将人声音频进行傅里叶变换处理,得到人声音频的频域信号。
其中,傅里叶变换处理用于将人声音频的时域信号变为频域信号。
步骤302、将频域信号分布的频率范围作为音频频率范围。
本申请实施例中,人声音频的频域信号分布的频率范围称为音频频率范围,又称为音频频率分量。
步骤303、对人声音频进行分帧处理,得到多个音频帧。
可选地,终端对人声音频进行分帧处理,得到多个音频帧的过程可以包括:获取人声音频对应的完整频谱图,以预定时间间隔(例如15毫秒的时间间隔)随机提取其固定时间长度(例如11.6毫秒窗长)的频谱图分段,得到多个频谱图分段。获取与每个频谱图分段分别对应的音频分帧,频谱分段与音频分帧一一对应。其中,预定时间间隔和固定时间长度可以是缺省值,也可以根据实际应用情况手动设置。
或者,终端对人声音频进行分帧处理,得到多个音频帧的过程可以包括:终端以帧长为目标数值对人声音频进行划分,得到多个音频帧。示例的,帧长可以为480(16kHZ*30ms)。
步骤304、计算各音频帧的短时平均能量的平均值,作为音频能量。
本申请实施例中,终端可以针对每个音频帧,分别计算其对应的短时平均能量。将各音频帧的短时平均能量的平均值作为音频能量。音频能量可以简称为能量。其中,终端可以利用滑动平均的方法计算每一个音频帧的短时平均能量。
在第二种可选的情况下,音频信号特征可以在包括音频频率范围以及音频能量的基础上,还可以包括:音频基音频率。
用户在发音时,根据用户的声带是否震动可以将用户发出的用户语音音频分为清音和浊音两种类型。其中,浊音又称有声语言,其携带有大量能量。浊音在时域上具有明显的周期性。清音类似于白噪声,其在时域上没有明显的周期性。用户在发浊音时,气流通过声门使声带产生张弛震荡式振动,进而产生准周期的激励脉冲串,这种声带振动的频率称为基音频率。
终端根据人声音频,确定音频信号特征的过程在包括前述步骤301至步骤304的基础上还可以包括:计算音频基音频率。
本申请实施例中,终端可以采用自相关函数法计算音频基音频率。其中,音频基音频率可以通过自相关函数法计算。自相关函数法原理是假设人声音频的音频信号s(n)具有周期性,那么音频信号s(n)的自相关函数也具有周期性,并且音频信号s(n)的自相关函数的周期性与音频信号s(n)相同。在音频信号s(n)的信号周期的整数倍上,音频信号s(n)的自相关函数可以达到最大值,因此可以通过音频信号s(n)的自相关函数的第一个最大值的时间轴坐标估计出音频信号s(n)的基音周期,通过音频信号s(n)的采样频率除以最大值的时间轴坐标即可得到音频信号s(n)基音频率,也即是人声音频的音频基音频率。
需要说明的是,终端还可以采用其他方法计算人声音频的音频基音频率。例如,采用倒谱法计算音频基音频率。本申请实施例对此不做限定。
步骤203、根据音频信号特征,生成超声波干扰信号。
可选的,如图4所示,终端根据音频信号特征,生成超声波干扰信号的过程可以包括:
步骤401、生成与音频信号特征相匹配的噪声信号,以及生成与音频信号特征相匹配的超声波载波。
与前述第一种可选的实现音频信号特征的获取方法对应,也即是在音频信号特征至少包括音频频率范围和音频能量的情况下,噪声信号可以包括:随机噪声信号。终端生成与音频信号特征相匹配的噪声信号的过程可以包括:
生成信号频率位于音频频率范围内的随机噪声信号。将随机噪声信号的能量调整至大于音频能量的数值,得到调整后的随机噪声信号。
可选的,终端可以将随机噪声信号的能量调整至大于音频能量的任一数值。或者,终端可以将随机噪声信号的能量调整至比音频能量大于设定能量值的数值。或者,终端可以将随机噪声信号的能量调整至大于音频能量的任一数值,且音频能量越大,调整至的数值即调整后的超声波载波的能量越大。
针对后两种音频能量越大,调整后的超声波载波的能量越大的情况,调整后的随机噪声信号的能量与音频能量呈正比,也即是音频能量越大,调整后的随机噪声信号的能量在满足其大于音频能量的基础上越大。相反,音频能量越小,调整后的随机噪声信号的能量在满足其大于音频能量的基础上越小。这样,由于信号的能量和信号的功率呈正比,因此,灵活调节随机噪声信号的功率,使得在人声音频的音频能量越小,调整后的随机噪声信号的功率在满足其大于音频能量的基础上越小,减少终端功耗。
与前述第二种可选的实现音频信号特征的获取方法对应,也即是在音频信号特征包括音频频率范围、音频能量以及音频基音频率的情况下。噪声信号还可以包括:纯音噪声信号。终端生成与音频信号特征相匹配的噪声信号可以包括:
生成信号频率位于音频频率范围内的随机噪声信号。将随机噪声信号的能量调整至大于音频能量的数值,得到调整后的随机噪声信号。生成信号频率低于音频基音频率的纯音噪声信号。将纯音噪声信号的能量调整至大于音频能量的数值,得到调整后的纯音噪声信号。
其中,纯音噪声信号指的是信号频率单一的噪声。由于纯音噪声信号对人声音频中基音具有良好的遮蔽作用,因此,包括纯音噪声信号的噪声信号可以人声音频起到更好遮蔽作用,有利用提升防窃听效果。
可选的,终端可以生成信号频率低于音频基音频率任一数值的纯音噪声信号。或者,终端可以生成信号频率低于音频基音频率设定频率值的纯音噪声信号。或者,终端可以生成信号频率低于音频基音频率任一数值的纯音噪声信号,且音频基音频率越大,生成的纯音噪声信号的信号频率越大。
可选的,终端可以将纯音噪声信号的能量调整至大于音频能量的任一数值。或者,终端可以将纯音噪声信号的能量调整至比音频能量大于设定能量值的数值。或者,终端可以将纯音噪声信号的能量调整至大于音频能量的任一数值,且音频能量越大,调整至的数值即调整后的超声波载波的能量越大。
针对后两种音频能量越大,调整后的超声波载波的能量越大的情况,调整后的纯音噪声信号的能量与音频能量呈正比,也即是音频能量越大,调整后的纯音噪声信号的能量在满足其大于音频能量的基础上越大。相反,音频能量越小,调整后的纯音噪声信号的能量在满足其大于音频能量的基础上越小。这样,由于信号的能量和信号的功率呈正比,因此,灵活调节纯音噪声信号的功率,使得在人声音频的音频能量越小,调整后的纯音噪声信号的功率在满足其大于音频能量的基础上越小,减少终端功耗。类似的,针对音频基音频率越大,生成的纯音噪声信号的信号频率越大的情况。这样,由于信号的频率和信号的功率也呈正比,因此,灵活调节纯音噪声信号的功率,使得在人声音频的音频基音频率越小,调整后的纯音噪声信号的功率在满足其信号频率低于音频基音频率的基础上越小,减少终端功耗。
可选的,与前述二种可选的实现音频信号特征的获取方法对应,也即是在音频信号特征包括音频能量的情况下。终端生成与音频信号特征相匹配的超声波载波的过程可以包括:将超声波载波的能量调整至大于音频能量的数值,得到调整后的超声波载波。
可选的,终端可以将超声波载波的能量调整至大于音频能量的任一数值。或者,终端可以将超声波载波的能量调整至比音频能量大于设定能量值的数值。或者,终端可以将超声波载波的能量调整至大于音频能量的任一数值,且音频能量越大,调整至的数值即调整后的超声波载波的能量越大。
针对后两种音频能量越大,调整后的超声波载波的能量越大的情况,调整后的超声波载波的能量与音频能量呈正比,也即是音频能量越大,调整后的超声波载波的能量在满足其大于音频能量的基础上越大。相反,音频能量越小,调整后的超声波载波的能量在满足其大于音频能量的基础上越小。这样,由于信号的能量和信号的功率呈正比,因此,灵活调节超声波载波的功率,使得在人声音频的音频能量越小,调整后的超声波载波的功率在满足其大于音频能量的基础上越小,减少终端功耗。
步骤402、将噪声信号调制至超声波载波,得到超声波干扰信号。
示例的,针对音频能量越大,调整后的随机噪声信号、纯音噪声信号以及超声波载波的能量越大的情况。在用户说话声音变小时,终端通过麦克风获取的人声音频的音频能量变小。则终端生成的随机噪声信号、纯音噪声信号以及超声波载波的能量变小,进而使得随机噪声信号、纯音噪声信号以及超声波载波的功率减小。因此,在随机噪声信号、纯音噪声信号以及超声波载波的能量可以满足大于音频能量的情况下,也即是将随机噪声信号和纯音噪声信号调制至超声波载波,得到的超声波干扰信号满足可以覆盖人声音频的情况下,减少终端功耗,降低超声波干扰信号对人体的影响。
需要说明的是,终端生成与音频信号特征相匹配的超声波干扰信号的过程可以替换为:生成与音频信号特征相匹配的噪声信号,将噪声信号调制至超声波载波,得到超声波干扰信号。或者,终端生成与音频信号特征相匹配的超声波干扰信号的过程还可以替换为:生成噪声信号,以及生成与音频信号特征相匹配的超声波载波。将噪声信号调制至超声波载波,得到超声波干扰信号。其中,终端生成与音频信号特征相匹配的噪声信号的实现方式,以及生成与音频信号特征相匹配的超声波载波的实现方式可以参考前述步骤401中的相关解释和实现方式,本申请实施例对此不做赘述。
步骤204、发射超声波干扰信号。
本申请实施例中,终端可以控制扬声器发射超声波干扰信号。如果终端所处的场景中存在窃听设备,则该窃听设备可以将同时拾取到超声波干扰信号和人声音频。而由于用于调制生成超声波干扰信号的随机噪声信号、纯音噪声信号以及超声波载波的能量大于人声音频的音频能量,而能量与功率呈正比。因此,超声波干扰信号的功率大于人声音频,且超声波干扰信号中包括针对人声音频中基音的掩蔽信号,即纯音噪声。因而超声波干扰信号可以覆盖全部的人声音频,窃听者通过窃听设备仅能听到超声波干扰信号中的噪声,而无法获取人声音频,实现了终端防窃听的功能。
需要说明的是,由于终端控制扬声器发射超声波干扰信号,且终端的扬声器和麦克风可能同时工作。因此,扬声器发射的超声波干扰信号可能会被麦克风采集。而在室内环境下扬声器发送的超声波干扰信号可能会有反射回波,终端的麦克风更有可能会采集到超声波干扰信号。因而,步骤201中终端获取人声音频的过程可以包括:
获取环境音频,环境音频包括:超声波干扰信号和人声音频。过滤环境音频中的超声波干扰信号,得到人声音频。
可选的,终端获取其生成的超声波干扰信号,并在获取环境音频后,针对环境音频中的超声波干扰信号进行滤波处理,得到处理后的人声音频。其中,由于终端的麦克风也可能会采集到超声波干扰信号x(n)。因此,通过麦克风获取环境音频的音频信号可以为y(n),y(n)=x(n)+l(n),l(n)为人生音频的音频信号。因而,通过过滤环境音频中的超声波干扰信号,可以消除麦克风采集的环境音频中的超声波干扰信号,得到准确地人声音频。
本申请实施例中,在处于录音状态时,通过根据获取的人声音频,确定音频信号特征。并根据音频信号特征生成超声波干扰信号,并发射生成的超声波干扰信号。从而使得窃听设备拾取超声波干扰信号而不拾取覆盖于超声波干扰信号下的人声音频,达到防窃听的目的。并且,由于超声波干扰信号是根据人声音频的音频信号特征生成的,这就使得发射的超声波干扰信号可以根据人声音频自适应调整。因此,相较于相关技术,保障了超声波干扰信号对人声音频的覆盖程度,避免了超声波干扰信号无法覆盖人声音频的情况,提高了防窃听效果。
请参考图5,其示出了本申请实施例提供的另一种终端的结构示意图。本申请任一实施例提供的防窃听的录音方法也可以应用于图5所示的终端,本申请实施例以应用于图5所示的终端对本申请实施例提供的防窃听的录音方法进行进一步说明。如图5所示,终端可以包括:麦克风501、智能防窃听系统502以及扬声器503。智能防窃听系统502可以包括:回声消除模块5021、调制模块5022、语音分析模块5023以及噪声生成模块5024。
其中,麦克风501用于在处于录音状态时,获取环境音频,并将环境音频传输至回声消除模块5021。回声消除模块5021用于过滤环境音频中的超声波干扰信号,得到人声音频,并将人声音频传输至语音分析模块5023。语音分析模块5023用于根据人声音频,确定音频信号特征,音频信号特征可以包括音频频率范围、音频能量以及音频基音频率。语音分析模块5023还用于将音频信号特征分别传输至调制模块5022和噪声生成模块5024。噪声生成模块5024用于生成与音频信号特征相匹配的噪声信号,并将该噪声信号传输至调制模块5022。调制模块5022用于生成与音频信号特征相匹配的超声波载波,并将噪声信号调制至超声波载波,得到超声波干扰信号。将超声波干扰信号传输至扬声器503。扬声器503用于发射超声波干扰信号。
本申请实施例中,各部件执行的方法的解释和实现方式可以参考前述图2、图3或者图4所示的防窃听的录音方法中相关步骤的解释和实现方式,本申请实施例对此不做赘述。
本申请实施例中,在处于录音状态时,通过根据获取的人声音频,确定音频信号特征。并根据音频信号特征生成超声波干扰信号,并发射生成的超声波干扰信号。从而使得窃听设备拾取超声波干扰信号而不拾取覆盖于超声波干扰信号下的人声音频,达到防窃听的目的。并且,由于超声波干扰信号是根据人声音频的音频信号特征生成的,这就使得发射的超声波干扰信号可以根据人声音频自适应调整。因此,相较于相关技术,保障了超声波干扰信号对人声音频的覆盖程度,避免了超声波干扰信号无法覆盖人声音频的情况,提高了防窃听效果。
需要说明的是,本申请实施例提供的防窃听的录音方法,执行主体可以为防窃听的录音装置,或者该防窃听的录音装置中的用于执行防窃听的录音方法的控制模块。本申请实施例中以防窃听的录音装置执行防窃听的录音方法为例,说明本申请实施例提供的防窃听的录音装置。
请参考图6,其示出了本申请实施例提供的一种防窃听的录音装置的框图。如图6所示,防窃听的录音装置600,包括:获取模块601、确定模块602、生成模块603以及发射模块604。
获取模块601,用于处于录音状态时,获取人声音频;
确定模块602,用于根据人声音频,确定音频信号特征;
生成模块603,用于根据音频信号特征,生成超声波干扰信号;
控制模块604,用于发射超声波干扰信号。
可选的,生成模块603,还用于:
生成与所述音频信号特征相匹配的噪声信号,以及生成与所述音频信号特征相匹配的超声波载波;
将所述噪声信号调制至所述超声波载波,得到所述超声波干扰信号。
可选的,所述音频信号特征至少包括:音频频率范围和音频能量;所述噪声信号包括:随机噪声信号;生成模块603,还用于:
生成信号频率位于所述音频频率范围内的随机噪声信号;
将所述随机噪声信号的能量调整至大于所述音频能量的数值,得到调整后的随机噪声信号。
可选的,所述音频信号特征还包括:音频基音频率;所述噪声信号还包括:纯音噪声信号;生成模块603,还用于:
生成信号频率低于所述音频基音频率的纯音噪声信号;
将所述纯音噪声信号的能量调整至大于所述音频能量的数值,得到调整后的纯音噪声信号。
可选的,所述音频信号特征至少包括:音频能量;生成模块603,还用于:
将所述超声波载波的能量调整至大于所述音频能量的数值,得到调整后的超声波载波。
可选的,获取模块601,还用于:
获取环境音频,所述环境音频包括:所述超声波干扰信号和所述人声音频;
过滤所述环境音频中的所述超声波干扰信号,得到所述人声音频。
可选的,确定模块602,还用于:
将所述人声音频进行傅里叶变换处理,得到所述人声音频的频域信号;
将所述频域信号分布的频率范围作为所述音频频率范围;
对所述人声音频进行分帧处理,得到多个音频帧;
计算各所述音频帧的短时平均能量的平均值,作为所述音频能量。
本申请实施例中,在处于录音状态时,通过根据获取的人声音频,确定音频信号特征。并根据音频信号特征生成超声波干扰信号,并发射生成的超声波干扰信号。从而使得窃听设备拾取超声波干扰信号而不拾取覆盖于超声波干扰信号下的人声音频,达到防窃听的目的。并且,由于超声波干扰信号是根据人声音频的音频信号特征生成的,这就使得发射的超声波干扰信号可以根据人声音频自适应调整。因此,相较于相关技术,保障了超声波干扰信号对人声音频的覆盖程度,避免了超声波干扰信号无法覆盖人声音频的情况,提高了防窃听效果。
本申请实施例中的防窃听的录音装置可以是装置,也可以是终端中的部件、集成电路、或芯片。该装置可以是移动终端,也可以为非移动终端。示例性的,移动终端可以为手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personal digitalassistant,PDA)等,非移动终端可以为服务器、网络附属存储器(Network AttachedStorage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的防窃听的录音装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为ios操作系统,还可以为其他可能的操作系统,本申请实施例不作具体限定。
本申请实施例提供的防窃听的录音装置能够实现图2至图5任一所示的方法实施例实现的各个过程,为避免重复,这里不再赘述。
可选的,如图7所示,本申请实施例还提供一种电子设备700。该电子设备可以为终端700,其包括处理器701,存储器702,存储在存储器702上并可在所述处理器701上运行的程序或指令,该程序或指令被处理器701执行时实现上述防窃听的录音方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,本申请实施例中的终端包括上述所述的移动终端和非移动终端。
图8为实现本申请实施例的一种终端的硬件结构示意图。该终端800包括但不限于:射频单元801、网络模块802、音频输出单元803、输入单元804、传感器805、显示单元806、用户输入单元807、接口单元808、存储器809、以及处理器810等部件。
本领域技术人员可以理解,终端800还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器810逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图8中示出的终端结构并不构成对终端的限定,终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
其中,输入单元804,用于处于录音状态时,获取人声音频;
处理器810,用于根据所述人声音频,确定音频信号特征;根据所述音频信号特征,生成超声波干扰信号;
音频输出单元803,用于发射所述超声波干扰信号。
本申请实施例中,在处于录音状态时,通过根据获取的人声音频,确定音频信号特征。并根据音频信号特征生成超声波干扰信号,并发射生成的超声波干扰信号。从而使得窃听设备拾取超声波干扰信号而不拾取覆盖于超声波干扰信号下的人声音频,达到防窃听的目的。并且,由于超声波干扰信号是根据人声音频的音频信号特征生成的,这就使得发射的超声波干扰信号可以根据人声音频自适应调整。因此,相较于相关技术,保障了超声波干扰信号对人声音频的覆盖程度,避免了超声波干扰信号无法覆盖人声音频的情况,提高了防窃听效果。
可选的,处理器810,还用于:
生成与所述音频信号特征相匹配的噪声信号,以及生成与所述音频信号特征相匹配的超声波载波;
将所述噪声信号调制至所述超声波载波,得到所述超声波干扰信号。
可选的,所述音频信号特征至少包括:音频频率范围和音频能量;所述噪声信号包括:随机噪声信号;处理器810,还用于:
生成信号频率位于所述音频频率范围内的随机噪声信号;
将所述随机噪声信号的能量调整至大于所述音频能量的数值,得到调整后的随机噪声信号。
可选的,所述音频信号特征还包括:音频基音频率;所述噪声信号还包括:纯音噪声信号;处理器810,还用于:
生成信号频率低于所述音频基音频率的纯音噪声信号;
将所述纯音噪声信号的能量调整至大于所述音频能量的数值,得到调整后的纯音噪声信号。
可选的,所述音频信号特征至少包括:音频能量;处理器810,还用于:
将所述超声波载波的能量调整至大于所述音频能量的数值,得到调整后的超声波载波。
可选的,输入单元804,还用于获取环境音频,所述环境音频包括:所述超声波干扰信号和所述人声音频;
处理器810,还用于过滤所述环境音频中的所述超声波干扰信号,得到所述人声音频。
可选的,处理器810,还用于:
将所述人声音频进行傅里叶变换处理,得到所述人声音频的频域信号;
将所述频域信号分布的频率范围作为所述音频频率范围;
对所述人声音频进行分帧处理,得到多个音频帧;
计算各所述音频帧的短时平均能量的平均值,作为所述音频能量。
应理解的是,本申请实施例中,输入单元804可以包括图形处理器(GraphicsProcessing Unit,GPU)8041和麦克风8042,图形处理器8041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元806可包括显示面板8061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板8061。用户输入单元807包括触控面板8071以及其他输入设备8072。触控面板8071,也称为触摸屏。触控面板8071可包括触摸检测装置和触摸控制器两个部分。其他输入设备8072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。存储器809可用于存储软件程序以及各种数据,包括但不限于应用程序和操作系统。处理器810可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器810中。
本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述防窃听的录音方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的终端中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述防窃听的录音方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。
Claims (6)
1.一种防窃听的录音方法,其特征在于,所述方法包括:
处于录音状态时,获取人声音频;
根据所述人声音频,确定音频信号特征;
根据所述音频信号特征,生成超声波干扰信号;
发射所述超声波干扰信号;
所述音频信号特征至少包括:音频频率范围、音频基音频率和音频能量;所述根据所述人声音频,确定音频信号特征,包括:
将所述人声音频进行傅里叶变换处理,得到所述人声音频的频域信号;
将所述频域信号分布的频率范围作为所述音频频率范围;
对所述人声音频进行分帧处理,得到多个音频帧;
计算各所述音频帧的短时平均能量的平均值,作为所述音频能量;
采用自相关函数法或者倒谱法计算所述音频基音频率;
噪声信号包括:纯音噪声信号;所述根据所述音频信号特征,生成超声波干扰信号,包括:
生成信号频率低于所述音频基音频率的纯音噪声信号;
将所述纯音噪声信号的能量调整至大于所述音频能量的数值,得到调整后的纯音噪声信号;
将超声波载波的能量调整至大于所述音频能量的数值,得到调整后的超声波载波;
将所述纯音噪声信号调制至所述调整后的超声波载波,得到所述超声波干扰信号;
所述发射所述超声波干扰信号,包括:
将所述人声音频输入人声识别模型,得到识别结果;所述人声识别模型是根据包括所述人声音频作为正样本以及不包括所述人声音频作为负样本对机器模型训练得到的;
在所述识别结果指示所述人声音频包括用户语音音频时,发射所述生成的超声波干扰信号;
在所述识别结果指示所述人声音频不包括用户语音音频时,停止发射所述超声波干扰信号。
2.根据权利要求1所述的方法,其特征在于,所述噪声信号还包括:随机噪声信号;所述生成与所述音频信号特征相匹配的噪声信号,包括:
生成信号频率位于所述音频频率范围内的随机噪声信号;
将所述随机噪声信号的能量调整至大于所述音频能量的数值,得到调整后的随机噪声信号。
3.根据权利要求1所述的方法,其特征在于,所述获取人声音频,包括:
获取环境音频,所述环境音频包括:所述超声波干扰信号和所述人声音频;
过滤所述环境音频中的所述超声波干扰信号,得到所述人声音频。
4.一种防窃听的录音装置,其特征在于,所述装置包括:
获取模块,用于处于录音状态时,获取人声音频;
确定模块,用于根据所述人声音频,确定音频信号特征;
生成模块,用于根据所述音频信号特征,生成超声波干扰信号;
发射模块,用于发射所述超声波干扰信号;
所述音频信号特征至少包括:音频频率范围、音频基音频率和音频能量;所述确定模块,还用于将所述人声音频进行傅里叶变换处理,得到所述人声音频的频域信号;将所述频域信号分布的频率范围作为所述音频频率范围;对所述人声音频进行分帧处理,得到多个音频帧;计算各所述音频帧的短时平均能量的平均值,作为所述音频能量;采用自相关函数法或者倒谱法计算所述音频基音频率;
噪声信号包括:纯音噪声信号;所述生成模块,还用于生成信号频率低于所述音频基音频率的纯音噪声信号;将所述纯音噪声信号的能量调整至大于所述音频能量的数值,得到调整后的纯音噪声信号;将超声波载波的能量调整至大于所述音频能量的数值,得到调整后的超声波载波;将所述纯音噪声信号调制至所述调整后的超声波载波,得到所述超声波干扰信号;
所述发射模块,还用于将所述人声音频输入人声识别模型,得到识别结果;所述人声识别模型是根据包括所述人声音频作为正样本以及不包括所述人声音频作为负样本对机器模型训练得到的;在所述识别结果指示所述人声音频包括用户语音音频时,发射所述生成的超声波干扰信号;在所述识别结果指示所述人声音频不包括用户语音音频时,停止发射所述超声波干扰信号。
5.一种终端,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1至3任一项所述的防窃听的录音方法的步骤。
6.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1至3任一项所述的防窃听的录音方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111504471.2A CN114125128B (zh) | 2021-12-09 | 2021-12-09 | 防窃听的录音方法、装置和终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111504471.2A CN114125128B (zh) | 2021-12-09 | 2021-12-09 | 防窃听的录音方法、装置和终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114125128A CN114125128A (zh) | 2022-03-01 |
CN114125128B true CN114125128B (zh) | 2024-07-12 |
Family
ID=80364015
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111504471.2A Active CN114125128B (zh) | 2021-12-09 | 2021-12-09 | 防窃听的录音方法、装置和终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114125128B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114696940B (zh) * | 2022-03-09 | 2023-08-25 | 电子科技大学 | 一种会议室防录音方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105047191A (zh) * | 2015-03-03 | 2015-11-11 | 西北工业大学 | 一种超声波主动消音防窃听窃录的装置及使用该装置防窃听窃录的方法 |
-
2021
- 2021-12-09 CN CN202111504471.2A patent/CN114125128B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105047191A (zh) * | 2015-03-03 | 2015-11-11 | 西北工业大学 | 一种超声波主动消音防窃听窃录的装置及使用该装置防窃听窃录的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114125128A (zh) | 2022-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107464564B (zh) | 语音交互方法、装置及设备 | |
US8532987B2 (en) | Speech masking and cancelling and voice obscuration | |
RU2595636C2 (ru) | Система и способ для генерации аудиосигнала | |
TWI281354B (en) | Voice activity detector (VAD)-based multiple-microphone acoustic noise suppression | |
RU2373584C2 (ru) | Способ и устройство для повышения разборчивости речи с использованием нескольких датчиков | |
CN109256146B (zh) | 音频检测方法、装置及存储介质 | |
CN111124108B (zh) | 模型训练方法、手势控制方法、装置、介质及电子设备 | |
CN107799126A (zh) | 基于有监督机器学习的语音端点检测方法及装置 | |
US11488617B2 (en) | Method and apparatus for sound processing | |
CN111917489B (zh) | 音频信号处理方法、装置和电子设备 | |
CN111986691B (zh) | 音频处理方法、装置、计算机设备及存储介质 | |
KR20080019222A (ko) | 음성-상태 모델을 사용하는 다중-감각 음성 향상을 위한잡읍-감소된 값에 대한 추정치를 구하는 방법, 컴퓨터판독가능 매체 및 깨끗한 음성 값을 식별하는 방법 | |
CN109361995B (zh) | 一种电器设备的音量调节方法、装置、电器设备和介质 | |
EP2945156A1 (en) | Audio signal recognition method and electronic device supporting the same | |
CN104021798A (zh) | 用于通过具有可变频谱增益和可动态调制的硬度的算法对音频信号隔音的方法 | |
CN112352441A (zh) | 增强型环境意识系统 | |
CN114125128B (zh) | 防窃听的录音方法、装置和终端 | |
CN112420073A (zh) | 语音信号处理方法、装置、电子设备和存储介质 | |
EP3614692A1 (en) | Information processing device, information processing method, speech output device, and speech output method | |
CN114067782A (zh) | 音频识别方法及其装置、介质和芯片系统 | |
CN113314121B (zh) | 无声语音识别方法、装置、介质、耳机及电子设备 | |
CN116868265A (zh) | 用于动态声学环境中的数据增强和语音处理的系统和方法 | |
CN111667842B (zh) | 音频信号处理方法及装置 | |
CN111724783A (zh) | 智能设备的唤醒方法、装置、智能设备及介质 | |
CN114464184B (zh) | 语音识别的方法、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |