CN114582374A - 一种双音多频检测方法、系统、介质及设备 - Google Patents

一种双音多频检测方法、系统、介质及设备 Download PDF

Info

Publication number
CN114582374A
CN114582374A CN202210463090.2A CN202210463090A CN114582374A CN 114582374 A CN114582374 A CN 114582374A CN 202210463090 A CN202210463090 A CN 202210463090A CN 114582374 A CN114582374 A CN 114582374A
Authority
CN
China
Prior art keywords
frame data
pseudo
current frame
frequency
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210463090.2A
Other languages
English (en)
Other versions
CN114582374B (zh
Inventor
李强
朱勇
王尧
叶东翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Barrot Wireless Co Ltd
Original Assignee
Barrot Wireless Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Barrot Wireless Co Ltd filed Critical Barrot Wireless Co Ltd
Priority to CN202210463090.2A priority Critical patent/CN114582374B/zh
Publication of CN114582374A publication Critical patent/CN114582374A/zh
Application granted granted Critical
Publication of CN114582374B publication Critical patent/CN114582374B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Telephone Function (AREA)

Abstract

本申请提供一种双音多频检测方法、系统、介质及设备,属于音频编解码技术领域,该方法包括:对当前帧数据进行LC3标准解码,获取当前帧数据对应的谱系数;计算谱系数对应的伪谱系数,并进行归一化处理,得到归一化伪谱系数;根据归一化伪谱系数,计算当前帧数据中各个频点对应的频点能量;在包含当前帧数据在内的预设多帧数据中,若存在一频点对应的频点能量均超过预设能量阈值,则确定当前帧数据中存在双音多频信号。本申请通过利用音频解码过程中的已有信息,辅以少量的计算便可进行双音多频的检测,节省算力,降低功耗,更加适用于低功耗蓝牙的应用场景。

Description

一种双音多频检测方法、系统、介质及设备
技术领域
本申请涉及音频编解码技术领域,尤其涉及一种双音多频检测方法、系统、介质及设备。
背景技术
目前主流的蓝牙音频编码器如下:SBC:A2DP协议强制要求,使用最为广泛,是所有的蓝牙音频设备必须支持的,但音质一般;AAC-LC: 音质较好且应用较为广泛,很多主流的手机都支持,但与SBC相比,内存占用较大,且运算复杂度高,很多蓝牙设备都基于嵌入式平台,电池容量有限,处理器运算能力较差且内存有限,而且,其专利费较高;aptX系列:音质较好,但码率很高,aptX需要码率384kbps,而aptX-HD的码率为576kbps,且为高通独有的技术,较为封闭;LDAC: 音质较好,但码率也很高,分别是330kbps,660kbps和990kbps,由于蓝牙设备所处的无线环境特别复杂,稳定支持如此高的码率有一定的困难,且为索尼独有的技术,也很封闭;LHDC:音质较好,但码率也很高,典型的包括400kbps,600kbp和900kbps,如此高的码率,对于蓝牙的基带/射频设计提出了很高的要求。
基于上述原因,蓝牙国际联盟Bluetooth Sig联合众多厂商推出了LC3,主要面向低功耗蓝牙,也可以用于经典蓝牙,其具有较低延迟、较高的音质和编码增益以及在蓝牙领域无专利费的优点,受到广大厂商的关注。而目前现有技术中,基于双音多频(DTMF:DualTone Multi Frequency)信号使用中,可以通过蓝牙传输或其他无线技术,遥控器将命令编码为DTMF码,然后将DTMF码转换为音频PCM信号,再使用音频编码器编码,最后使用蓝牙传输给接收器,接收端首先将音频解码为音频PCM信号,再调用DTMF检测器检测出DTMF符号,最后将其映射为对应的控制命令。传统的双音多频DTMF检测器主要包括以下三步,其中Goertzel算法需要针对DTMF的8个频点做滤波并计算能量,需要消耗一定的算力。而高功耗和高算力无法适用LC3蓝牙的低功耗要求,在低功耗蓝牙中,现有的双音多频检测方式存在弊端。
发明内容
针对现有技术中,进行双音多频检测时,耗费的算力高,功耗高,不适应LC3低功耗蓝牙的问题,本申请提出一种双音多频检测方法、系统、介质及设备。
第一方面,本申请提供一种双音多频检测方法,包括:对当前帧数据进行LC3标准解码,获取当前帧数据对应的谱系数;计算谱系数对应的伪谱系数,并进行归一化处理,得到归一化伪谱系数;根据归一化伪谱系数,计算当前帧数据中各个频点对应的频点能量;在包含当前帧数据在内的预设多帧数据中,存在一频点对应的频点能量均超过预设能量阈值,则确定当前帧数据中存在双音多频信号。
可选的,计算谱系数对应的伪谱系数,并进行归一化处理,得到归一化伪谱系数,包括:根据谱系数进行计算,得到伪谱系数;遍历多个伪谱系数,确定多个伪谱系数中的最大值,得到最大伪谱系数;计算最大伪谱系数的前导符号数,并利用前导符号数对多个伪谱系数进行归一化操作,得到归一化伪谱系数。
可选的,对当前帧数据进行LC3标准解码,获取当前帧数据对应的谱系数之前,还包括:获取当前帧数据的基音存在标志;在基音存在标志表示当前帧数据存在基音的条件下,获取当前帧数据对应的谱系数。
第二方面,本申请提供一种双音多频检测系统,包括:谱系数获取模块,其对当前帧数据进行LC3标准解码,获取当前帧数据对应的谱系数;伪谱系数获取及归一化模块,其计算谱系数对应的伪谱系数,并进行归一化处理,得到归一化伪谱系数;频点能量计算模块,其根据归一化伪谱系数,计算当前帧数据中各个频点对应的频点能量;判决模块,其在包含当前帧数据在内的预设多帧数据中,存在一频点对应的频点能量均超过预设能量阈值,则确定当前帧数据中存在双音多频信号。
第三方面,本申请提供一种计算机可读存储介质,其存储有计算机指令,其中计算机指令被操作以执行方案一中的双音多频检测方法。
第四方面,本申请提供一种计算机设备,其包括处理器和存储器,存储器存储有计算机指令,其中处理器操作计算机指令以执行方案一中的双音多频检测方法。
本申请的有益效果是:通过利用音频解码过程中的已有信息,辅以少量的计算便可进行双音多频的检测,节省算力,降低功耗,更加适用于低功耗蓝牙的应用场景。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请双音多频检测方法的一个实施方式的流程示意图;
图2是频点能量示意图;
图3是本申请双音多频检测系统的一个实施方式的结构示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的产品或设备不必限于清楚地列出的哪些单元,而是可包括没有清楚地列出的或对于这些产品或设备固有的其它单元。
目前主流的蓝牙音频编码器如下:
SBC:A2DP协议强制要求,使用最为广泛,是所有的蓝牙音频设备必须支持的,但音质一般;AAC-LC: 音质较好且应用较为广泛,很多主流的手机都支持,但与SBC相比,内存占用较大,且运算复杂度高,很多蓝牙设备都基于嵌入式平台,电池容量有限,处理器运算能力较差且内存有限,而且,其专利费较高;aptX系列:音质较好,但码率很高,aptX需要码率384kbps,而aptX-HD的码率为576kbps,且为高通独有的技术,较为封闭;LDAC: 音质较好,但码率也很高,分别是330kbps,660kbps和990kbps,由于蓝牙设备所处的无线环境特别复杂,稳定支持如此高的码率有一定的困难,且为索尼独有的技术,也很封闭;LHDC:音质较好,但码率也很高,典型的包括400kbps,600kbp和900kbps,如此高的码率,对于蓝牙的基带/射频设计提出了很高的要求。
基于上述原因,蓝牙国际联盟Bluetooth Sig联合众多厂商推出了LC3,主要面向低功耗蓝牙,也可以用于经典蓝牙,其具有较低延迟、较高的音质和编码增益以及在蓝牙领域无专利费的优点,受到广大厂商的关注。
而目前现有技术中,基于双音多频(DTMF:Dual Tone Multi Frequency)信号使用中,可以通过蓝牙传输或其他无线技术,遥控器将命令编码为DTMF码,然后将DTMF码转换为音频PCM信号,再使用音频编码器编码,最后使用蓝牙传输给接收器,接收端首先将音频解码为音频PCM信号,再调用DTMF检测器检测出DTMF符号,最后将其映射为对应的控制命令。传统的双音多频DTMF检测器主要包括以下三步,其中Goertzel算法需要针对DTMF的8个频点做滤波并计算能量,需要消耗一定的算力。而高功耗和高算力无法适用LC3蓝牙的低功耗要求,在低功耗蓝牙中,现有的双音多频检测方式存在弊端
针对上述问题本申请提出一种双音多频检测方法、系统、介质及设备。该双音多频检测方法包括:对当前帧数据进行LC3标准解码,获取当前帧数据对应的谱系数;计算谱系数对应的伪谱系数,并进行归一化处理,得到归一化伪谱系数;根据归一化伪谱系数,计算当前帧数据中各个频点对应的频点能量;在包含当前帧数据在内的预设多帧数据中,存在一频点对应的频点能量均超过预设能量阈值,则确定当前帧数据中存在双音多频信号。
本申请的双音多频检测方法通过利用音频解码过程中的已有信息,辅以少量的计算便可进行双音多频的检测,节省算力,降低功耗,更加适用于低功耗蓝牙的应用场景。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图1示出了本申请双音多频检测方法的一个实施方式的流程示意图。
在图1所示的实施方式中,本申请的双音多频检测方法包括:过程S101,对当前帧数据进行LC3标准解码,获取当前帧数据对应的谱系数。
在该实施方式中,根据LC3标准规范将当前帧数据解码至变换域噪声整形之后离散余弦反变换之前,变换域噪声整形模块输出谱系数。其中谱系数可表示为:
Figure DEST_PATH_IMAGE001
其中
Figure 640233DEST_PATH_IMAGE002
是变换域噪声整形输出的谱系数。
在图1所示的实施方式中,本申请的双音多频检测方法包括过程S102,计算谱系数对应的伪谱系数,并进行归一化处理,得到归一化伪谱系数。
可选的,计算谱系数对应的伪谱系数,并进行归一化处理,得到归一化伪谱系数,包括:根据谱系数进行计算,得到伪谱系数;遍历多个伪谱系数,确定多个伪谱系数中的最大值,得到最大伪谱系数;计算最大伪谱系数的前导符号数,并利用前导符号数对多个伪谱系数进行归一化操作,得到归一化伪谱系数。
在该可选实施例中,在标准LC3解码过程中,获得当前帧数据对应的谱系数后,进行伪谱计算,得到伪谱系数。
具体的,以正弦波为例,离散傅里叶变换得到的谱系数,其谱系数与正弦波的频率有较为准确的对应关系,而离散余弦变换得到的谱系数,其谱系数与正弦波的频率有偏差,所以需要预处理,即伪谱计算,方法为:
Figure 75894DEST_PATH_IMAGE003
Figure 847541DEST_PATH_IMAGE004
。上述公式中
Figure 985130DEST_PATH_IMAGE002
表示k位置的谱系数,
Figure 805318DEST_PATH_IMAGE005
表示k位置的伪谱系数。
在该实施例中,在得到对应的伪谱后,确定多个伪谱系数中的最大伪谱系数,通过计算得到最大伪谱系数的前导符号数,然后进行归一化操作,最终确定出当前帧数据对应的归一化伪谱系数
具体的,不同厂家生产的遥控器发射端产生的双音多频DTMF信号的幅度可能不完全相同,为了便于在接收端设置统一的检测门限,使用归一化进行处理。假定遥控器接收端的谱系数使用32位定点表示,搜索伪谱
Figure 157802DEST_PATH_IMAGE005
中的最大值并令其为
Figure 287301DEST_PATH_IMAGE006
Figure 662919DEST_PATH_IMAGE007
;并计算最大伪谱系数
Figure 83536DEST_PATH_IMAGE006
的前导符号数,表示为Norm;进而完成所有伪谱系数的归一化过程。具体公式表示如下:
Figure 743056DEST_PATH_IMAGE008
具体说明如下:前导符号数即多余的符号数,举例来说,如果谱系数使用32位定点数表示,则用10进制表示范围为:-2147483648~2147483647,用16进制表示范围为0X80000000~0X7FFFFFFF, 为了叙述方便,此处使用16进制描述前导数的计算,给定一个16进制数Random和其所占位宽(此处为32),则前导符号数Norm计算方法伪码如下:
INT32 a = random;
INT32 Norm = 0;
a = ~a;
while (a & 0x80000000) {
Norm ++;
a <<= 1;
}
Norm = Norm – 1;
Figure DEST_PATH_IMAGE009
即归一化计算,举例来说,如果当前帧最大谱系数
Figure 794189DEST_PATH_IMAGE010
Figure DEST_PATH_IMAGE011
Figure 903441DEST_PATH_IMAGE012
,”
Figure 65432DEST_PATH_IMAGE013
”即表示将
Figure 313879DEST_PATH_IMAGE005
左移Norm位,即0x00708900<<8 = 0x70890000。
在图1所示的实施方式中,本申请的双音多频检测方法包括过程S103,根据归一化伪谱系数,计算当前帧数据中各个频点对应的频点能量。
在该可选实施例中,以采样率8kHz、帧长10ms为例,每帧有谱系数80个,即
Figure 598230DEST_PATH_IMAGE014
。共有8个频点,频点能量的计算公式如下:
Figure 948440DEST_PATH_IMAGE015
其中
Figure 163389DEST_PATH_IMAGE016
表示某一个频点的能量,Freq代表8个频点中的一个,其取值可能是697Hz,770Hz,852Hz,941Hz,1209Hz,1336Hz,1477Hz,1633Hz
计算能量时的频点索引bin_start和bin_stop方法如下:
Figure 344972DEST_PATH_IMAGE017
其中Bw是当前配置下的最大带宽。
具体的,举例来说,当系统配置为采样率8kHz时,在697Hz处的频点对应的频点索引范围:
Figure 472328DEST_PATH_IMAGE018
因此,697Hz频点处的频点能量表示为:
Figure 559102DEST_PATH_IMAGE019
在图1所示的实施方式中,本申请的双音多频检测方法包括过程S104,在包含当前帧数据在内的预设多帧数据中,存在一频点对应的频点能量均超过预设能量阈值,则确定当前帧数据中存在双音多频信号。
在该实施方式中,在计算得到当前帧数据中,各个频点的能量后。判断包含当前帧在内的预设多帧数据中,某一频点的频点能量在多帧数据中是否均超过预设能量阈值,若存在,则确定当前帧数据中存在双音多频信号。
具体的,例如一帧音频数据中有五个频点,分别命名为第一频点、第二频点、第三频点、第四频点以及第五频点。预设多帧数据为包括当前帧数据在内的连续五帧数据。在实际的判断过程中,若连续的五帧音频数据中,若每一帧的第一频点的频点能量均超过预设能量阈值,则满足判断条件,认为当前帧数据中检测出双音多频信号。
具体的,预设多帧数据对应的帧数可选择5-7帧数据;预设能量阈值可选择3x10e9。需要说明的是,上述取值仅仅为较优的选择,在实际的处理过程中,可根据实际的要求进行合理的调整,不对本申请的保护范围进行限制。
可选的,对当前帧数据进行LC3标准解码,获取当前帧数据对应的谱系数之前,还包括:获取当前帧数据的基音存在标志;在基音存在标志表示当前帧数据存在基音的条件下,获取当前帧数据对应的谱系数。
在该可选实施例中,在对当前帧数据进行双音多频检测前,首先获取当前帧数据的基音存在标志。若基音存在标志指示当前帧数据中存在基音,则进行后续的双音多频检测;若基音标志指示当前帧数据中不存在基音,则对当前帧数据跳过双音多频的检测过程,从而避免无效检测,节省算力。
具体的,图2示出了频点能量示意图。在图2中,由左到右,由上到下,依次为697Hz的频点上检测到的能量,1209Hz频点上检测到的能量,941Hz频点上检测到的能量,以及1633Hz频点上检测到的能量。可以看出697Hz和1209Hz频点上的能量都很大,在6x10e9左右,而另外两个频点能量很小,在4x10e7左右或以下,因此将预设能量阈值设为3x10e9左右,此两张图显示了本发明的有效性。
本申请的双音多频检测方法既可以用于低功耗蓝牙音频,也可以用于经典蓝牙(配合LC3),还可以应用在其他基于LC3编解码的无线系统中。通过ltpf模块的标志ltpf_active跳过不可能有dtmf数据的部分,节省了计算资源;充分利用音频解码器已有的信息与现有的算法模块,辅以少量的计算,复杂度低,与传统的Goertzel算法比,省略了消耗资源的滤波计算。此算法不仅可以应用于LC3,也可以应用于其他基于MDCT的编解码器,如AAC等。本申请通过利用音频解码过程中的已有信息,辅以少量的计算便可进行双音多频的检测,节省算力,降低功耗,更加适用于低功耗蓝牙的应用场景。
图3示出了本申请双音多频检测系统的一个实施方式。
在图3所示的实施方式中,本申请的双音多频检测系统包括:谱系数获取模块301,其对当前帧数据进行LC3标准解码,获取当前帧数据对应的谱系数;伪谱系数获取及归一化模块302,其计算谱系数对应的伪谱系数,并进行归一化处理,得到归一化伪谱系数;频点能量计算模块303,其根据归一化伪谱系数,计算当前帧数据中各个频点对应的频点能量;判决模块304,其在包含当前帧数据在内的预设多帧数据中,存在一频点对应的频点能量均超过预设能量阈值,则确定当前帧数据中存在双音多频信号。
可选的,在伪谱系数获取及归一化模块302中,根据谱系数进行计算,得到伪谱系数;遍历多个伪谱系数,确定多个伪谱系数中的最大值,得到最大伪谱系数;计算最大伪谱系数的前导符号数,并利用前导符号数对多个伪谱系数进行归一化操作,得到归一化伪谱系数。
可选的,对当前帧数据进行LC3标准解码,获取当前帧数据对应的谱系数之前,还包括:获取当前帧数据的基音存在标志;在基音存在标志表示当前帧数据存在基音的条件下,获取当前帧数据对应的谱系数。
本申请的双音多频检测系统通过利用音频解码过程中的已有信息,辅以少量的计算便可进行双音多频的检测,节省算力,降低功耗,更加适用于低功耗蓝牙的应用场景。
在本申请的一个具体实施方式中,一种计算机可读存储介质,其存储有计算机指令,其中计算机指令被操作以执行任一实施例描述的双音多频检测方法。其中,该存储介质可直接在硬件中、在由处理器执行的软件模块中或在两者的组合中。
软件模块可驻留在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可装卸盘、CD-ROM或此项技术中已知的任何其它形式的存储介质中。示范性存储介质耦合到处理器,使得处理器可从存储介质读取信息和向存储介质写入信息。
处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC)、现场可编程门阵列(英文:Field Programmable Gate Array,简称:FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其任何组合等。通用处理器可以是微处理器,但在替代方案中,处理器可以是任何常规处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如DSP与微处理器的组合、多个微处理器、结合DSP核心的一个或一个以上微处理器或任何其它此类配置。在替代方案中,存储介质可与处理器成一体式。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替代方案中,处理器和存储介质可作为离散组件驻留在用户终端中。
在本申请的一个具体实施方式中,一种计算机设备,其包括处理器和存储器,存储器存储有计算机指令,其中:处理器操作计算机指令以执行任一实施例描述的双音多频检测方法。
在本申请所提供的实施方式中,应该理解到,所揭露的装置,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上仅为本申请的实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (8)

1.一种双音多频检测方法,其特征在于,包括:
对当前帧数据进行LC3标准解码,获取所述当前帧数据对应的谱系数;
计算所述谱系数对应的伪谱系数,并进行归一化处理,得到归一化伪谱系数;
根据所述归一化伪谱系数,计算所述当前帧数据中各个频点对应的频点能量;
在包含所述当前帧数据在内的预设多帧数据中,若存在一频点对应的频点能量均超过预设能量阈值,则确定所述当前帧数据中存在双音多频信号。
2.根据权利要求1所述的双音多频检测方法,其特征在于,所述计算所述谱系数对应的伪谱系数,并进行归一化处理,得到归一化伪谱系数,包括:
根据所述谱系数进行计算,得到所述伪谱系数;
遍历多个所述伪谱系数,确定多个所述伪谱系数中的最大值,得到最大伪谱系数;
计算所述最大伪谱系数的前导符号数,并利用所述前导符号数对多个所述伪谱系数进行归一化操作,得到所述归一化伪谱系数。
3.根据权利要求1所述的双音多频检测方法,其特征在于,所述对当前帧数据进行LC3标准解码,获取所述当前帧数据对应的谱系数之前,还包括:
获取所述当前帧数据的基音存在标志;
在所述基音存在标志表示所述当前帧数据存在基音的条件下,获取所述当前帧数据对应的所述谱系数;
在所述基音存在标志表示所述当前帧数据不存在基音的条件下,不对所述当前帧数据进行所述双音多频信号的检测。
4.一种双音多频检测系统,其特征在于,包括:
谱系数获取模块,其对当前帧数据进行LC3标准解码,获取所述当前帧数据对应的谱系数;
伪谱系数获取及归一化模块,其计算所述谱系数对应的伪谱系数,并进行归一化处理,得到所述归一化伪谱系数;
频点能量计算模块,其根据所述归一化伪谱系数,计算所述当前帧数据中各个频点对应的频点能量;
判决模块,其在包含所述当前帧数据在内的预设多帧数据中,存在一频点对应的频点能量均超过预设能量阈值,则确定所述当前帧数据中存在双音多频信号。
5.根据权利要求4所述的双音多频检测系统,其特征在于,在所述伪谱系数获取及归一化模块中,
根据所述谱系数进行计算,得到所述伪谱系数;
遍历多个所述伪谱系数,确定多个所述伪谱系数中的最大值,得到最大伪谱系数;
计算所述最大伪谱系数的前导符号数,并利用所述前导符号数对多个所述伪谱系数进行归一化操作,得到所述归一化伪谱系数。
6.根据权利要求4所述的双音多频检测系统,其特征在于,还包括:
基音存在标志获取及判断模块,其获取所述当前帧数据的基音存在标志,并判断所述当前帧数据中是否存在基音,其中
若存在,则通过所述谱系数获取模块获取所述当前帧数据的谱系数;
若不存在,则不进行所述音多频信号的检测。
7.一种计算机可读存储介质,其存储有计算机指令,其中所述计算机指令被操作以执行权利要求1-3中任一项所述的双音多频检测方法。
8.一种计算机设备,其包括处理器和存储器,所述存储器存储有计算机指令,其中:所述处理器操作计算机指令以执行权利要求1-3中任一项所述的双音多频检测方法。
CN202210463090.2A 2022-04-29 2022-04-29 一种双音多频检测方法、系统、介质及设备 Active CN114582374B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210463090.2A CN114582374B (zh) 2022-04-29 2022-04-29 一种双音多频检测方法、系统、介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210463090.2A CN114582374B (zh) 2022-04-29 2022-04-29 一种双音多频检测方法、系统、介质及设备

Publications (2)

Publication Number Publication Date
CN114582374A true CN114582374A (zh) 2022-06-03
CN114582374B CN114582374B (zh) 2022-07-05

Family

ID=81784888

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210463090.2A Active CN114582374B (zh) 2022-04-29 2022-04-29 一种双音多频检测方法、系统、介质及设备

Country Status (1)

Country Link
CN (1) CN114582374B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6782095B1 (en) * 1997-11-27 2004-08-24 Nortel Networks Limited Method and apparatus for performing spectral processing in tone detection
WO2005027541A1 (en) * 2003-09-15 2005-03-24 Fulcrum Systems Limited Signal-processing methods and apparatus
JP2009010696A (ja) * 2007-06-28 2009-01-15 Aiphone Co Ltd インターホンシステム
US20090138264A1 (en) * 2007-11-26 2009-05-28 General Motors Corporation Speech to dtmf generation
CN101635865A (zh) * 2008-07-22 2010-01-27 中兴通讯股份有限公司 一种双音多频信号抗误检测的系统及方法
GB201320940D0 (en) * 2013-11-27 2014-01-08 Trl Technology Ltd Scheme for identification of MTMF signals
WO2016008311A1 (zh) * 2014-07-18 2016-01-21 华为技术有限公司 一种根据频域能量对音频信号进行检测的方法和装置
CN105529038A (zh) * 2014-10-21 2016-04-27 阿里巴巴集团控股有限公司 对用户语音信号进行处理的方法及其系统
CN113724725A (zh) * 2021-11-04 2021-11-30 北京百瑞互联技术有限公司 一种蓝牙音频啸叫检测抑制方法、装置、介质及蓝牙设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6782095B1 (en) * 1997-11-27 2004-08-24 Nortel Networks Limited Method and apparatus for performing spectral processing in tone detection
WO2005027541A1 (en) * 2003-09-15 2005-03-24 Fulcrum Systems Limited Signal-processing methods and apparatus
JP2009010696A (ja) * 2007-06-28 2009-01-15 Aiphone Co Ltd インターホンシステム
US20090138264A1 (en) * 2007-11-26 2009-05-28 General Motors Corporation Speech to dtmf generation
CN101635865A (zh) * 2008-07-22 2010-01-27 中兴通讯股份有限公司 一种双音多频信号抗误检测的系统及方法
GB201320940D0 (en) * 2013-11-27 2014-01-08 Trl Technology Ltd Scheme for identification of MTMF signals
WO2016008311A1 (zh) * 2014-07-18 2016-01-21 华为技术有限公司 一种根据频域能量对音频信号进行检测的方法和装置
CN105529038A (zh) * 2014-10-21 2016-04-27 阿里巴巴集团控股有限公司 对用户语音信号进行处理的方法及其系统
CN113724725A (zh) * 2021-11-04 2021-11-30 北京百瑞互联技术有限公司 一种蓝牙音频啸叫检测抑制方法、装置、介质及蓝牙设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
J.NAGI等: "Intelligent detection of DTMF tones using a hybrid signal processing technique with support vector machines", 《2008 INTERNATIONAL SYMPOSIUM ON INFORMATION TECHNOLOGY》 *
夏斌等: "戈泽尔算法在DTMF信号检测中的应用与改进", 《电子测量与仪器学报》 *
曹秀英: "保密机新体制的应用基础研究与实现", 《通信学报》 *

Also Published As

Publication number Publication date
CN114582374B (zh) 2022-07-05

Similar Documents

Publication Publication Date Title
CN101916567B (zh) 应用于双麦克风系统的语音增强方法
CN113724725B (zh) 一种蓝牙音频啸叫检测抑制方法、装置、介质及蓝牙设备
CN103117067B (zh) 一种低信噪比下语音端点检测方法
KR101019398B1 (ko) 오디오 코딩 및 디코딩에서의 여기의 프로세싱
CN103460283A (zh) 确定多信道音频信号的编码参数的方法及多信道音频编码器
CN101918999A (zh) 执行音频水印嵌入以及水印检测和提取的方法和设备
US11922954B2 (en) Multichannel audio signal processing method, apparatus, and system
US11295761B2 (en) Method for constructing voice detection model and voice endpoint detection system
CN108777596B (zh) 一种基于声波的通信方法、通信系统及计算机可读存储介质
WO2008103087A1 (en) Double talk detector
CN113689864B (zh) 一种音频数据处理方法、装置及存储介质
EP3576087A1 (en) Audio frame loss concealment
CN103474074A (zh) 语音基音周期估计方法和装置
CN105590630A (zh) 基于指定带宽的定向噪音抑制方法
CN106033671B (zh) 确定声道间时间差参数的方法和装置
CN101605001B (zh) 一种mfsk水声通信的多普勒测量与修正方法
CN103268766A (zh) 双麦克风语音增强方法及装置
ES2768719T3 (es) Método para estimar ruido en una señal de audio, estimador de ruido, codificador de audio, decodificador de audio, y sistema para transmitir señales de audio
CN104981870A (zh) 声音增强装置
CN103632681A (zh) 一种谱包络静音检测方法
CN114582374B (zh) 一种双音多频检测方法、系统、介质及设备
CN102322928B (zh) 电子秤、移动设备和体重测量系统及无线传输方法
JP5798257B2 (ja) 信号の複合符号化のための装置および方法
CN114582361B (zh) 基于生成对抗网络的高解析度音频编解码方法及系统
CN112995425B (zh) 一种等响度混音方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: A1009, floor 9, block a, No. 9, Shangdi Third Street, Haidian District, Beijing 100085

Patentee after: Beijing Bairui Internet Technology Co.,Ltd.

Address before: A1009, floor 9, block a, No. 9, Shangdi Third Street, Haidian District, Beijing 100085

Patentee before: BARROT WIRELESS Co.,Ltd.