CN108597537A - 一种音频信号相似度检测方法 - Google Patents
一种音频信号相似度检测方法 Download PDFInfo
- Publication number
- CN108597537A CN108597537A CN201810302809.8A CN201810302809A CN108597537A CN 108597537 A CN108597537 A CN 108597537A CN 201810302809 A CN201810302809 A CN 201810302809A CN 108597537 A CN108597537 A CN 108597537A
- Authority
- CN
- China
- Prior art keywords
- audio signal
- signal
- similarity
- spectrum
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 176
- 238000001514 detection method Methods 0.000 title claims abstract description 33
- 238000001228 spectrum Methods 0.000 claims abstract description 84
- 238000000034 method Methods 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000003595 spectral effect Effects 0.000 claims 1
- 238000004458 analytical method Methods 0.000 abstract description 7
- 238000013473 artificial intelligence Methods 0.000 abstract description 4
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000000205 computational method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000030808 detection of mechanical stimulus involved in sensory perception of sound Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种音频信号相似度检测方法,通过获取待检测相似度的第一音频信号和第二音频信号;分别对所述第一音频信号和第二音频信号依次进行快速傅里叶变换、谱幅度值和谱熵计算,根据所述谱熵确定所述第一音频信号和第二音频信号是否均为语音信号;若均为语音信号则计算其相似度,本发明所提供的音频信号检测方法,由于仅仅涉及到对音频信号本身属性的计算,不涉及到人工智能的语义分析,仅仅通过语音识别,得到音频信号的相似度,因次为音频信号的检测提供了便利。
Description
技术领域
本发明数据处理领域,尤其涉及一种音频信号相似度检测方法。
背景技术
音频信号处理是一个复杂的交叉技术领域。近年来,音频处理技术得到了广泛的应用。
音频处理的基础是语音检测,音频检测的目的是检测语音信号是否存在。
现有技术中,音频检测的过程通常是:获取各音频信号,从各音频信号中提取特征参数进行语义分析,再根据语义分析的结果获知该音频信号是否为语音。
但是,语义分析需要进行大量的计算和模板的匹配,影响了音频检测的效率。
因此,现有技术有待于进一步的改进。
发明内容
鉴于上述现有技术中的不足之处,本发明的目的在于为用户提供一种音频信号相似度检测方法,克服现有技术中音频检测效率低缺陷。
本发明提供的实施例为:一种音频信号相似度检测方法,其中,所述方法包括:
获取待检测相似度的第一音频信号和第二音频信号;
分别对所述第一音频信号和第二音频信号进行快速傅里叶变换得到对应的第一频域信号和第二频域信号;
根据所述第一频域信号计算第一谱幅度值和根据所述第二频域信号计算第二谱幅度值;
分别计算所述第一谱幅度值和所述第二谱幅度值的概率密度,根据所述概率密度计算所述音频信号的谱熵,以及根据所述谱熵确定所述第一音频信号和第二音频信号是否均为语音信号;
若均为语音信号则识别出第一音频信号中含有的第一语言信息和识别出第二音频信号中含有的第二语音信息;
计算出所述第一语音信息和第二语音信息的相似度,并将所述相似度认定为所述第一音频信号和第二音频信号的相似度。
可选的,所述根据所述第一频域信号计算第一谱幅度值和根据所述第二频域信号计算第二谱幅度值的步骤中,采用以下公式进行计算:
其中,X(k,y)表示第y个音频信号所在帧的第k个频段的谱幅度值,z(n,y)表示第y个音频信号所在帧的音频中的第n个点的幅度,N表示快速傅里叶变换的变化长度,k小于或等于N,exp(-j2πkn/N)表示幅角为2π的kn/N倍的复数。
具有的,所述计算所述第一谱幅度值和所述第二谱幅度值的概率密度的步骤包括:
根据所述谱幅度值计算第y个音频信号所在帧的带噪语音功率谱总能量;
根据所述总能量以及所述谱幅度值计算概率密度。
可选的,所述带噪语音功率谱总能量的计算公式为:
较佳的,Esum(y)表示第y个音频信号所在帧的带噪语音功率谱总能量,X(k,y)表示第y个音频信号所在帧的第k个频段的谱幅度值,N表示快速傅里叶变换的变化长度。
较佳的,所述根据所述总能量以及所述谱幅度值计算概率密度的步骤中,采用以下公式进行计算:
D(k,y)=|X(k,y)|2/Esum(y);
其中,D(k,y)表示第y个音频信号所在帧的第k个频段所对应的概率密度,X(k,y)表示第y个音频信号所在帧的第k个频段的谱幅度值。
具体的,根据所述概率密度计算所述音频信号的谱熵的具体过程:
其中,H(y)表示第y个音频信号的谱熵,D(k,y)表示第y个音频信号所在帧的第k个频段所对应的概率密度。
具体的,所述根据所述谱熵确定所述音频信号是否为语音信号的步骤包括:
计算所述音频信号的能量;
根据所述音频信号的能量以及所述谱熵确定所述音频信号是否为语音信号;
所述计算所述音频信号的能量的公式为:
其中,E(y)表示第y个音频信号的能量,M表示音频信号所在帧的帧长,z(n,y)表示第y个音频信号所在帧的音频中的第n个点的幅度;
根据所述音频信号的能量以及所述谱熵确定所述音频信号是否为语音信号的步骤包括:
判断P(y)是否大于预置门限值,若是,则确定音频信号是语音信号,若否,则确定音频信号不是语音信号,其中,
具体的,所述若均为语音信号则识别出第一音频信号中含有的第一语言信息和识别出第二音频信号中含有的第二语音信息的步骤包括:
将音频信号与数据库中存储的数据进行比对,或者将所述音频信号发送至云端服务器,并获取云端服务器返回的与第一音频信号和第二音频信号相对应的第一语音信息和第二语音信息。
具体的,所述计算出所述第一语音信息和第二语音信息的相似度的步骤包括:
对识别出的第一语音信息和第二语音信息中包含字符进行逐一比对;
计算相同字符所占全部字符的比例,将所述比例判定为相似度。
可选的,所述计算出所述第一语音信息和第二语音信息的相似度的步骤包括:
将第一语音信息和第二语音信平均分成不同的语音片段;
逐条相对应的语音片段进行其中含有字符的比对,计算每个相对应语音片段的相似度;
对得到的各个语音片段的相似度进行加权计算,得到平均相似度,将所述平均相似度判定为第一语音信息和第二语音信息的相似度。
本发明中,可以根据音频信号的谱熵来进行音频信号检测,谱熵的计算过程主要涉及时频变换、幅度计算和能量计算等,这些计算过程所针对的都是语音信号本身的属性,而不必进行语义分析这种需要涉及到人工智能和神经网络的计算方式,从而减少了计算量,提高了音频信息检测的效率。
附图说明
图1为本发明所述一种音频信号相似度检测方法的步骤流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供的实施例为一种音频信号相似度检测方法,如图1所示,所述方法包括:
步骤S101、获取待检测相似度的第一音频信号和第二音频信号。
在具体实施时,例如当需要对新音响设备进行声道音效检测时,则获取标准音频信号与该音响设备播放出的音频信号,本步骤中将标准音频信号作为第一音频信号,将待检测与第一音频信号相似度的音响播放音频信号作为第二音频信号。可以想到的是,本发明所提供的方法还可以用于其他需要进行音频信号相似度匹配的情况。
步骤S102、分别对所述第一音频信号和第二音频信号进行快速傅里叶变换得到对应的第一频域信号和第二频域信号。
分别对第一音频信号和第二音频信号进行快速傅里叶变换,得到第一音频信号的第一频域信号和得到第二音频信号的第二频域信号。
步骤S103、根据所述第一频域信号计算第一谱幅度值和根据所述第二频域信号计算第二谱幅度值。
利用上述步骤S102中获取到第一频域信号和第二频域信号,则根据获取到的第一频域信号和第二频域信号分别计算其对应的第一谱幅度值和第二谱幅度值。
具体的,所述根据所述第一频域信号计算第一谱幅度值和根据所述第二频域信号计算第二谱幅度值的步骤中,采用以下公式进行计算:
其中,X(k,y)表示第y个音频信号所在帧的第k个频段的谱幅度值,z(n,y)表示第y个音频信号所在帧的音频中的第n个点的幅度,N表示快速傅里叶变换的变化长度,k小于或等于N,exp(-j2πkn/N)表示幅角为2π的kn/N倍的复数。
步骤S104、分别计算所述第一谱幅度值和所述第二谱幅度值的概率密度,根据所述概率密度计算所述音频信号的谱熵,以及根据所述谱熵确定所述第一音频信号和第二音频信号是否均为语音信号。
本步骤中进行以下计算:
首先、需要根据谱幅度值计算概率密度;
其次,再根据概率密度计算出音频信号的谱熵;
再次,根据所述谱熵确定所述第一音频信号和第二音频信号是否均为语音信号;
具体的,所述计算所述第一谱幅度值和所述第二谱幅度值的概率密度的步骤包括:
根据所述谱幅度值计算第y个音频信号所在帧的带噪语音功率谱总能量;
根据所述总能量以及所述谱幅度值计算概率密度。
所述带噪语音功率谱总能量的计算公式为:
其中,Esum(y)表示第y个音频信号所在帧的带噪语音功率谱总能量,X(k,y)表示第y个音频信号所在帧的第k个频段的谱幅度值,N表示快速傅里叶变换的变化长度。
其次,所述根据所述总能量以及所述谱幅度值计算概率密度的步骤中,采用以下公式进行计算:
D(k,y)=|X(k,y)|2/Esum(y);
其中,D(k,y)表示第y个音频信号所在帧的第k个频段所对应的概率密度,X(k,y)表示第y个音频信号所在帧的第k个频段的谱幅度值。
再次,根据所述概率密度计算所述音频信号的谱熵的具体过程:
其中,H(y)表示第y个音频信号的谱熵,D(k,y)表示第y个音频信号所在帧的第k个频段所对应的概率密度。
根据计算出的与第一音频信号相对应的谱熵确定所述第一音频信号是否为语音信号,根据计算出的与第二音频信号相对应的谱熵确定所述第二音频信号是否为语音信号。
或者,通过以下方法实现音频信号是否为语音信号的识别:
所述根据所述谱熵确定所述音频信号是否为语音信号的步骤包括:
计算所述音频信号的能量;
根据所述音频信号的能量以及所述谱熵确定所述音频信号是否为语音信号;
所述计算所述音频信号的能量的公式为:
其中,E(y)表示第y个音频信号的能量,M表示音频信号所在帧的帧长,z(n,y)表示第y个音频信号所在帧的音频中的第n个点的幅度;
根据所述音频信号的能量以及所述谱熵确定所述音频信号是否为语音信号的步骤包括:
判断P(y)是否大于预置门限值,若是,则确定音频信号是语音信号,若否,则确定音频信号不是语音信号,其中,
步骤S105、若均为语音信号则识别出第一音频信号中含有的第一语言信息和识别出第二音频信号中含有的第二语音信息。
若均为语音信号则通过语音识别,识别出所述第一音频信号和第二音频信号所包含的语音信息。
具体的所述语音识别可以通过语音识别算法将音频信号与数据库中存储的语音特征比对和计算得到。通过将音频信号与数据库中存储的数据进行比对,或者将所述音频信号发送至云端服务器,并获取云端服务器返回的与第一音频信号和第二音频信号相对应的第一语音信息和第二语音信息。
步骤S106、计算出所述第一语音信息和第二语音信息的相似度,并将所述相似度认定为所述第一音频信号和第二音频信号的相似度。
根据识别出的语音信息,进行相似度的计算,可以有以下两种不同的计算方法:
第一种方法如下:
所述计算出所述第一语音信息和第二语音信息的相似度的步骤包括:
对识别出的第一语音信息和第二语音信息中包含字符进行逐一比对;
计算相同字符所占全部字符的比例,将所述比例判定为相似度。
第二种方法如下:
所述计算出所述第一语音信息和第二语音信息的相似度的步骤包括:
将第一语音信息和第二语音信平均分成不同的语音片段;
逐条相对应的语音片段进行其中含有字符的比对,计算每个相对应语音片段的相似度;
对得到的各个语音片段的相似度进行加权计算,得到平均相似度,将所述平均相似度判定为第一语音信息和第二语音信息的相似度。
本发明所提的音频信号检测方法,通过计算音频信号的谱熵来识别是否为语音信号,并当均识别为语音信号后,进行语音识别,从而得到两个音频信号的相似度,由于本发明中仅仅涉及到对音频信号本身属性的计算,不涉及到人工智能的语义分析,仅仅通过语音识别,得到音频信号的相似度,因次为音频信号的检测提供了便利。
本发明中,可以根据音频信号的谱熵来进行音频信号检测,谱熵的计算过程主要涉及时频变换、幅度计算和能量计算等,这些计算过程所针对的都是语音信号本身的属性,而不必进行语义分析这种需要涉及到人工智能和神经网络的计算方式,从而减少了计算量,提高了音频信息检测的效率。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种音频信号相似度检测方法,其特征在于,所述方法包括:
获取待检测相似度的第一音频信号和第二音频信号;
分别对所述第一音频信号和第二音频信号进行快速傅里叶变换得到对应的第一频域信号和第二频域信号;
根据所述第一频域信号计算第一谱幅度值和根据所述第二频域信号计算第二谱幅度值;
分别计算所述第一谱幅度值和所述第二谱幅度值的概率密度,根据所述概率密度计算所述音频信号的谱熵,以及根据所述谱熵确定所述第一音频信号和第二音频信号是否均为语音信号;
若均为语音信号则识别出第一音频信号中含有的第一语言信息和识别出第二音频信号中含有的第二语音信息;
计算出所述第一语音信息和第二语音信息的相似度,并将所述相似度认定为所述第一音频信号和第二音频信号的相似度。
2.根据权利要求1所述的音频信号相似度检测方法,其特征在于,所述根据所述第一频域信号计算第一谱幅度值和根据所述第二频域信号计算第二谱幅度值的步骤中,采用以下公式进行计算:
其中,X(k,y)表示第y个音频信号所在帧的第k个频段的谱幅度值,z(n,y)表示第y个音频信号所在帧的音频中的第n个点的幅度,N表示快速傅里叶变换的变化长度,k小于或等于N,exp(-j2πkn/N)表示幅角为2π的kn/N倍的复数。
3.根据权利要求1所述的音频信号相似度检测方法,其特征在于,所述计算所述第一谱幅度值和所述第二谱幅度值的概率密度的步骤包括:
根据所述谱幅度值计算第y个音频信号所在帧的带噪语音功率谱总能量;
根据所述总能量以及所述谱幅度值计算概率密度。
4.根据权利要求3所述的音频信号相似度检测方法,其特征在于,所述带噪语音功率谱总能量的计算公式为:
其中,Esum(y)表示第y个音频信号所在帧的带噪语音功率谱总能量,X(k,y)表示第y个音频信号所在帧的第k个频段的谱幅度值,N表示快速傅里叶变换的变化长度。
5.根据权利要求4所述的音频信号相似度检测方法,其特征在于,所述根据所述总能量以及所述谱幅度值计算概率密度的步骤中,采用以下公式进行计算:
D(k,y)=|X(k,y)|2/Esum(y);
其中,D(k,y)表示第y个音频信号所在帧的第k个频段所对应的概率密度,X(k,y)表示第y个音频信号所在帧的第k个频段的谱幅度值。
6.根据权利要求5所述的音频信号相似度检测方法,其特征在于,根据所述概率密度计算所述音频信号的谱熵的具体过程:
其中,H(y)表示第y个音频信号的谱熵,D(k,y)表示第y个音频信号所在帧的第k个频段所对应的概率密度。
7.根据权利要求6所述的音频信号相似度检测方法,其特征在于,所述根据所述谱熵确定所述音频信号是否为语音信号的步骤包括:
计算所述音频信号的能量;
根据所述音频信号的能量以及所述谱熵确定所述音频信号是否为语音信号;
所述计算所述音频信号的能量的公式为:
其中,E(y)表示第y个音频信号的能量,M表示音频信号所在帧的帧长,z(n,y)表示第y个音频信号所在帧的音频中的第n个点的幅度;
根据所述音频信号的能量以及所述谱熵确定所述音频信号是否为语音信号的步骤包括:
判断P(y)是否大于预置门限值,若是,则确定音频信号是语音信号,若否,则确定音频信号不是语音信号,其中,
8.根据权利要求7所述的音频信号相似度检测方法,其特征在于,所述若均为语音信号则识别出第一音频信号中含有的第一语言信息和识别出第二音频信号中含有的第二语音信息的步骤包括:
将音频信号与数据库中存储的数据进行比对,或者将所述音频信号发送至云端服务器,并获取云端服务器返回的与第一音频信号和第二音频信号相对应的第一语音信息和第二语音信息。
9.根据权利要求7所述的音频信号相似度检测方法,其特征在于,所述计算出所述第一语音信息和第二语音信息的相似度的步骤包括:
对识别出的第一语音信息和第二语音信息中包含字符进行逐一比对;
计算相同字符所占全部字符的比例,将所述比例判定为相似度。
10.根据权利要求7所述的音频信号相似度检测方法,其特征在于,所述计算出所述第一语音信息和第二语音信息的相似度的步骤包括:
将第一语音信息和第二语音信平均分成不同的语音片段;
逐条相对应的语音片段进行其中含有字符的比对,计算每个相对应语音片段的相似度;
对得到的各个语音片段的相似度进行加权计算,得到平均相似度,将所述平均相似度判定为第一语音信息和第二语音信息的相似度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810302809.8A CN108597537A (zh) | 2018-04-06 | 2018-04-06 | 一种音频信号相似度检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810302809.8A CN108597537A (zh) | 2018-04-06 | 2018-04-06 | 一种音频信号相似度检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108597537A true CN108597537A (zh) | 2018-09-28 |
Family
ID=63624577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810302809.8A Pending CN108597537A (zh) | 2018-04-06 | 2018-04-06 | 一种音频信号相似度检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108597537A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110956732A (zh) * | 2019-12-19 | 2020-04-03 | 重庆特斯联智慧科技股份有限公司 | 一种基于物联网的安全门禁 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103413549A (zh) * | 2013-07-31 | 2013-11-27 | 深圳创维-Rgb电子有限公司 | 语音交互的方法、系统以及交互终端 |
CN103456297A (zh) * | 2012-05-29 | 2013-12-18 | 中国移动通信集团公司 | 一种语音识别匹配的方法和设备 |
CN103680503A (zh) * | 2012-08-31 | 2014-03-26 | 中瀚国际语识有限公司 | 语义辨识方法 |
CN106653031A (zh) * | 2016-10-17 | 2017-05-10 | 海信集团有限公司 | 语音唤醒方法及语音交互装置 |
CN107731223A (zh) * | 2017-11-22 | 2018-02-23 | 腾讯科技(深圳)有限公司 | 语音活性检测方法、相关装置和设备 |
-
2018
- 2018-04-06 CN CN201810302809.8A patent/CN108597537A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103456297A (zh) * | 2012-05-29 | 2013-12-18 | 中国移动通信集团公司 | 一种语音识别匹配的方法和设备 |
CN103680503A (zh) * | 2012-08-31 | 2014-03-26 | 中瀚国际语识有限公司 | 语义辨识方法 |
CN103413549A (zh) * | 2013-07-31 | 2013-11-27 | 深圳创维-Rgb电子有限公司 | 语音交互的方法、系统以及交互终端 |
CN106653031A (zh) * | 2016-10-17 | 2017-05-10 | 海信集团有限公司 | 语音唤醒方法及语音交互装置 |
CN107731223A (zh) * | 2017-11-22 | 2018-02-23 | 腾讯科技(深圳)有限公司 | 语音活性检测方法、相关装置和设备 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110956732A (zh) * | 2019-12-19 | 2020-04-03 | 重庆特斯联智慧科技股份有限公司 | 一种基于物联网的安全门禁 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6535706B2 (ja) | データセットの3値ビットマップを作成するための方法 | |
WO2020181824A1 (zh) | 声纹识别方法、装置、设备以及计算机可读存储介质 | |
Dennis et al. | Image feature representation of the subband power distribution for robust sound event classification | |
EP2793223B1 (en) | Ranking representative segments in media data | |
CN102054480B (zh) | 一种基于分数阶傅立叶变换的单声道混叠语音分离方法 | |
CN107507626B (zh) | 一种基于语音频谱融合特征的手机来源识别方法 | |
CN104143324B (zh) | 一种乐音音符识别方法 | |
CN109901031A (zh) | 用于局部放电信号的信噪分离方法、信息数据处理终端 | |
CN109829515B (zh) | 一种音频指纹匹配方法以及音频指纹匹配装置 | |
CN107305774A (zh) | 语音检测方法和装置 | |
CN103236260A (zh) | 语音识别系统 | |
CN109767776B (zh) | 一种基于密集神经网络的欺骗语音检测方法 | |
CN105280196B (zh) | 副歌检测方法及系统 | |
CN112712809B (zh) | 一种语音检测方法、装置、电子设备及存储介质 | |
WO2017045429A1 (zh) | 一种音频数据的检测方法、系统及存储介质 | |
CN112786057B (zh) | 一种声纹识别方法、装置、电子设备及存储介质 | |
WO2021159902A1 (zh) | 年龄识别方法、装置、设备及计算机可读存储介质 | |
CN112632318A (zh) | 一种音频推荐方法、装置、系统及存储介质 | |
CN109271501B (zh) | 一种音频数据库的管理方法及系统 | |
CN109545226A (zh) | 一种语音识别方法、设备及计算机可读存储介质 | |
CN108597537A (zh) | 一种音频信号相似度检测方法 | |
CN111540381B (zh) | 一种基于随机森林的话音模拟调制特征识别方法 | |
CN112992190A (zh) | 音频信号的处理方法、装置、电子设备和存储介质 | |
WO2021088176A1 (zh) | 基于二值多频带能量分布的低信噪比声音事件检测方法 | |
CN115223584B (zh) | 音频数据处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20180928 |