CN109003621A - 一种音频处理方法、装置及存储介质 - Google Patents

一种音频处理方法、装置及存储介质 Download PDF

Info

Publication number
CN109003621A
CN109003621A CN201811041126.8A CN201811041126A CN109003621A CN 109003621 A CN109003621 A CN 109003621A CN 201811041126 A CN201811041126 A CN 201811041126A CN 109003621 A CN109003621 A CN 109003621A
Authority
CN
China
Prior art keywords
signal
audio frame
audio
fundamental frequency
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811041126.8A
Other languages
English (en)
Other versions
CN109003621B (zh
Inventor
肖纯智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Kugou Computer Technology Co Ltd
Original Assignee
Guangzhou Kugou Computer Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Kugou Computer Technology Co Ltd filed Critical Guangzhou Kugou Computer Technology Co Ltd
Priority to CN201811041126.8A priority Critical patent/CN109003621B/zh
Publication of CN109003621A publication Critical patent/CN109003621A/zh
Application granted granted Critical
Publication of CN109003621B publication Critical patent/CN109003621B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Abstract

本发明公开了一种音频处理方法、装置及存储介质,属于音频处理技术领域。该方法包括:获取待处理的第一音频信号的基频信息、频谱包络和激励信号相位,基于该基频信息,获取目标周期信号,该目标周期信号的峰值位于该基频信息指示的基频的倍频处,将该目标周期信号与该激励信号相位相结合,得到目标激励信号,将该目标激励信号与该频谱包络进行合成,得到第二音频信号。本发明基于第一音频的周期特性重新生成一个纯净的第二音频,从而达到降噪效果。

Description

一种音频处理方法、装置及存储介质
技术领域
本发明涉及音频处理技术领域,特别涉及一种音频处理方法、装置及存储介质。
背景技术
在日常生活中,受到录制场景或设备的限制,音频中一般不仅包括人声,还可能包括气息声、环境噪声或设备噪声等一定程度的杂音。为了提高音频中人声的清晰度,需要对音频进行处理,以达到降噪等目的。
相关技术中,一般可以采用诸如谱减法之类的降噪算法,预估音频中的噪音部分,之后,可以通过不同的增益模型对预估到的噪音部分进行抑制处理,从而达到降噪效果,使得音频中的人声更为清晰。
然而,由于噪声具有随机性,因此,一般很难准确预估到,尤其是非平稳噪音,噪声预估的准确性会大幅度减弱。如此,导致经过降噪处理后的音频中还会残留一些噪声,即降噪处理效果较差。
发明内容
本发明实施例提供了一种音频处理方法、装置及存储介质,可以解决相关技术中降噪处理效果较差的问题。所述技术方案如下:
第一方面,提供了一种音频处理方法,所述方法包括:
获取待处理的第一音频信号的基频信息、频谱包络和激励信号相位;
基于所述基频信息,获取目标周期信号,所述目标周期信号的峰值位于所述基频信息指示的基频的倍频处;
将所述目标周期信号与所述激励信号相位相结合,得到目标激励信号;
将所述目标激励信号与所述频谱包络进行合成,得到第二音频信号。
可选地,所述获取待处理的第一音频信号的基频信息、频谱包络和激励信号相位,包括:
对所述第一音频信号进行分帧处理,得到多个音频帧;
获取所述多个音频帧中每个音频帧的基频信息、频谱包络和激励信号相位。
可选地,所述获取所述多个音频帧中每个音频帧的基频信息、频谱包络和激励信号相位,包括:
通过基频提取算法获取所述每个音频帧的基频信息;
对所述每个音频帧进行傅里叶变换处理,得到所述每个音频帧的频谱信号;
从所述每个音频帧的频谱信号中获取所述每个音频帧的频谱包络;
将所述每个音频帧的频谱信号与频谱包络相除,得到所述每个音频帧的激励信号,从所述每个音频帧的激励信号中分离出所述每个音频帧的激励信号相位。
可选地,所述基于所述基频信息,获取目标周期信号,包括:
基于所述每个音频帧的基频信息,获取所述每个音频帧的目标周期信号,所述每个音频帧的目标周期信号的峰值位于所述每个音频帧的基频的倍频处;
相应的,所述将所述目标周期信号与所述激励信号相位相结合,得到目标激励信号,包括:
将所述每个音频帧的目标周期信号和激励信号相位相结合,得到所述每个音频帧的目标激励信号。
可选地,所述基于所述每个音频帧的基频信息,获取所述每个音频帧的目标周期信号,包括:
获取目标序号,所述目标序号是指在经过傅里叶变换处理得到的频点序列中,以所述每个音频帧的基频信息所确定的频点的序号;
在频域上生成以所述目标序号为周期,且带有峰值的周期信号,得到所述每个音频帧的目标周期信号。
第二方面,提供了一种音频处理装置,所述装置包括:
第一获取模块,用于获取待处理的第一音频信号的基频信息、频谱包络和激励信号相位;
第二获取模块,用于基于所述基频信息,获取目标周期信号,所述目标周期信号的峰值位于所述基频信息指示的基频的倍频处;
结合模块,用于将所述目标周期信号与所述激励信号相位相结合,得到目标激励信号;
合成模块,用于将所述目标激励信号与所述频谱包络进行合成,得到第二音频信号。
可选地,所述第一获取模块用于:
对所述第一音频信号进行分帧处理,得到多个音频帧;
获取所述多个音频帧中每个音频帧的基频信息、频谱包络和激励信号相位。
可选地,所述第一获取模块用于:
通过基频提取算法获取所述每个音频帧的基频信息;
对所述每个音频帧进行傅里叶变换处理,得到所述每个音频帧的频谱信号;
从所述每个音频帧的频谱信号中获取所述每个音频帧的频谱包络;
将所述每个音频帧的频谱信号与频谱包络相除,得到所述每个音频帧的激励信号,从所述每个音频帧的激励信号中分离出所述每个音频帧的激励信号相位。
可选地,所述第二获取模块用于:
基于所述每个音频帧的基频信息,确定所述每个音频帧的目标周期信号,所述每个音频帧的目标周期信号的峰值位于所述每个音频帧的基频的倍频处;
所述结合模块用于:
将所述每个音频帧的目标周期信号和激励信号相位相结合,得到所述每个音频帧的目标激励信号。
可选地,所述第二获取模块用于:
获取目标序号,所述目标序号是指在经过傅里叶变换处理得到的频点序列中,以所述每个音频帧的基频信息所确定的频点的序号;
在频域上生成以所述目标序号为周期,且带有峰值的周期信号,得到所述每个音频帧的目标周期信号。
第三方面,提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,所述指令被处理器执行时实现第一方面所述的音频处理方法。
第四方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面所述的音频处理方法。
本发明实施例提供的技术方案带来的有益效果是:
获取待处理的第一音频信号的基频信息、频谱包络和激励信号相位。其中,频谱包络可以用于表征第一音频信号的音色,激励信号可以用于表征第一音频信号的音调。由于第一音频信号的激励信号中包含噪音成分,因此,为了达到降噪效果,这里基于该基频信息生成目标周期信号,并将该目标周期信号与激励信号相位相结合,得到目标激励信号。由于该目标周期信号的峰值位于基频信息指示的基频的倍频处,因此,重新得到的目标激励信号能够表征第一音频信号的音调,如此,将该目标激励信号与上述频谱包络进行合成,即可得到不包括噪音成分的第二音频信号,从而达到降噪的目的,提高了降噪效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据一示例性实施例示出的一种音频处理方法的流程图。
图2是根据另一示例性实施例示出的一种音频处理方法的流程图。
图3是根据一示例性实施例示出的一种音频处理装置的结构示意图。
图4是根据另一示例性实施例示出的一种终端400的结构框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
在对本发明实施例提供的音频处理方法进行详细介绍之前,先对本发明实施例涉及的应用场景和背景技术进行简单介绍。
首先,对本发明实施例涉及的应用场景进行简单介绍。
本发明实施例提供的音频处理方法可以应用于对音频进行降噪,从而提升人声的清晰度场景中,以使得听众能够更加清晰地听清音频中的有用信息。目前,为了达到降噪的目的,一般需要采用某些评估手段来预估音频中的噪音部分,然后对预估到的噪音部分进行抑制处理。然而,受到噪音具有无规律性、非平稳性等条件的限制,使得一般无法准确的预估到噪音,从而导致无法完全抑制掉音频中的噪音部分。为此,本发明实施例提供了一种音频处理方法,以解决该问题,其具体实现过程请参见如下图1和图2所示的实施例。
其次,对本发明实施例涉及的实施环境进行简单介绍。
本发明实施例提供的音频处理方法可以应用于计算机设备中,该计算机设备可以为终端、服务器等电子设备,终端可以包括手机、平板电脑或计算机等。
在介绍完本发明实施例涉及的应用场景和实施环境后,接下来将结合附图对本发明实施例提供的音频处理方法进行详细介绍。
图1是根据一示例性实施例示出的一种音频处理方法的流程图,该音频处理方法可以包括如下几个步骤:
步骤101:获取待处理的第一音频信号的基频信息、频谱包络和激励信号相位。
步骤102:基于所述基频信息,获取目标周期信号,所述目标周期信号的峰值位于所述基频信息指示的基频的倍频处。
步骤103:将所述目标周期信号与所述激励信号相位相结合,得到目标激励信号。
步骤104:将所述目标激励信号与所述频谱包络进行合成,得到第二音频信号。
在本发明实施例中,获取待处理的第一音频信号的基频信息、频谱包络和激励信号相位。其中,频谱包络可以用于表征第一音频信号的音色,激励信号可以用于表征第一音频信号的音调。由于第一音频信号的激励信号中包含噪音成分,因此,为了达到降噪效果,这里基于该基频信息生成目标周期信号,并将该目标周期信号与激励信号相位相结合,得到目标激励信号。由于该目标周期信号的峰值位于基频信息指示的基频的倍频处,因此,重新得到的目标激励信号能够表征第一音频信号的音调,如此,将该目标激励信号与上述频谱包络进行合成,即可得到不包括噪音成分的第二音频信号,从而达到降噪的目的,提高了降噪效果。
可选地,所述获取待处理的第一音频信号的基频信息、频谱包络和激励信号相位,包括:
对所述第一音频信号进行分帧处理,得到多个音频帧;
获取所述多个音频帧中每个音频帧的基频信息、频谱包络和激励信号相位。
可选地,所述获取所述多个音频帧中每个音频帧的基频信息、频谱包络和激励信号相位,包括:
通过基频提取算法获取所述每个音频帧的基频信息;
对所述每个音频帧进行傅里叶变换处理,得到所述每个音频帧的频谱信号;
从所述每个音频帧的频谱信号中获取所述每个音频帧的频谱包络;
将所述每个音频帧的频谱信号与频谱包络相除,得到所述每个音频帧的激励信号,从所述每个音频帧的激励信号中分离出所述每个音频帧的激励信号相位。
可选地,所述基于所述基频信息,获取目标周期信号,包括:
基于所述每个音频帧的基频信息,获取所述每个音频帧的目标周期信号,所述每个音频帧的目标周期信号的峰值位于所述每个音频帧的基频的倍频处;
相应的,所述将所述目标周期信号与所述激励信号相位相结合,得到目标激励信号,包括:
将所述每个音频帧的目标周期信号和激励信号相位相结合,得到所述每个音频帧的目标激励信号。
可选地,所述基于所述每个音频帧的基频信息,获取所述每个音频帧的目标周期信号,包括:
获取目标序号,所述目标序号是指在经过傅里叶变换处理得到的频点序列中,以所述每个音频帧的基频信息所确定的频点的序号;
在频域上生成以所述目标序号为周期,且带有峰值的周期信号,得到所述每个音频帧的目标周期信号。
上述所有可选技术方案,均可按照任意结合形成本发明的可选实施例,本发明实施例对此不再一一赘述。
图2是根据另一示例性实施例示出的一种音频处理方法的流程图,本实施例以该音频处理方法应用于上述计算机设备中为例进行说明,该音频处理方法可以包括如下几个步骤:
步骤201:获取待处理的第一音频信号的基频信息、频谱包络和激励信号相位。
该第一音频信号可以为歌曲音频、录音音频或视频中的音频等。在一些实施例中,第一音频信号可以为本地存储空间存储的音频,也可以是从其他设备接收得到的音频,还可以是从网络中下载得到的音频,或者,还可以是由用户上传得到的音频,本发明实施例对该第一音频信号的来源不做限定。
为了便于理解,这里对第一音频信号进行简单介绍。通常情况下,第一音频信号中的人声由清音和浊音组成,清音不具有规律性,且由于不伴随声带的振动,因此对人声的清晰度影响不大,通常可以不予考虑。其中的浊音由于伴随声带的振动,因此对人声的清晰度影响较大,而且浊音具有一定的规律性,一般由基音和泛音组成,且会包含一定程度的杂音。基音是指浊音中频率最低的振动产生的音,泛音是指频率为基音的整数倍的纯音,泛音还可以称为谐波。杂音是浊音中除基音和泛音之外的气息声、环境噪声或设备噪声等。
进一步地,浊音可以通过频谱包络和激励信号来表征。其中,频谱包络可以用于表征人声的音色,激励信号可以用于表征人声中除音色之外的声带振动信号,换句话说,激励信号可以用于表征音调。
在研究过程中发现,不同人的激励信号是不一样的,但重要的是其周期特征,周期内的波形形态并不重要,因此,在本发明实施例中,考虑到第一音频信号的人声中的浊音包含一定程度的杂音,为了达到降噪效果,可以基于浊音所具有的规律特性,重新生成一个纯净的音频,即重新生成一个不包含杂音的音频。而由于泛音是浊音的主要组成部分,且浊音中的泛音一般在基频的倍频处,因此,可以先从第一音频信号中提取基频信息,以便根据提取的基频信息确定泛音的位置,从而重新生成一个与原来第一音频信号具有相同周期特征的音频。
浊音一般可以通过通过频谱包络和激励信号来描述,为了便于后续可以得到纯净的音频,还需要从该第一音频信号中提取出频谱包络。此外,由于激励信号相位为用于描述音频波形变化的度量,因此,还需要从该第一音频信号中提取出激励信号相位。
在一些实施例中,获取待处理的第一音频信号的基频信息、频谱包络和激励信号相位的具体实现可以包括:对第一音频信号进行分帧处理,得到多个音频帧,获取该多个音频帧中每个音频帧的基频信息、频谱包络和激励信号相位。
也即是,先对第一音频信号进行分帧处理,得到第一音频信号的每个音频帧,然后获取每个音频帧的基频信息、频谱包络和激励信号相位。具体地,获取每个音频帧的基频信息、频谱包络和激励信号相位可以包括如下步骤1)-5):
1)通过基频提取算法获取每个音频帧的基频信息。
其中,该基频提取算法也称音高提取算法,用于提取音频的基频信息,具体可以为时域自相关算法、YIN算法或PYIN算法等。
2)对每个音频帧进行傅里叶变换处理,得到每个音频帧的频谱信号。
每个音频帧的频谱信号是指每个音频帧在音频空间上的表达。对每个音频帧进行傅里叶变换是为了将对应音频帧从时域空间上的表达转换为频域空间上的表达。
3)从每个音频帧的频谱信号中获取每个音频帧的频谱包络。
具体地,可以采用倒谱法,从每个音频帧的频谱信号中,获取每个音频帧的频谱包络。例如,对于多个音频帧中的第i个音频帧,假设第i个音频帧的频谱信号为Xi(k),则可以从Xi(k)中获取第i个音频帧的频谱包络Hi(k)。
4)将每个音频帧的频谱信号与频谱包络相除,得到每个音频帧的激励信号。
具体地,可以根据每个音频帧的频谱信号和频谱包络,可以采用以下公式(1)确定每个音频帧的激励信号:
其中,Ei(k)为多个音频帧中的第i个音频帧的激励信号,Xi(k)为第i个音频帧的频谱信号,Hi(k)为第i个音频帧的频谱包络。
5)从每个音频帧的激励信号中分离出每个音频帧的激励信号相位。
对每个音频帧的激励信号进行分离,可以得到每个音频帧的激励信号幅值和激励信号相位,譬如,第i个音频帧的激励信号幅值为E(ki),第i个音频帧的激励信号相位为
步骤202:基于基频信息,获取目标周期信号,目标周期信号的峰值位于基频信息指示的基频的倍频处。
也即是,可以根据该基频信息,生成一个周期性的谐波信号,且该谐波信号的峰值位于的基频的倍频处。由于其峰值位于基频的倍频处,因此该目标周期信号具有与第一音频信号相同的周期规律特性。
其中,目标周期信号的峰值可以预先设置,具体可以为基频的所有倍频处,也可以为基频的指定倍频处,本发明实施例对此不做限定。此外,该目标周期信号具有明显的峰值特征,譬如,该目标周期信号可以采用三角波、正弦波、余弦波等。进一步地,该目标周期信号可以采用正弦波中正半轴部分,或者采用余弦波中正半轴部分。
具体地,根据该基频信息,获取目标周期信号包括:根据每个音频帧的基频信息,获取每个音频帧的目标周期信号,且每个音频帧的目标周期信号的峰值位于对应音频帧的基频的倍频处。
具体地,可以获取目标序号,所述目标序号是指在经过傅里叶变换处理后得到的频点序列中,以所述每个音频帧的基频信息所确定的频点的序号,在频域上生成以所述目标序号为周期,且带有峰值的周期信号,得到所述每个音频帧的目标周期信号。
也就是说,在对每个音频帧进行傅里叶变换处理后,一般可以产生多个频点,得到频点序列,譬如,当进行1024次傅里叶变换处理时,可以产生1024个频点。此时,获取以每个音频帧的基频信息所确定的频点的序号,譬如,以每个音频帧的基频信息所确定的频点的序号为5,则以5为周期,频域上生成带有峰值的周期信号,得到每个音频帧的目标周期信号。
步骤203:将目标周期信号与激励信号相位相结合,得到目标激励信号。
由于目标周期信号的峰值位于基频的倍频处,因此,将目标周期信号具有与第一音频信号相同的周期规律特性,因此,将该目标周期信号与激励信号相位相结合后,即可重新生成一个不包括杂音的目标激励信号。
具体地,将目标周期信号与激励信号相位相结合可以包括:将每个音频帧的目标周期信号和激励信号相位相结合,得到每个音频帧的目标激励信号。
例如,假设多个音频帧中的第i个音频帧的激励信号相位为该第i个音频帧的目标周期信号为Ai(k),则将Ai(k)与相结合,可以得到第i个音频帧的目标激励信号
步骤204:将目标激励信号与频谱包络进行合成,得到第二音频信号。
由于目标激励信号是基于目标周期信号得到的,因此,将目标激励信号与和频谱包络合成后,即可得到纯净的第二音频信号,也即是,该第二音频信号中不包含有噪声,从而得到降噪的效果。
具体地,将目标激励信号和频谱包络进行合成处理,得到第二音频信号可以包括:将每个音频帧的目标激励信号和频谱包络进行组合处理,得到处理后的每个音频帧,然后将处理后的多个音频帧组成的音频,确定为第二音频信号。
具体地,可以将每个音频帧的目标激励信号和频谱包络进行组合处理,得到处理后的每个音频帧的频谱信号,然后,对处理后的每个音频帧的频谱信号进行反傅里叶变换,得到处理后的每个音频帧。
具体地,可以采用以下公式(2),将每个音频帧的目标激励信号和频谱包络进行组合处理,得到处理后的每个音频帧的频谱信号:
其中,Yi(k)为多个音频帧中处理后的第i个音频帧的频谱信号,为第i个音频帧的目标激励信号,Hi(k)为第i个音频帧的频谱包络。
在本发明实施例中,获取待处理的第一音频信号的基频信息、频谱包络和激励信号相位。其中,频谱包络可以用于表征第一音频信号的音色,激励信号可以用于表征第一音频信号的音调。由于第一音频信号的激励信号中包含噪音成分,因此,为了达到降噪效果,这里基于该基频信息获取目标周期信号,并将该目标周期信号与激励信号相位相结合,得到目标激励信号。由于该目标周期信号的峰值位于基频信息指示的基频的倍频处,因此,重新得到的目标激励信号能够表征第一音频信号的音调,如此,将该目标激励信号与上述频谱包络进行合成,即可得到不包括噪音成分的第二音频信号,从而达到降噪的目的,提高了降噪效果。
图3是根据一示例性实施例示出的一种音频处理装置的结构示意图,该音频处理装置可以由软件、硬件或者两者的结合实现。该音频处理装置可以包括:
第一获取模块310,用于获取待处理的第一音频信号的基频信息、频谱包络和激励信号相位;
第二获取模块320,用于基于所述基频信息,获取目标周期信号,所述目标周期信号的峰值位于所述基频信息指示的基频的倍频处;
结合模块330,用于将所述目标周期信号与所述激励信号相位相结合,得到目标激励信号;
合成模块340,用于将所述目标激励信号与所述频谱包络进行合成,得到第二音频信号。
可选地,所述第一获取模块310用于:
对所述第一音频信号进行分帧处理,得到多个音频帧;
获取所述多个音频帧中每个音频帧的基频信息、频谱包络和激励信号相位。
可选地,所述第一获取模块310用于:
通过基频提取算法获取所述每个音频帧的基频信息;
对所述每个音频帧进行傅里叶变换处理,得到所述每个音频帧的频谱信号;
从所述每个音频帧的频谱信号中获取所述每个音频帧的频谱包络;
将所述每个音频帧的频谱信号与频谱包络相除,得到所述每个音频帧的激励信号,从所述每个音频帧的激励信号中分离出所述每个音频帧的激励信号相位。
可选地,所述第二获取模块320用于:
基于所述每个音频帧的基频信息,确定所述每个音频帧的目标周期信号,所述每个音频帧的目标周期信号的峰值位于所述每个音频帧的基频的倍频处;
所述结合模块用于:
将所述每个音频帧的目标周期信号和激励信号相位相结合,得到所述每个音频帧的目标激励信号。
可选地,所述第二获取模块320用于:
获取目标序号,所述目标序号是指在经过傅里叶变换处理得到的频点序列中,以所述每个音频帧的基频信息所确定的频点的序号;
在频域上生成以所述目标序号为周期,且带有峰值的周期信号,得到所述每个音频帧的目标周期信号。
在本发明实施例中,获取待处理的第一音频信号的基频信息、频谱包络和激励信号相位。其中,频谱包络可以用于表征第一音频信号的音色,激励信号可以用于表征第一音频信号的音调。由于第一音频信号的激励信号中包含噪音成分,因此,为了达到降噪效果,这里基于该基频信息获取目标周期信号,并将该目标周期信号与激励信号相位相结合,得到目标激励信号。由于该目标周期信号的峰值位于基频信息指示的基频的倍频处,因此,重新得到的目标激励信号能够表征第一音频信号的音调,如此,将该目标激励信号与上述频谱包络进行合成,即可得到不包括噪音成分的第二音频信号,从而达到降噪的目的,提高了降噪效果。
需要说明的是:上述实施例提供的音频处理装置在实现音频处理方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的音频处理装置与音频处理方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图4示出了本发明一个示例性实施例提供的终端400的结构框图。该终端400可以是:智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio LayerIV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端400还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端400包括有:处理器401和存储器402。
处理器401可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器401可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器401也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器401可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器401还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器402可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器402还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器402中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器401所执行以实现本申请中方法实施例提供的音频处理方法。
在一些实施例中,终端400还可选包括有:外围设备接口403和至少一个外围设备。处理器401、存储器402和外围设备接口403之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口403相连。具体地,外围设备包括:射频电路404、触摸显示屏405、摄像头406、音频电路407、定位组件408和电源409中的至少一种。
外围设备接口403可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器401和存储器402。在一些实施例中,处理器401、存储器402和外围设备接口403被集成在同一芯片或电路板上;在一些其他实施例中,处理器401、存储器402和外围设备接口403中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路404用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路404通过电磁信号与通信网络以及其他通信设备进行通信。射频电路404将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路404包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路404可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路404还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏405用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏405是触摸显示屏时,显示屏405还具有采集在显示屏405的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器401进行处理。此时,显示屏405还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏405可以为一个,设置终端400的前面板;在另一些实施例中,显示屏405可以为至少两个,分别设置在终端400的不同表面或呈折叠设计;在再一些实施例中,显示屏405可以是柔性显示屏,设置在终端400的弯曲表面上或折叠面上。甚至,显示屏405还可以设置成非矩形的不规则图形,也即异形屏。显示屏405可以采用LCD(LiquidCrystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件406用于采集图像或视频。可选地,摄像头组件406包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件406还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路407可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器401进行处理,或者输入至射频电路404以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端400的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器401或射频电路404的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路407还可以包括耳机插孔。
定位组件408用于定位终端400的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件408可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。
电源409用于为终端400中的各个组件进行供电。电源409可以是交流电、直流电、一次性电池或可充电电池。当电源409包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端400还包括有一个或多个传感器410。该一个或多个传感器410包括但不限于:加速度传感器411、陀螺仪传感器412、压力传感器413、指纹传感器414、光学传感器415以及接近传感器416。
加速度传感器411可以检测以终端400建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器411可以用于检测重力加速度在三个坐标轴上的分量。处理器401可以根据加速度传感器411采集的重力加速度信号,控制触摸显示屏405以横向视图或纵向视图进行用户界面的显示。加速度传感器411还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器412可以检测终端400的机体方向及转动角度,陀螺仪传感器412可以与加速度传感器411协同采集用户对终端400的3D动作。处理器401根据陀螺仪传感器412采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器413可以设置在终端400的侧边框和/或触摸显示屏405的下层。当压力传感器413设置在终端400的侧边框时,可以检测用户对终端400的握持信号,由处理器401根据压力传感器413采集的握持信号进行左右手识别或快捷操作。当压力传感器413设置在触摸显示屏405的下层时,由处理器401根据用户对触摸显示屏405的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器414用于采集用户的指纹,由处理器401根据指纹传感器414采集到的指纹识别用户的身份,或者,由指纹传感器414根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器401授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器414可以被设置终端400的正面、背面或侧面。当终端400上设置有物理按键或厂商Logo时,指纹传感器414可以与物理按键或厂商Logo集成在一起。
光学传感器415用于采集环境光强度。在一个实施例中,处理器401可以根据光学传感器415采集的环境光强度,控制触摸显示屏405的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏405的显示亮度;当环境光强度较低时,调低触摸显示屏405的显示亮度。在另一个实施例中,处理器401还可以根据光学传感器415采集的环境光强度,动态调整摄像头组件406的拍摄参数。
接近传感器416,也称距离传感器,通常设置在终端400的前面板。接近传感器416用于采集用户与终端400的正面之间的距离。在一个实施例中,当接近传感器416检测到用户与终端400的正面之间的距离逐渐变小时,由处理器401控制触摸显示屏405从亮屏状态切换为息屏状态;当接近传感器416检测到用户与终端400的正面之间的距离逐渐变大时,由处理器401控制触摸显示屏405从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图4中示出的结构并不构成对终端400的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
本申请实施例还提供了一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行上述音频处理方法。
本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行执行上述音频处理方法。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (11)

1.一种音频处理方法,其特征在于,所述方法包括:
获取待处理的第一音频信号的基频信息、频谱包络和激励信号相位;
基于所述基频信息,获取目标周期信号,所述目标周期信号的峰值位于所述基频信息指示的基频的倍频处;
将所述目标周期信号与所述激励信号相位相结合,得到目标激励信号;
将所述目标激励信号与所述频谱包络进行合成,得到第二音频信号。
2.如权利要求1所述的方法,其特征在于,所述获取待处理的第一音频信号的基频信息、频谱包络和激励信号相位,包括:
对所述第一音频信号进行分帧处理,得到多个音频帧;
获取所述多个音频帧中每个音频帧的基频信息、频谱包络和激励信号相位。
3.如权利要求2所述的方法,其特征在于,所述获取所述多个音频帧中每个音频帧的基频信息、频谱包络和激励信号相位,包括:
通过基频提取算法获取所述每个音频帧的基频信息;
对所述每个音频帧进行傅里叶变换处理,得到所述每个音频帧的频谱信号;
从所述每个音频帧的频谱信号中获取所述每个音频帧的频谱包络;
将所述每个音频帧的频谱信号与频谱包络相除,得到所述每个音频帧的激励信号,从所述每个音频帧的激励信号中分离出所述每个音频帧的激励信号相位。
4.如权利要求3所述的方法,其特征在于,所述基于所述基频信息,获取目标周期信号,包括:
基于所述每个音频帧的基频信息,获取所述每个音频帧的目标周期信号,所述每个音频帧的目标周期信号的峰值位于所述每个音频帧的基频的倍频处;
相应的,所述将所述目标周期信号与所述激励信号相位相结合,得到目标激励信号,包括:
将所述每个音频帧的目标周期信号和激励信号相位相结合,得到所述每个音频帧的目标激励信号。
5.如权利要求4所述的方法,其特征在于,所述基于所述每个音频帧的基频信息,获取所述每个音频帧的目标周期信号,包括:
获取目标序号,所述目标序号是指在经过傅里叶变换处理得到的频点序列中,以所述每个音频帧的基频信息所确定的频点的序号;
在频域上生成以所述目标序号为周期,且带有峰值的周期信号,得到所述每个音频帧的目标周期信号。
6.一种音频处理装置,其特征在于,所述装置包括:
第一获取模块,用于获取待处理的第一音频信号的基频信息、频谱包络和激励信号相位;
第二获取模块,用于基于所述基频信息,获取目标周期信号,所述目标周期信号的峰值位于所述基频信息指示的基频的倍频处;
结合模块,用于将所述目标周期信号与所述激励信号相位相结合,得到目标激励信号;
合成模块,用于将所述目标激励信号与所述频谱包络进行合成,得到第二音频信号。
7.如权利要求6所述的装置,其特征在于,所述第一获取模块用于:
对所述第一音频信号进行分帧处理,得到多个音频帧;
获取所述多个音频帧中每个音频帧的基频信息、频谱包络和激励信号相位。
8.如权利要求7所述的装置,其特征在于,所述第一获取模块用于:
通过基频提取算法获取所述每个音频帧的基频信息;
对所述每个音频帧进行傅里叶变换处理,得到所述每个音频帧的频谱信号;
从所述每个音频帧的频谱信号中获取所述每个音频帧的频谱包络;
将所述每个音频帧的频谱信号与频谱包络相除,得到所述每个音频帧的激励信号,从所述每个音频帧的激励信号中分离出所述每个音频帧的激励信号相位。
9.如权利要求8所述的装置,其特征在于,所述第二获取模块用于:
基于所述每个音频帧的基频信息,确定所述每个音频帧的目标周期信号,所述每个音频帧的目标周期信号的峰值位于所述每个音频帧的基频的倍频处;
所述结合模块用于:
将所述每个音频帧的目标周期信号和激励信号相位相结合,得到所述每个音频帧的目标激励信号。
10.如权利要求9所述的装置,其特征在于,所述第二获取模块用于:
获取目标序号,所述目标序号是指在经过傅里叶变换处理得到的频点序列中,以所述每个音频帧的基频信息所确定的频点的序号;
在频域上生成以所述目标序号为周期,且带有峰值的周期信号,得到所述每个音频帧的目标周期信号。
11.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现权利要求1-5所述的任一项方法的步骤。
CN201811041126.8A 2018-09-06 2018-09-06 一种音频处理方法、装置及存储介质 Active CN109003621B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811041126.8A CN109003621B (zh) 2018-09-06 2018-09-06 一种音频处理方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811041126.8A CN109003621B (zh) 2018-09-06 2018-09-06 一种音频处理方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN109003621A true CN109003621A (zh) 2018-12-14
CN109003621B CN109003621B (zh) 2021-06-04

Family

ID=64590688

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811041126.8A Active CN109003621B (zh) 2018-09-06 2018-09-06 一种音频处理方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN109003621B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109920446A (zh) * 2019-03-12 2019-06-21 腾讯音乐娱乐科技(深圳)有限公司 一种音频数据处理方法、装置及计算机存储介质
CN110853671A (zh) * 2019-10-31 2020-02-28 普联技术有限公司 一种音频特征提取方法和装置、训练方法及音频分类方法
CN111179960A (zh) * 2020-03-06 2020-05-19 北京松果电子有限公司 音频信号处理方法及装置、存储介质
CN113421584A (zh) * 2021-07-05 2021-09-21 平安科技(深圳)有限公司 音频降噪方法、装置、计算机设备及存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6014622A (en) * 1996-09-26 2000-01-11 Rockwell Semiconductor Systems, Inc. Low bit rate speech coder using adaptive open-loop subframe pitch lag estimation and vector quantization
CN1702738A (zh) * 2004-05-26 2005-11-30 本田研究所欧洲有限公司 谐波噪声的减去消除
CN101326853A (zh) * 2005-12-13 2008-12-17 Nxp股份有限公司 处理音频数据流的装置和方法
CN101336451A (zh) * 2006-01-31 2008-12-31 西门子企业通讯有限责任两合公司 音频信号编码的方法和装置
CN101336449A (zh) * 2006-01-31 2008-12-31 西门子企业通讯有限责任两合公司 用于音频信号编码的方法和装置
CN102610236A (zh) * 2012-02-29 2012-07-25 山东大学 一种改善喉振话筒语音音质的方法
CN102664003A (zh) * 2012-04-24 2012-09-12 南京邮电大学 基于谐波加噪声模型的残差激励信号合成及语音转换方法
CN103050121A (zh) * 2012-12-31 2013-04-17 北京迅光达通信技术有限公司 线性预测语音编码方法及语音合成方法
CN203038659U (zh) * 2012-02-21 2013-07-03 华南理工大学 一种可任意调节的语音自然变声装置
CN103632678A (zh) * 2009-01-16 2014-03-12 杜比国际公司 叉积增强的谐波转置
CN106228973A (zh) * 2016-07-21 2016-12-14 福州大学 稳定音色的音乐语音变调方法
CN109065068A (zh) * 2018-08-17 2018-12-21 广州酷狗计算机科技有限公司 音频处理方法、装置及存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6014622A (en) * 1996-09-26 2000-01-11 Rockwell Semiconductor Systems, Inc. Low bit rate speech coder using adaptive open-loop subframe pitch lag estimation and vector quantization
CN1702738A (zh) * 2004-05-26 2005-11-30 本田研究所欧洲有限公司 谐波噪声的减去消除
CN101326853A (zh) * 2005-12-13 2008-12-17 Nxp股份有限公司 处理音频数据流的装置和方法
CN101336451A (zh) * 2006-01-31 2008-12-31 西门子企业通讯有限责任两合公司 音频信号编码的方法和装置
CN101336449A (zh) * 2006-01-31 2008-12-31 西门子企业通讯有限责任两合公司 用于音频信号编码的方法和装置
CN103632678A (zh) * 2009-01-16 2014-03-12 杜比国际公司 叉积增强的谐波转置
CN203038659U (zh) * 2012-02-21 2013-07-03 华南理工大学 一种可任意调节的语音自然变声装置
CN102610236A (zh) * 2012-02-29 2012-07-25 山东大学 一种改善喉振话筒语音音质的方法
CN102664003A (zh) * 2012-04-24 2012-09-12 南京邮电大学 基于谐波加噪声模型的残差激励信号合成及语音转换方法
CN103050121A (zh) * 2012-12-31 2013-04-17 北京迅光达通信技术有限公司 线性预测语音编码方法及语音合成方法
CN106228973A (zh) * 2016-07-21 2016-12-14 福州大学 稳定音色的音乐语音变调方法
CN109065068A (zh) * 2018-08-17 2018-12-21 广州酷狗计算机科技有限公司 音频处理方法、装置及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MATTHIAS RUDOLPH ET AL.: "On the Simulation of Low-Frequency Noise Upconversion in InGaP/GaAs HBT", 《IEEE TRANSACTIONS ON MICROWAVE THEORY AND TECHNIQUES》 *
石锐等: "基于基频波形极值的基音检测方法", 《计算机工程与应用》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109920446A (zh) * 2019-03-12 2019-06-21 腾讯音乐娱乐科技(深圳)有限公司 一种音频数据处理方法、装置及计算机存储介质
CN109920446B (zh) * 2019-03-12 2021-03-26 腾讯音乐娱乐科技(深圳)有限公司 一种音频数据处理方法、装置及计算机存储介质
CN110853671A (zh) * 2019-10-31 2020-02-28 普联技术有限公司 一种音频特征提取方法和装置、训练方法及音频分类方法
CN110853671B (zh) * 2019-10-31 2022-05-06 普联技术有限公司 一种音频特征提取方法和装置、训练方法及音频分类方法
CN111179960A (zh) * 2020-03-06 2020-05-19 北京松果电子有限公司 音频信号处理方法及装置、存储介质
CN113421584A (zh) * 2021-07-05 2021-09-21 平安科技(深圳)有限公司 音频降噪方法、装置、计算机设备及存储介质
CN113421584B (zh) * 2021-07-05 2023-06-23 平安科技(深圳)有限公司 音频降噪方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN109003621B (zh) 2021-06-04

Similar Documents

Publication Publication Date Title
CN108538311A (zh) 音频分类方法、装置及计算机可读存储介质
CN108156575B (zh) 音频信号的处理方法、装置及终端
CN109003621A (zh) 一种音频处理方法、装置及存储介质
CN109379643A (zh) 视频合成方法、装置、终端及存储介质
CN108401124A (zh) 视频录制的方法和装置
CN110222789A (zh) 图像识别方法及存储介质
CN108335703B (zh) 确定音频数据的重音位置的方法和装置
CN109147757A (zh) 歌声合成方法及装置
CN109729297A (zh) 在视频中添加特效的方法和装置
CN109300482A (zh) 音频录制方法、装置、存储介质以及终端
CN109994127A (zh) 音频检测方法、装置、电子设备及存储介质
CN107958672A (zh) 获取基音波形数据的方法和装置
CN108965757A (zh) 视频录制方法、装置、终端及存储介质
CN109065068A (zh) 音频处理方法、装置及存储介质
CN110491358A (zh) 进行音频录制的方法、装置、设备、系统及存储介质
CN109192218A (zh) 音频处理的方法和装置
CN109300485A (zh) 音频信号的评分方法、装置、电子设备及计算机存储介质
CN109285178A (zh) 图像分割方法、装置及存储介质
CN109635133A (zh) 可视化音频播放方法、装置、电子设备及存储介质
CN109192223A (zh) 音频对齐的方法和装置
CN108320756A (zh) 一种检测音频是否是纯音乐音频的方法和装置
CN109243479A (zh) 音频信号处理方法、装置、电子设备及存储介质
CN109547843A (zh) 对音视频进行处理的方法和装置
CN109102811A (zh) 音频指纹的生成方法、装置及存储介质
CN110189771A (zh) 同源音频的音质检测方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant