CN112447166A - 一种针对目标频谱矩阵的处理方法及装置 - Google Patents

一种针对目标频谱矩阵的处理方法及装置 Download PDF

Info

Publication number
CN112447166A
CN112447166A CN201910759361.7A CN201910759361A CN112447166A CN 112447166 A CN112447166 A CN 112447166A CN 201910759361 A CN201910759361 A CN 201910759361A CN 112447166 A CN112447166 A CN 112447166A
Authority
CN
China
Prior art keywords
data frame
data
target
information
subframe
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910759361.7A
Other languages
English (en)
Inventor
文敢
刘守达
孙孟军
顾震宇
王文特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910759361.7A priority Critical patent/CN112447166A/zh
Priority to PCT/CN2020/108599 priority patent/WO2021031942A1/zh
Publication of CN112447166A publication Critical patent/CN112447166A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Abstract

本申请公开了一种针对目标频谱矩阵的处理方法。所述方法通过获取到的与目标频谱矩阵对应的目标数据帧信息,针对每一个数据帧,通过其对应的数据帧信息获取与所述数据帧对应的归一化窗函数子序列,并通过所述归一化窗函数子序列可以直接获取到与所述数据帧对应的归一化后的信号序列,而不需要额外的进行归一化运算,大大的减少了针对目标频谱矩阵进行处理时的计算量,提高了终端设备进行短时傅立叶逆变换运算时的运算速度及运算效率。

Description

一种针对目标频谱矩阵的处理方法及装置
技术领域
本申请涉及频谱处理领域,具体涉及一种针对目标频谱矩阵的处理方法。本申请同时涉及一种针对目标频谱矩阵的处理装置,一种针对目标数据帧的处理方法及装置,电子设备,存储介质及现场可编程门阵列。
背景技术
随着计算机技术的发展,在导航领域、语音视听阅读领域等,基于给定目标的语音频谱矩阵,进行语音信号的恢复,并进一步的进行语音合成,从而生成丰富多样的语音信息,可以为人们生活带来极大的方便。
目前,针对给定目标的语音频谱矩阵,即目标频谱矩阵进行信号恢复的处理方法,主要是用户使用终端计算设备,如服务端计算设备或客户端计算设备,利用短时傅立叶逆变换(inverse Short Time Fourier Transform,iSTFT)运算方法针对给定的具有短时傅立叶变换(Short Time Fourier Transform,STFT)特性的目标频谱矩阵进行反复的STFT/iSTFT变换,从而进行信号的恢复及重建。
通常来讲,STFT运算与iSTFT运算互相对称的,但是,由于iSTFT运算的过程中需要进行额外的归一化运算,往往会破坏两者的对称性;同时,频繁的进行归一化运算也会大大提高用于语音恢复及合成的终端设备的计算量,并大量占用终端设备的存储空间,进而带来结果输出缓慢、效率低下,用户体验不佳的问题。
发明内容
本申请提供一种针对目标频谱矩阵的处理方法,以解决现有技术中存在的终端设备在进行短时傅立叶逆变换运算时面对的计算量大、存储空间占用大,速度缓慢且效率低下的问题。
本申请提供一种针对目标频谱矩阵的处理方法,包括:
根据目标频谱矩阵,获取目标数据帧信息,其中,所述目标数据帧信息包括与所述目标频谱矩阵对应的多个数据帧的信息;
根据所述目标数据帧信息,获取第一数据帧信息;
根据所述第一数据帧信息,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据帧信息对应的第一归一化窗函数子序列;
根据所述第一数据帧信息和所述第一归一化窗函数子序列,获取所述第一数据帧对应的第一信号序列;
根据所述第一信号序列,获取与所述目标频谱矩阵对应的目标信号序列。
可选的,所述数据帧信息与归一化窗函数子序列的对应关系,通过以下步骤获取:
从数据帧信息中,获取第一数据帧信息,所述第一数据帧信息包括第一数据帧标识和所述第一数据帧的数据子帧信息;
根据所述第一数据帧的数据子帧信息,获取第一数据子帧信息;
根据所述第一数据帧标识和所述第一数据子帧信息,获取与所述第一数据子帧信息对应的第一窗函数子序列和第一归一化子序列;
根据所述第一窗函数子序列和所述第一归一化子序列,获取与所述第一数据帧标识和所述第一数据子帧信息对应的第一归一化窗函数子序列;
根据所述第一数据帧标识、所述第一数据子帧信息和所述第一归一化窗函数子序列,建立数据帧信息与归一化窗函数子序列的对应关系。
可选的,所述根据所述第一窗函数子序列和所述第一归一化子序列,获取与所述第一数据帧标识和所述第一数据子帧信息对应的第一归一化窗函数子序列,包括:
对所述第一窗函数子序列和所述第一归一化子序列进行除运算,获取与所述第一数据帧标识和所述第一数据子帧信息对应的第一归一化窗函数子序列。
可选的,所述根据所述第一数据帧标识、所述第一数据子帧信息和所述第一归一化窗函数子序列,建立数据帧信息与归一化窗函数子序列的对应关系,还包括:
根据归一化序列的周期性特点,对建立的数据帧信息与归一化窗函数子序列的对应关系进行压缩,获取压缩后的数据帧信息与归一化窗函数子序列的对应关系。
可选的,所述根据所述第一数据帧信息,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据帧信息对应的第一归一化窗函数子序列,包括:
根据所述第一数据帧信息,获取第一数据帧标识和所述第一数据帧的数据子帧信息;
根据所述第一数据帧标识和所述第一数据帧的数据子帧信息,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据帧的至少一个数据子帧对应的归一化窗函数子序列。
可选的,所述根据所述第一数据帧信息,获取所述第一数据帧的数据子帧信息,包括:
根据所述第一数据帧信息,按照预设的数据子帧的帧长数值,将所述第一数据帧划分为多个等长的数据子帧,并获取所述多个数据子帧的信息。
可选的,所述根据所述第一数据帧标识和所述第一数据帧的数据子帧信息,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据帧的至少一个数据子帧对应的归一化窗函数子序列,包括:
根据所述第一数据帧的数据子帧信息,获取第一数据子帧信息,所述第一数据子帧信息包括所述第一数据子帧的第一数据子帧标识;
根据所述第一数据帧标识和所述第一数据子帧标识,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据子帧信息对应的第一归一化窗函数子序列。
可选的,所述根据所述第一数据帧标识和所述第一数据子帧标识,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据子帧信息对应的第一归一化窗函数子序列,包括:
根据所述第一数据帧标识和所述第一数据子帧标识,生成索引信息;
根据所述索引信息,在数据帧信息与归一化窗函数子序列的对应关系中,查找与所述第一数据子帧信息对应的第一归一化窗函数子序列。
可选的,所述根据所述第一数据帧信息和所述第一归一化窗函数子序列,获取所述第一数据帧对应的第一信号序列,包括:
根据所述第一数据帧的数据子帧信息和与所述第一数据帧的至少一个数据子帧对应的归一化窗函数子序列,获取所述第一数据帧的至少一个数据子帧对应的归一化信号子序列;
根据所述第一数据帧的数据子帧信息和所述至少一个数据子帧对应的归一化信号子序列,获取所述第一数据帧对应的第一信号序列。
可选的,所述根据所述第一数据帧的数据子帧信息和与所述第一数据帧的至少一个数据子帧对应的归一化窗函数子序列,获取所述第一数据帧的至少一个数据子帧对应的归一化信号子序列,包括:
根据所述第一数据帧的数据子帧信息,获取第一数据子帧;
从与所述第一数据帧的至少一个数据子帧对应的归一化窗函数子序列中,获取与所述第一数据子帧对应的第一归一化窗函数子序列;
将所述第一数据子帧与所述第一归一化窗函数子序列相乘,获得所述第一数据子帧对应的第一归一化信号子序列。
可选的,所述根据所述第一数据帧的数据子帧信息和所述至少一个数据子帧对应的归一化信号子序列,获取所述第一数据帧对应的第一信号序列,包括:
将所述第一归一化信号子序列相加,获取所述第一数据帧对应的第一信号序列。
可选的,所述根据所述第一信号序列,获取与所述目标频谱矩阵对应的目标信号序列,包括:
将预设的数据子帧的帧长数值作为步进数值,将所述第一信号序列重叠排列;
将重叠排列后的所述第一信号序列相加,获取与所述目标频谱矩阵对应的目标信号序列。
可选的,所述根据所述第一数据帧的数据子帧信息和与所述第一数据帧的至少一个数据子帧对应的归一化窗函数子序列,获取所述第一数据帧的至少一个数据子帧对应的归一化信号子序列,还包括:
根据所述第一数据帧的数据子帧信息,获取第一数据子帧信息,所述第一数据子帧信息包括第一数据子帧标识;
如果通过所述第一数据子帧标识判断所述第一数据子帧是所述第一数据帧中的无重叠数据子帧或最末数据帧的无重叠数据子帧,则直接输出相应数据子帧,否则,获取所述第一数据子帧对应的第一归一化窗函数子序列。
可选的,所述根据所述第一数据帧的数据子帧信息和所述至少一个数据子帧对应的归一化信号子序列,获取所述第一数据帧对应的第一信号序列,包括:
针对所述直接输出的第一数据子帧进行加窗处理,并获取所述直接输出的第一数据子帧对应的未归一化信号子序列;
针对所述具有对应的归一化窗函数子序列的第一数据子帧,将所述第一数据子帧与其对应的第一归一化窗函数子序列相乘,获取所述具有对应的归一化窗函数子序列的第一数据子帧对应的归一化信号子序列;
将所述未归一化信号子序列和所述归一化信号子序列相加,获取所述第一数据帧对应的第一信号序列。
可选的,所述根据所述第一信号序列,获取与所述目标频谱矩阵对应的目标信号序列,包括:
选择一个步进值,将所述第一信号序列重叠排列,其中,所述数据帧的帧长为所述步进值的整数倍;
将重叠排列后的所述第一信号序列相加,获取与所述目标频谱矩阵对应的未完全归一化信号序列;
针对所述未完全归一化信号序列中的直接输出的所述数据子帧,进行局部归一化处理,并将局部归一化处理后的所述未完全归一化的信号序列,作为与所述目标频谱矩阵对应的目标信号序列。
可选的,所述针对所述未完全归一化信号序列中的直接输出的所述数据子帧,进行局部归一化处理,包括:
获取与所述直接输出的数据子帧对应的归一化子序列;
根据所述归一化子序列,对所述直接输出的数据子帧进行归一化处理。
可选的,所述目标频谱矩阵为原始语音数据对应的频谱矩阵,所述目标数据帧信息为所述原始语音数据对应的目标数据帧信息,所述目标信号序列为所述原始语音数据对应的信号序列;
所述方法,还包括:
获取待合成文字信息,其中,所述待合成文字信息为待使用所述原始语音数据进行语音合成的文字的信息;
使用获取到的所述原始语音数据对应的所述目标信号序列,合成所述待合成文字信息对应的目标语音信息
本申请还提供一种针对目标数据帧的处理方法,包括:
获取目标数据帧信息,所述目标数据帧信息包括目标数据帧标识和所述目标数据帧的数据子帧信息;
根据所述目标数据帧标识和所述目标数据帧的数据子帧信息,获取与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列;
根据所述目标数据帧的数据子帧信息和与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列,获取所述目标数据帧的至少一个数据子帧对应的归一化信号子序列;
根据所述至少一个数据子帧对应的归一化信号子序列,获取与所述目标数据帧对应的信号序列。
本申请还提供一种针对目标频谱矩阵的处理装置,包括:
信息获取单元,用于根据目标频谱矩阵,获取目标数据帧信息,其中,所述目标数据帧信息包括与所述目标频谱矩阵对应的多个数据帧的信息;
数据帧信息获取单元,用于根据所述目标数据帧信息,获取第一数据帧信息;
归一化窗函数子序列获取单元,用于根据所述第一数据帧信息,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据帧信息对应的第一归一化窗函数子序列;
信号序列获取单元,用于根据所述第一数据帧信息和所述第一归一化窗函数子序列,获取所述第一数据帧对应的第一信号序列;
目标信号序列获取单元,用于根据所述第一信号序列,获取与所述目标频谱矩阵对应的目标信号序列。
本申请还提供一种针对目标数据帧的处理装置,包括:
信息获取单元,用于获取目标数据帧信息,所述目标数据帧信息包括目标数据帧标识和所述目标数据帧的数据子帧信息;
归一化窗函数子序列获取单元,用于根据所述目标数据帧标识和所述目标数据帧的数据子帧信息,获取与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列;
信号子序列获取单元,用于根据所述目标数据帧的数据子帧信息和与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列,获取所述目标数据帧的至少一个数据子帧对应的归一化信号子序列;
信号序列获取单元,用于根据所述至少一个数据子帧对应的归一化信号子序列,获取与所述目标数据帧对应的信号序列。
本申请还提供一种用于目标频谱矩阵处理的电子设备,包括:
存储器,以及处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
根据目标频谱矩阵,获取目标数据帧信息,其中,所述目标数据帧信息包括与所述目标频谱矩阵对应的多个数据帧的信息;
根据所述目标数据帧信息,获取第一数据帧信息;
根据所述第一数据帧信息,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据帧信息对应的第一归一化窗函数子序列;
根据所述第一数据帧信息和所述第一归一化窗函数子序列,获取所述第一数据帧对应的第一信号序列;
根据所述第一信号序列,获取与所述目标频谱矩阵对应的目标信号序列。
本申请还提供一种用于目标数据帧处理的电子设备,包括:
存储器,以及处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
获取目标数据帧信息,所述目标数据帧信息包括目标数据帧标识和所述目标数据帧的数据子帧信息;
根据所述目标数据帧标识和所述目标数据帧的数据子帧信息,获取与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列;
根据所述目标数据帧的数据子帧信息和与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列,获取所述目标数据帧的至少一个数据子帧对应的归一化信号子序列;
根据所述至少一个数据子帧对应的归一化信号子序列,获取与所述目标数据帧对应的信号序列。
本申请还提供一种用于目标频谱矩阵处理的存储设备,存储有针对目标频谱矩阵的处理方法的程序,该程序被处理器运行,执行下述步骤:
根据目标频谱矩阵,获取目标数据帧信息,其中,所述目标数据帧信息包括与所述目标频谱矩阵对应的多个数据帧的信息;
根据所述目标数据帧信息,获取第一数据帧信息;
根据所述第一数据帧信息,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据帧信息对应的第一归一化窗函数子序列;
根据所述第一数据帧信息和所述第一归一化窗函数子序列,获取所述第一数据帧对应的第一信号序列;
根据所述第一信号序列,获取与所述目标频谱矩阵对应的目标信号序列。
本申请还提供一种用于目标数据帧处理的存储设备,存储有针对目标频谱矩阵的处理方法的程序,该程序被处理器运行,执行下述步骤:
获取目标数据帧信息,所述目标数据帧信息包括目标数据帧标识和所述目标数据帧的数据子帧信息;
根据所述目标数据帧标识和所述目标数据帧的数据子帧信息,获取与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列;
根据所述目标数据帧的数据子帧信息和与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列,获取所述目标数据帧的至少一个数据子帧对应的归一化信号子序列;
根据所述至少一个数据子帧对应的归一化信号子序列,获取与所述目标数据帧对应的信号序列。
本申请还提供一种用于目标频谱矩阵处理的现场可编程门阵列,包括上述的针对目标频谱矩阵的处理装置。
本申请还提供一种用于目标数据帧处理的现场可编程门阵列,包括上述的针对目标频谱矩阵的处理装置。
与现有技术相比,本申请具有以下优点:
本申请提供一种针对目标频谱矩阵的处理方法,包括:根据目标频谱矩阵,获取目标数据帧信息,其中,所述目标数据帧信息包括与所述目标频谱矩阵对应的多个数据帧的信息;根据所述目标数据帧信息,获取第一数据帧信息;根据所述第一数据帧信息,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据帧信息对应的第一归一化窗函数子序列;根据所述第一数据帧信息和所述第一归一化窗函数子序列,获取所述第一数据帧对应的第一信号序列;根据所述第一信号序列,获取与所述目标频谱矩阵对应的目标信号序列。所述方法通过获取到的与目标频谱矩阵对应的目标数据帧信息,针对每一个数据帧,通过其对应的数据帧信息获取与所述数据帧对应的归一化窗函数子序列,并通过所述归一化窗函数子序列可以直接获取到与所述数据帧对应的归一化后的信号序列,而不需要额外的进行归一化运算,大大的减少了针对目标频谱矩阵进行处理时的计算量,提高了终端设备进行短时傅立叶逆变换运算时的运算速度及运算效率。
本申请提供一种针对目标数据帧的处理方法,包括:获取目标数据帧信息,所述目标数据帧信息包括目标数据帧标识和所述目标数据帧的数据子帧信息;根据所述目标数据帧标识和所述目标数据帧的数据子帧信息,获取与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列;根据所述目标数据帧的数据子帧信息和与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列,获取所述目标数据帧的至少一个数据子帧对应的归一化信号子序列;根据所述至少一个数据子帧对应的归一化信号子序列,获取与所述目标数据帧对应的信号序列。通过将加窗处理与归一化处理相融合,并利用归一化序列的周期性特点,预先计算并存储数据帧信息与归一化窗函数子序列的对应关系,在获取目标数据帧的信号序列时,可以完全省略或部分省略相应的归一化处理,大大减少了针对目标数据帧进行处理时的计算量,同时,相较于现有技术还节省了存储空间,进一步的,提高了终端设备进行短时傅立叶逆变换运算时的运算速度及运算效率。
附图说明
图1是本申请第一实施例提供的短时傅立叶变换的运算过程示意图;
图2是本申请第一实施例提供的常规的短时傅立叶逆变换的运算过程示意图;
图3是本申请第一实施例提供的针对目标频谱矩阵的处理方法的应用场景示意图;
图4是本申请第一实施例提供的针对目标频谱矩阵的处理方法的流程图;
图5是本申请第二实施例提供的针对目标数据帧的处理方法的流程图;
图6是本申请第三实施例提供的针对目标频谱矩阵的处理装置的示意图;
图7是本申请第四实施例提供的针对目标数据帧的处理装置的示意图;
图8是本申请第五实施例提供的用于目标频谱矩阵处理的电子设备的示意图;
图9是本申请第六实施例提供的用于目标数据帧处理的电子设备的示意图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
在介绍本申请的针对目标频谱矩阵的处理方法之前,分别对短时傅立叶变换方法及短时傅立叶逆变换方法进行简单的介绍,以方便介绍本申请所述的针对目标频谱矩阵的处理方法。
请参看图1,其为本申请第一实施例提供的短时傅立叶变换的运算过程示意图。STFT运算主要是针对待处理的信号序列进行运算处理,并将其转换为相应的频谱矩阵,其中,在计算机领域,信号主要表达为传递信息的函数,在连续时间范围内定义的信号称为连续时间信号,当时间变量为离散的时间时,对应的信号称为离散时间信号,也称为序列,即信号序列;频谱又称为振动谱,通常用来描述一个复杂的振动情况,任何复杂的振动都可以分解为许多不同振幅、不同频率的简谐振动之和,为了分析实际振动的性质,将分振动振幅按其频率的大小排列而成的图像称为该复杂振动的频谱,通常使用频谱矩阵来具体表达对应的频谱图像。请参看图1,针对长度为L的待处理信号序列,步进为S的 STFT变换的运算步骤主要为:步骤S101,首先将待处理信号序列按照步进S 以及数据帧的帧长N(通常N为S的整数倍)。截取为M=(L-N)/S+1个数据帧,并且相邻两个数据帧之间的第一个信号相距S。之后,执行步骤S102,针对每一数据帧进行加窗处理,通常选取为汉宁窗,其中,因为计算机设备通常只能处理有限长度的信号,因此,在针对信号序列进行处理时,原始信号序列通常以采样时间进行截断,即有限化,之后分别针对截取的每一个片段进行进一步处理,针对原始信号序列按采样时间进行截断的过程即为加窗处理。之后,执行步骤S103,对进行加窗处理后的数据帧进行N点快速傅立叶变换(Fast Fourier Transform,FFT)变换,最终得到N点的离散傅立叶变换(Discrete Fourier Transform,DFT)频谱。所有数据帧对应的频谱集中起来组成一个N*M的二维频谱矩阵,其中第i(i为正整数,且i>0)个数据帧变换所得的频谱,对应矩阵的第i列。
以上,即为STFT运算的主要运算步骤。与之相对应的,请参看图2,其为本申请第一实施例提供的短时傅立叶逆变换的运算过程示意图,其主要步骤主要为:步骤S201,针对待处理的STFT频谱矩阵的每一列进行傅立叶逆变换 (inverse FFT,iFFT),获得一系列的数据帧。之后,执行步骤S202,针对每一数据帧进行加窗处理。之后执行步骤S203,对加窗后的数据帧按照步进S进行对齐,其中,相邻两个数据帧的每一个信号相距为S。之后,执行步骤S204,将对齐后的数据帧进行重叠相加,即,将同一位置的元素进行相加,获得长度为L=(M-1)S+N的信号序列,其中,M为STFT频谱矩阵的列数,即数据帧的个数,N为数据帧帧长。之后,执行步骤S205,对信号序列按元素进行归一化处理,即每个元素除以对应的归一化的序列元素,其中,归一化序列的定义为:
Figure 1
其中序列w(n),(n=0,1…N-1)为窗函数,由此可知,归一化序列实际是一系列平方后的窗函数,按照步进S排列后相加的结果。
以上,即为STFT运算以及iSTFT运算的主要运算过程,由此可知,两者之间基本是对称的,但是iSTFT运算中包含额外的归一化运算,破坏了两者的对称性;并且,在具体应用时,频繁的进行归一化运算也会提高用于语音恢复及合成的终端设备的计算量,以及大量占用终端设备的存储空间,进而带来运算结果输出缓慢、效率低下的问题。在现有技术中,针对iSTFT运算的优化方案主要有:1、在进行加窗处理时,利用窗函数w(n)直接计算归一化序列。该方案的优点是计算输入与加窗处理共用窗函数,因此,不需要额外的存储归一化序列,但是,归一化序列的计算量通常较大,在给定窗函数长度N以及步进值 S后,需要N次平方运算,即其计算复杂度为o(NL/S),同时,还需要L次除运算。2、预先计算并存储归一化序列{an},(n=0,1…L-1),在加窗处理后进行数据帧的重叠相加处理后,从预先存储的归一化序列中查询获得归一化序列,并进行归一化处理。该方案的优点是不需要进行复杂的、实时的归一化序列计算,但是,需要存储长度为L的归一化序列,同时,还需要L次归一化除运算。
现有技术针对iSTFT运算的优化方案同样存在计算量大以及占用大量存储空间的问题,为了进一步优化iSTFT运算的运算过程,以提高用于语音恢复及合成的终端设备的运行效率,本申请提供一种针对目标频谱矩阵的处理方法,包括:根据目标频谱矩阵,获取目标数据帧信息,其中,所述目标数据帧信息包括与所述目标频谱矩阵对应的多个数据帧的信息;根据所述目标数据帧信息,获取第一数据帧信息;根据所述第一数据帧信息,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据帧信息对应的第一归一化窗函数子序列;根据所述第一数据帧信息和所述第一归一化窗函数子序列,获取所述第一数据帧对应的第一信号序列;根据所述第一信号序列,获取与所述目标频谱矩阵对应的目标信号序列。
为了使本领域的技术人员更好的理解本申请方案,下面基于本申请提供的针对目标频谱矩阵的处理方法,对其实施例的具体应用场景进行详细描述。如图3所示,其为本申请第一实施例提供的一种针对目标频谱矩阵的处理方法的应用场景示意图。
在具体实施过程中,本申请实施所述针对目标频谱矩阵的处理方法,一般情况是基于传统的计算设备来实现。例如:基于用户301使用目标语音播放待播放文字的需求,用户301向其使用的计算设备302下发使用目标语音播放待播放文字的指令,之后,计算设备302获取该指令后,根据该指令,查询获取目标语音对应的目标频谱矩阵,之后,计算设备302针对所述目标频谱矩阵,获取目标数据帧信息,其中,所述目标数据帧信息包括与所述目标频谱矩阵对应的多个数据帧的信息;之后,计算设备302根据所述目标数据帧信息,获取第一数据帧信息;之后,根据所述第一数据帧信息,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据帧信息对应的第一归一化窗函数子序列;之后,根据所述第一数据帧信息和所述第一归一化窗函数子序列,获取所述第一数据帧对应的第一信号序列;之后,根据所述第一信号序列,获取与所述目标频谱矩阵对应的目标信号序列。在获取到目标语音对应的目标信号序列之后,所述计算设备302使用所述目标信号序列,针对待播放文字,进行语音合成,之后,向用户301输出使用目标语音播放的待播放文字的语音信息。
其中,所述计算设备302可以是用户301使用的移动终端设备,如手机、平板电脑等,也可以是用户常用的计算机设备。另外,在具体实施时,上述处理可以直接由所述计算设备302获取用户301的指令后,在其内部进行相应的语音合成处理并输出,也可以是由所述计算设备302获取用户301的指令后,将所述指令转发给云端计算设备,如云端服务器,并由云端计算设备进行相应的语音合成后,输出相应的语音信息给计算设备302,再由计算设备302输出相应的语音信息给用户301。此处不做限定。
如图4所示,其为本申请第一实施例提供的针对目标频谱矩阵的处理方法的流程图,以下结合图4对该实施例予以详细说明。
步骤S401,根据目标频谱矩阵,获取目标数据帧信息,其中,所述目标数据帧信息包括与所述目标频谱矩阵对应的多个数据帧的信息。
其中,所述目标频谱矩阵是待处理的、与用户301指定的目标语音对应的频谱矩阵。所述根据目标频谱矩阵,获取目标数据帧信息具体是指针对目标频谱矩阵,对目标矩阵的每一列进行傅立叶逆变换,获得多个相对应的数据帧,并获取所述多个数据帧的数据帧信息,所述数据帧信息中具体包括每一数据帧对应的数据帧标识,所述数据帧标识用于标识其对应的数据帧,当然,所述数据帧信息中还包括其对应的数据帧的数据子帧的信息,在以下步骤中,会逐一进行详细介绍。
在步骤S401之后,执行步骤S402,根据所述目标数据帧信息,获取第一数据帧信息。
即,在进行具体的iSTFT运算处理时,针对步骤S401获得的多个数据帧,分别对每一数据帧进行处理,之后,再对处理后的数据帧进行叠加处理。当然,在具体实施时,可以串行的同一时刻仅基于一个数据帧信息对对应的数据帧进行处理,也可以并行的基于多个数据帧信息对对应的数据帧同时进行处理,以提高运算结果的输出速度。
在步骤S402之后,执行步骤S403,根据所述第一数据帧信息,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据帧信息对应的第一归一化窗函数子序列。
所述数据帧信息与归一化窗函数子序列的对应关系,通过以下步骤获取,以下予以详细介绍。
所述对应关系主要是建立在针对整个数据帧与对应的归一化序列进行融合的基础上,假设在iSTFT运算中,iFFT输出的数据帧的长度N=2S,因此,可以将数据帧i分为两个长度为S的数据子帧{Xi,0(n),Xi,1(n)},(n=0,1…S-1),相对应的,其窗函数也可以分为两个长度为S的子序列{w0(n),w1(n)},(n=0, 1…S-1)。因此,第i个数据帧进行iFFT变换后其对应的输出yi(n),(n=0,1…S-1) 可以计算为:
1、数据帧(i-1)的数据子帧1:Xi-1,1(n)与窗函数子序列1:w1(n)按元素相乘;2、数据帧i的数据子帧0:Xi,0(n)与窗函数子序列0:w0(n)按元素相乘;3、将上述1、2中的结果按元素相加,之后,与第i段的归一化子序列ai(n)按元素除,获得最终结果yi(n)。
上述计算等价于:
1、窗函数子序列1:w1(n)与第i段的归一化子序列ai(n)按元素除,获得归一化窗函数子序列:w1,i(n);2、上述1中的结果w1,i(n)与数据帧(i-1)的数据子帧:Xi-1,1(n)按元素相乘;3、窗函数子序列0:w0(n)与第i段的归一化子序列ai(n) 按元素除,获得归一化窗函数子序列:w0,i(n);4、上述3中的结果w0,i(n)与数据帧i的数据子帧0:Xi,0(n)按元素相乘;5、将上述2、4中的结果按元素相加,获得最终结果yi(n)。
因此,所述数据帧信息与归一化窗函数子序列的对应关系,其本质是将归一化序列中的归一化子序列与加窗处理进行融合,形成归一化的窗函数子序列。即,将上述1、3中的结果w1,i(n)、w0,i(n)预先计算并存储,在具体计算时,从数据帧信息与归一化窗函数子序列的对应关系中查询获得,因此,可以消除iSTFT 运算中的归一化运算。
由此可知,在具体获取数据帧信息与归一化窗函数子序列的对应关系时,可以通过如下步骤获得:首先,从数据帧信息中,获取第一数据帧信息,所述第一数据帧信息包括第一数据帧标识和所述第一数据帧的数据子帧信息;其次,根据所述第一数据帧的数据子帧信息,获取第一数据子帧信息;再其次,根据所述第一数据帧标识和所述第一数据子帧信息,获取与所述第一数据子帧信息对应的第一窗函数子序列和第一归一化子序列;再其次,根据所述第一窗函数子序列和所述第一归一化子序列,获取与所述第一数据帧标识和所述第一数据子帧信息对应的第一归一化窗函数子序列;最后,根据所述第一数据帧标识、所述第一数据子帧信息和所述第一归一化窗函数子序列,建立数据帧信息与归一化窗函数子序列的对应关系。其中,所述根据所述第一窗函数子序列和所述第一归一化子序列,获取与所述第一数据帧标识和所述第一数据子帧信息对应的第一归一化窗函数子序列,包括:对所述第一窗函数子序列和所述第一归一化子序列进行除运算,获取与所述第一数据帧标识和所述第一数据子帧信息对应的第一归一化窗函数子序列。
另外,由上述描述可知,如果仅是简单、直接的针对不同位置的窗函数序列与对应的归一化序列进行除运算,则在具体存储时,需要存储M个归一化窗函数,并且包含MN个元素。然而,针对较长的归一化序列,上述处理同样会占用大量的存储空间。因此,为了解决上述问题,进一步的,还可以对上述处理进行压缩处理,即,根据归一化序列的周期性特点,对建立的数据帧信息与归一化窗函数子序列的对应关系进行压缩,获取压缩后的数据帧信息与归一化窗函数子序列的对应关系。在iSTFT运算中,所使用到的归一化序列可以表示为:
Figure BDA0002169784640000141
假设窗函数长度N=kS,则所述归一化序列可以划分为(M+ k-1)个长度为S的,互不重叠的子序列,并且,其最前方以及最后方的(k-1) 个子序列互不相同,而中间的(M-k+1)个子序列相同。因此,将归一化子序列中的重叠子序列去除后,去重后的所有归一化子序列按时间顺序记为: {a'0(n),a'1(n)...a'2k-2(n)}(n=0,1…S-1)。
相对应的,如果将窗函数也划分为k个子序列,即{w0(n),w1(n)...wk-1(n)}(n=0,1…S-1)。
则窗函数子序列{w0(n),w1(n)...wk-1(n)}可对应的与归一化子序列 {a'0(n),a'1(n)...a'2k-2(n)}进行归一化融合,即获得压缩后的、个数为k2个、长度为S 的归一化窗函数子序列:
Figure BDA0002169784640000151
(i=0,1…k-1;j=0,1…k-1),其中, i为具体的数据帧的数据帧标识,j为对应数据帧中的数据子帧的数据子帧标识。并且,由此可知,数据帧信息与归一化窗函数子序列的对应关系占用的存储空间为k2S=KN个,当K值较小时(例如,通常在进行iSTFT运算时,K为4或8),就可以以较小的存储代价,来换取节省较大的计算量,以提高计算设备302的结果输出速度,提高运算效率。
请继续参看图4,步骤S403中的步骤,所述根据所述第一数据帧信息,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据帧信息对应的第一归一化窗函数子序列,具体包括:根据所述第一数据帧信息,获取第一数据帧标识和所述第一数据帧的数据子帧信息;根据所述第一数据帧标识和所述第一数据帧的数据子帧信息,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据帧的至少一个数据子帧对应的归一化窗函数子序列。即,根据目标数据帧消息,针对目标数据帧中的各个数据帧进行处理时,对待处理的数据帧,获取其数据帧标识以及所述待处理的数据帧的数据子帧的信息,例如,所述待处理的数据帧包含几个数据子帧,以及每个数据子帧所对应的数据子帧标识等信息,之后,从数据帧信息与归一化窗函数子序列的对应关系中,获取每个数据子帧所对应的归一化窗函数子序列。
其中,所述根据所述第一数据帧信息,获取所述第一数据帧的数据子帧信息,包括:根据所述第一数据帧信息,按照预设的数据子帧的帧长数值,将所述第一数据帧划分为多个等长的数据子帧,并获取所述多个数据子帧的信息。即,与数据帧信息与归一化窗函数子序列的对应关系中,对数据帧的数据子帧的帧长数值及数据子帧个数相对应,将待处理的数据帧划分为多个等长的数据子帧,并获取每个数据子帧的信息,如数据子帧的标识等信息。
其中,所述根据所述第一数据帧标识和所述第一数据子帧标识,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据子帧信息对应的第一归一化窗函数子序列,包括:根据所述第一数据帧标识和所述第一数据子帧标识,生成索引信息;根据所述索引信息,在数据帧信息与归一化窗函数子序列的对应关系中,查找与所述第一数据子帧信息对应的第一归一化窗函数子序列。即根据待处理数据帧的数据帧标识和待处理的数据子帧的标识,索引信息,并根据所述索引信息,在数据帧信息与归一化窗函数子序列的对应关系汇总,查找与所述待处理数据子帧对应的归一化窗函数子序列。其中,所述根据所述第一数据帧标识和所述第一数据子帧标识,生成索引信息,具体为:将所述待处理的数据帧的帧标识作为高位地址索引值,并通过下述函数
Figure BDA0002169784640000161
获取低位地址索引值,其中,i为待处理的数据帧的数据帧标识,j为待处理的数据帧中的数据子帧的数据子帧标识,k为待处理的数据帧中的数据子帧的个数,M为目标数据帧中的待处理的数据帧的个数。即最终的索引信息为(i,f(i, j)),通过所述索引信息即可在数据帧信息与归一化窗函数子序列的对应关系中,获取到待处理数据帧i中的待处理数据子帧j所对应的归一化窗函数子序列。另外,需要说明的是,当k较小时,仅需要简单的枚举即可获得对应的归一化窗函数子序列。
请继续参看图4,在步骤S403之后,获取到第一数据帧信息与对应的第一归一化窗函数子序列之后,执行步骤S404,根据所述第一数据帧信息和所述第一归一化窗函数子序列,获取所述第一数据帧对应的第一信号序列。
其中,所述根据所述第一数据帧信息和所述第一归一化窗函数子序列,获取所述第一数据帧对应的第一信号序列,包括:根据所述第一数据帧的数据子帧信息和与所述第一数据帧的至少一个数据子帧对应的归一化窗函数子序列,获取所述第一数据帧的至少一个数据子帧对应的归一化信号子序列;根据所述第一数据帧的数据子帧信息和所述至少一个数据子帧对应的归一化信号子序列,获取所述第一数据帧对应的第一信号序列。
其中,所述根据所述第一数据帧的数据子帧信息和与所述第一数据帧的至少一个数据子帧对应的归一化窗函数子序列,获取所述第一数据帧的至少一个数据子帧对应的归一化信号子序列,包括:根据所述第一数据帧的数据子帧信息,获取第一数据子帧;从与所述第一数据帧的至少一个数据子帧对应的归一化窗函数子序列中,获取与所述第一数据子帧对应的第一归一化窗函数子序列;将所述第一数据子帧与所述第一归一化窗函数子序列相乘,获得所述第一数据子帧对应的第一归一化信号子序列。
其中,所述根据所述第一数据帧的数据子帧信息和所述至少一个数据子帧对应的归一化信号子序列,获取所述第一数据帧对应的第一信号序列,包括:将所述第一归一化信号子序列相加,获取所述第一数据帧对应的第一信号序列。
即,针对目标数据帧中的待处理数据帧,在根据所述待处理数据帧的信息获取到其对应的归一化窗函数子序列之后,获取所述待处理数据帧中的数据子帧的信息,之后获取其中具有对应的归一化窗函数子序列的数据子帧,并分别将所述具有对应的归一化窗函数子序列的数据子帧与其对应的归一化窗函数子序列相乘,以获取所述数据子帧对应的信号子序列,在获取到所述待处理数据帧中的所有数据子帧对应的信号子序列后,累加所述数据子帧对应的信号子序列,即可获得所述待处理数据帧所对应的信号序列。
另外,需要说明的是,通常在对数据帧进行划分时,将数据帧划分为4个或8个数据子帧,即k为4或8,因此,可以为每一个数据子帧都预先计算并存储其对应的归一化窗函数子序列,这样处理并不会占用过多的存储空间。但是,对于k值较大,即数据帧的划分个数过多的情况,如果对每一个数据子帧都预先计算并存储其对应的归一化窗函数子序列,其占用的存储空间相对会较大,因此,针对数据帧的划分个数过多的情况,可以利用归一化序列具有周期性的特点,仅预先计算并存储部分数据子帧的归一化窗函数子序列,即针对目标数据帧的首部位置即尾部位置的(k-1)个数据子帧,仍然采取常规加窗处理后进行归一化处理,而针对重叠相加区域的窗函数子序列,采取预先计算并存储其对应的归一化窗函数子序列的方法,以达到既能减少终端设备计算量又能节约存储空间的目的。
以下针对数据帧的划分个数过多的情况所采取的运算方法予以详细介绍。
在此种情况下,所述根据所述第一数据帧的数据子帧信息和与所述第一数据帧的至少一个数据子帧对应的归一化窗函数子序列,获取所述第一数据帧的至少一个数据子帧对应的归一化信号子序列,还包括:根据所述第一数据帧的数据子帧信息,获取第一数据子帧信息,所述第一数据子帧信息包括第一数据子帧标识;如果通过所述第一数据子帧标识判断所述第一数据子帧是所述第一数据帧中的无重叠数据子帧或最末数据帧的无重叠数据子帧,则对所述第一数据子帧进行加窗处理并输出,否则,获取所述第一数据子帧对应的第一归一化窗函数子序列。
其中,所述根据所述第一数据帧的数据子帧信息和所述至少一个数据子帧对应的归一化信号子序列,获取所述第一数据帧对应的第一信号序列,包括:针对所述直接输出的第一数据子帧进行加窗处理,并获取所述直接输出的第一数据子帧对应的未归一化信号子序列;针对所述具有对应的归一化窗函数子序列的第一数据子帧,将所述第一数据子帧与其对应的第一归一化窗函数子序列相乘,获取所述具有对应的归一化窗函数子序列的第一数据子帧对应的归一化信号子序列;将所述未归一化信号子序列和所述归一化信号子序列相加,获取所述第一数据帧对应的第一信号序列。
经过步骤S404,之后,针对数据帧的划分个数为通常配置,即为4或8时,以及数据帧的划分个数为非通常配置,即划分个数过多时的运算处理,分别给予了详细介绍,经过上述处理后,针对目标数据帧中的待处理数据帧,均获取到了其对应的信号序列,当然,针对数据帧的划分个数为非通常配置的情况,其对应的信号序列中还存在未进行归一化处理的信号子序列。但是无论何种情况,针对其中的具有对应的归一化窗函数子序列的数据子帧,均可将其加窗处理与归一化处理进行融合,以省略其对应的归一化处理,从而减少终端设备在进行iSTFT运算时的计算量,并节约了存储空间,进一步的,还可以提高结果的输出速度。
请继续参看图4,在步骤S404之后,执行步骤S405,根据所述第一信号序列,获取与所述目标频谱矩阵对应的目标信号序列。
针对数据帧的划分个数为通常配置,即为4或8的情况,因为在步骤S404 中已经获取了目标数据帧中的所有数据帧的数据子帧对应的归一化后的信号序列,因此,在获取所述目标频谱矩阵对应的目标信号序列时,仅需要选择一个步进值,,将所述第一信号序列重叠排列,其中,所述数据帧的帧长为所述步进值的整数倍;将重叠排列后的所述第一信号序列相加,即可获取与所述目标频谱矩阵对应的目标信号序列。即按步进数值S将步骤S404中获取的信号序列进行重叠排列并相加,即可获取与所述目标频谱矩阵对应的目标信号序列。
针对数据帧的划分个数为非通常配置,即划分个数过多时的情况,因为在步骤S404中获取的信号序列中存在一部分未完全进行归一化处理的信号序列,因此,所述根据所述第一信号序列,获取与所述目标频谱矩阵对应的目标信号序列,包括:选择一个步进值,将所述第一信号序列重叠排列,其中,所述数据帧的帧长为所述步进值的整数倍;将重叠排列后的所述第一信号序列相加,获取与所述目标频谱矩阵对应的未完全归一化信号序列;针对所述未完全归一化信号序列中的直接输出的所述数据子帧,进行局部归一化处理,并将局部归一化处理后的所述未完全归一化的信号序列,作为与所述目标频谱矩阵对应的目标信号序列。
其中,所述针对所述未完全归一化信号序列中的直接输出的所述数据子帧,进行局部归一化处理,包括:获取与所述直接输出的数据子帧对应的归一化子序列;根据所述归一化子序列,对所述直接输出的数据子帧进行归一化处理。
即,按照步进数值S,将步骤S404获取到的信号序列重叠排列,同时,针对未进行归一化处理的所述未完全归一化信号序列中的未进行归一化处理的数据子帧,进行局部归一化处理,即通过其对应的数据帧信息获取其对应的归一化子序列,之后根据所述归一化子序列,对所述未进行归一化处理的信号子序列进行归一化处理,并输出。再之后,将所有进行了归一化处理的信号序列相加,即可获取与所述目标频谱矩阵对应的目标信号序列。
至此,即获得了目标频谱矩阵所对应的目标信号序列,通过上述描述可知,本申请所提供的针对目标频谱矩阵的处理方法,包括:根据目标频谱矩阵,获取目标数据帧信息,其中,所述目标数据帧信息包括与所述目标频谱矩阵对应的多个数据帧的信息;根据所述目标数据帧信息,获取第一数据帧信息;根据所述第一数据帧信息,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据帧信息对应的第一归一化窗函数子序列;根据所述第一数据帧信息和所述第一归一化窗函数子序列,获取所述第一数据帧对应的第一信号序列;根据所述第一信号序列,获取与所述目标频谱矩阵对应的目标信号序列。通过将加窗处理与归一化处理相融合,并利用归一化序列的周期性特点,预先计算并存储数据帧信息与归一化窗函数子序列的对应关系,在终端设备进行 iSTFT运算时,可以完全省略或部分省略相应的归一化处理,大大减少了针对目标频谱矩阵进行处理时的计算量,同时,相较于现有技术还节省了存储空间,进一步的,提高了终端设备进行短时傅立叶逆变换运算的运算速度及运算效率。
在以上描述中,提供了一种针对目标频谱矩阵的处理方法,与上述一种针对目标频谱矩阵的处理方法相对应,本申请还提供一种针对目标数据帧的处理方法,请参看图5所示,其为本申请第二实施例提供的一种针对目标数据帧的处理方法的流程图,由于其详细步骤在上述第一实施例中已经详细描述,所以此处描述的比较简单,相关之处参见本申请第一实施例提供的一种针对目标频谱矩阵的处理方法中的部分说明即可,下述描述的处理过程仅是示意性的。
如图5所示,其为本申请第二实施例提供的一种针对目标数据帧的处理方法的流程图,以下结合图5予以说明。
步骤S501,获取目标数据帧信息,所述目标数据帧信息包括目标数据帧标识和所述目标数据帧的数据子帧信息。
其中,所述目标数据帧的数据子帧信息的获取方法,包括:根据所述目标数据帧信息,按照预设的数据子帧的帧长数值,将所述目标数据帧划分为多个等长的数据子帧,并获取所述多个数据子帧的信息。
步骤S502,根据所述目标数据帧标识和所述目标数据帧的数据子帧信息,获取与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列。
步骤S503,根据所述目标数据帧的数据子帧信息和与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列,获取所述目标数据帧的至少一个数据子帧对应的归一化信号子序列。
其中,所述根据所述目标数据帧的数据子帧信息和与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列,获取所述目标数据帧的至少一个数据子帧对应的归一化信号子序列,包括:根据所述目标数据帧的数据子帧信息,获取第一数据子帧信息,所述第一数据子帧信息包括所述第一数据子帧的第一数据子帧标识;
根据所述目标数据帧标识和所述第一数据子帧标识,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据子帧信息对应的第一归一化窗函数子序列。
其中,所述根据所述目标数据帧标识和所述第一数据子帧标识,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据子帧信息对应的第一归一化窗函数子序列,包括:
根据所述目标数据帧标识和所述第一数据子帧标识,生成索引信息;
根据所述索引信息,在数据帧信息与归一化窗函数子序列的对应关系中,查找与所述第一数据子帧信息对应的第一归一化窗函数子序列。
其中,所述根据所述目标数据帧的数据子帧信息和与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列,获取所述目标数据帧的至少一个数据子帧对应的归一化信号子序列,还包括:根据所述目标数据帧的数据子帧信息,获取第一数据子帧信息,所述第一数据子帧信息包括第一数据子帧标识;如果通过所述第一数据子帧标识判断所述第一数据子帧是所述目标数据帧中的无重叠数据子帧或最末数据帧的无重叠数据子帧,则直接输出所述第一数据子帧,否则,获取所述第一数据子帧对应的第一归一化窗函数子序列。
步骤S504,根据所述至少一个数据子帧对应的归一化信号子序列,获取与所述目标数据帧对应的信号序列。
其中,所述根据所述至少一个数据子帧对应的归一化信号子序列,获取与所述目标数据帧对应的信号序列,包括:将所述第一归一化信号子序列相加,获取所述目标数据帧对应的信号序列。
所述根据所述至少一个数据子帧对应的归一化信号子序列,获取与所述目标数据帧对应的信号序列,还包括:针对所述直接输出的第一数据子帧进行加窗处理,并获取所述直接输出的第一数据子帧对应的未归一化信号子序列;针对所述具有对应的归一化窗函数子序列的第一数据子帧,将所述第一数据子帧与其对应的第一归一化窗函数子序列相乘,获取所述具有对应的归一化窗函数子序列的第一数据子帧对应的归一化信号子序列;将所述未归一化信号子序列和所述归一化信号子序列相加,获取所述目标数据帧对应的信号序列。
需要说明的是,本申请所述针对目标数据帧的处理方法可以应用于语音合成领域。在应用于语音合成时,所述目标频谱矩阵为原始语音数据对应的频谱矩阵,所述目标数据帧信息为所述原始语音数据对应的目标数据帧信息,所述目标信号序列为所述原始语音数据对应的信号序列;本申请所述针对目标数据帧方法,还包括:获取待合成文字信息,其中,所述待合成文字信息为待使用所述原始语音数据进行语音合成的文字的信息;之后,使用获取到的所述原始语音数据对应的所述目标信号序列,合成所述待合成文字信息对应的目标语音信息。
综上所述,本申请提供的一种针对目标数据帧的处理方法,包括:获取目标数据帧信息,所述目标数据帧信息包括目标数据帧标识和所述目标数据帧的数据子帧信息;根据所述目标数据帧标识和所述目标数据帧的数据子帧信息,获取与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列;根据所述目标数据帧的数据子帧信息和与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列,获取所述目标数据帧的至少一个数据子帧对应的归一化信号子序列;根据所述至少一个数据子帧对应的归一化信号子序列,获取与所述目标数据帧对应的信号序列。通过将加窗处理与归一化处理相融合,并利用归一化序列的周期性特点,预先计算并存储数据帧信息与归一化窗函数子序列的对应关系,在获取目标数据帧的信号序列时,可以完全省略或部分省略相应的归一化处理,大大减少了针对目标数据帧进行处理时的计算量,同时,相较于现有技术还节省了存储空间,进一步的,提高了终端设备针对iSTFT运算的运算速度及运算效率。
与上述一种针对目标频谱矩阵的处理方法相对应,本申请还提供一种针对目标频谱矩阵的处理装置,请参看图6,其为本申请第三实施例提供的一种针对目标频谱矩阵的处理装置的实施例的示意图,由于装置实施例基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可,下述描述的装置实施例仅仅是示意性的。本申请第三实施例提供的一种针对目标频谱矩阵的处理装置包括如下部分:
信息获取单元601,用于根据目标频谱矩阵,获取目标数据帧信息,其中,所述目标数据帧信息包括与所述目标频谱矩阵对应的多个数据帧的信息。
数据帧信息获取单元602,用于根据所述目标数据帧信息,获取第一数据帧信息。
归一化窗函数子序列获取单元603,用于根据所述第一数据帧信息,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据帧信息对应的第一归一化窗函数子序列。
信号序列获取单元604,用于根据所述第一数据帧信息和所述第一归一化窗函数子序列,获取所述第一数据帧对应的第一信号序列。
目标信号序列获取单元605,用于根据所述第一信号序列,获取与所述目标频谱矩阵对应的目标信号序列。
与上述一种针对目标数据帧的处理方法相对应,本申请还提供一种针对目标数据帧的处理装置,请参看图7,其为本申请第四实施例提供的一种针对目标数据帧的处理装置的实施例的示意图,由于装置实施例基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可,下述描述的装置实施例仅仅是示意性的。本申请第四实施例提供的一种针对目标数据帧的处理装置包括如下部分:
信息获取单元701,用于获取目标数据帧信息,所述目标数据帧信息包括目标数据帧标识和所述目标数据帧的数据子帧信息。
归一化窗函数子序列获取单元702,用于根据所述目标数据帧标识和所述目标数据帧的数据子帧信息,获取与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列。
信号子序列获取单元703,用于根据所述目标数据帧的数据子帧信息和与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列,获取所述目标数据帧的至少一个数据子帧对应的归一化信号子序列。
信号序列获取单元704,用于根据所述至少一个数据子帧对应的归一化信号子序列,获取与所述目标数据帧对应的信号序列。
与上述一种针对目标频谱矩阵的处理方法相对应,本申请还提供一种用于目标频谱矩阵处理的电子设备,请参看图8,其为本申请第五实施例提供的一种用于目标频谱矩阵处理的电子设备的实施例的示意图,由于电子设备实施例基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可,下述描述的电子设备实施例仅仅是示意性的。本申请第五实施例提供的一种用于目标频谱矩阵处理的电子设备包括如下部分:
存储器801以及处理器802,存储器801用于存储针对目标频谱矩阵的处理方法的程序803,该设备通电并通过所述处理器802运行该目标频谱矩阵的处理方法的程序803后:根据目标频谱矩阵,获取目标数据帧信息,其中,所述目标数据帧信息包括与所述目标频谱矩阵对应的多个数据帧的信息;根据所述目标数据帧信息,获取第一数据帧信息;根据所述第一数据帧信息,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据帧信息对应的第一归一化窗函数子序列;根据所述第一数据帧信息和所述第一归一化窗函数子序列,获取所述第一数据帧对应的第一信号序列;根据所述第一信号序列,获取与所述目标频谱矩阵对应的目标信号序列。存储器801与处理器802之间基于二者之间建立的总线805进行数据传输,通信接口804为电子设备与外部实现连接的数据交换接口。
与上述一种针对目标数据帧的处理方法相对应,本申请还提供一种用于目标数据帧处理的电子设备,请参看图9,其为本申请第六实施例提供的一种用于目标数据帧处理的电子设备的实施例的示意图,由于电子设备实施例基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可,下述描述的电子设备实施例仅仅是示意性的。本申请第六实施例提供的一种用于目标数据帧处理的电子设备包括如下部分:
存储器901,以及处理器902;存储器901用于存储针对目标数据帧的处理方法的程序903,该设备通电并通过所述处理器902运行该目标数据帧的处理方法的程序903后:获取目标数据帧信息,所述目标数据帧信息包括目标数据帧标识和所述目标数据帧的数据子帧信息;根据所述目标数据帧标识和所述目标数据帧的数据子帧信息,获取与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列;根据所述目标数据帧的数据子帧信息和与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列,获取所述目标数据帧的至少一个数据子帧对应的归一化信号子序列;根据所述至少一个数据子帧对应的归一化信号子序列,获取与所述目标数据帧对应的信号序列。存储器901与处理器902之间基于二者之间建立的总线905进行数据传输,通信接口904为电子设备与外部实现连接的数据交换接口。
与上述一种针对目标频谱矩阵的处理方法相对应,本申请还提供一种用于目标频谱矩阵处理的存储设备,由于存储设备实施例基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可,下述描述的存储设备实施例仅仅是示意性的。
本申请第七实施例提供的一种用于目标频谱矩阵处理的存储设备存储有针对目标频谱矩阵的处理方法的程序,该程序被处理器运行,执行下述步骤:根据目标频谱矩阵,获取目标数据帧信息,其中,所述目标数据帧信息包括与所述目标频谱矩阵对应的多个数据帧的信息;根据所述目标数据帧信息,获取第一数据帧信息;根据所述第一数据帧信息,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据帧信息对应的第一归一化窗函数子序列;根据所述第一数据帧信息和所述第一归一化窗函数子序列,获取所述第一数据帧对应的第一信号序列;根据所述第一信号序列,获取与所述目标频谱矩阵对应的目标信号序列。
与上述一种针对目标数据帧的处理方法相对应,本申请还提供一种用于目标数据帧处理的存储设备,由于存储设备实施例基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可,下述描述的存储设备实施例仅仅是示意性的。
本申请第八实施例提供的一种用于目标数据帧处理的存储设备存储有针对目标频谱矩阵的处理方法的程序,该程序被处理器运行,执行下述步骤:获取目标数据帧信息,所述目标数据帧信息包括目标数据帧标识和所述目标数据帧的数据子帧信息;根据所述目标数据帧标识和所述目标数据帧的数据子帧信息,获取与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列;根据所述目标数据帧的数据子帧信息和与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列,获取所述目标数据帧的至少一个数据子帧对应的归一化信号子序列;根据所述至少一个数据子帧对应的归一化信号子序列,获取与所述目标数据帧对应的信号序列。
与上述一种针对目标频谱矩阵的装置实施例相对应,本申请还提供一种用于目标频谱矩阵处理的现场可编程门阵列,由于现场可编程门阵列实施例基本相似于装置实施例,所以描述的比较简单,相关之处参见装置实施例的部分说明即可,下述描述的现场可编程门阵列实施例仅仅是示意性的。
本申请第九实施例提供的一种用于目标频谱矩阵处理的现场可编程门阵列包括上述针对目标频谱矩阵的处理装置。
与上述一种针对目标数据帧的装置实施例相对应,本申请还提供一种用于目标数据帧处理的现场可编程门阵列,由于现场可编程门阵列实施例基本相似于装置实施例,所以描述的比较简单,相关之处参见装置实施例的部分说明即可,下述描述的现场可编程门阵列实施例仅仅是示意性的。
本申请第十实施例提供的一种用于目标数据帧处理的现场可编程门阵列包括上述针对目标数据帧的处理装置。
本申请虽然以较佳实施例公开如上,但其并不是用来限定本申请,任何本领域技术人员在不脱离本申请的精神和范围内,都可以做出可能的变动和修改,因此本申请的保护范围应当以本申请权利要求所界定的范围为准。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/ 输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器 (RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存 (PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器 (CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

Claims (26)

1.一种针对目标频谱矩阵的处理方法,其特征在于,包括:
根据目标频谱矩阵,获取目标数据帧信息,其中,所述目标数据帧信息包括与所述目标频谱矩阵对应的多个数据帧的信息;
根据所述目标数据帧信息,获取第一数据帧信息;
根据所述第一数据帧信息,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据帧信息对应的第一归一化窗函数子序列;
根据所述第一数据帧信息和所述第一归一化窗函数子序列,获取所述第一数据帧对应的第一信号序列;
根据所述第一信号序列,获取与所述目标频谱矩阵对应的目标信号序列。
2.根据权利要求1所述的针对目标频谱矩阵的处理方法,其特征在于,所述数据帧信息与归一化窗函数子序列的对应关系,通过以下步骤获取:
从数据帧信息中,获取第一数据帧信息,所述第一数据帧信息包括第一数据帧标识和所述第一数据帧的数据子帧信息;
根据所述第一数据帧的数据子帧信息,获取第一数据子帧信息;
根据所述第一数据帧标识和所述第一数据子帧信息,获取与所述第一数据子帧信息对应的第一窗函数子序列和第一归一化子序列;
根据所述第一窗函数子序列和所述第一归一化子序列,获取与所述第一数据帧标识和所述第一数据子帧信息对应的第一归一化窗函数子序列;
根据所述第一数据帧标识、所述第一数据子帧信息和所述第一归一化窗函数子序列,建立数据帧信息与归一化窗函数子序列的对应关系。
3.根据权利要求2所述的针对目标频谱矩阵的处理方法,其特征在于,所述根据所述第一窗函数子序列和所述第一归一化子序列,获取与所述第一数据帧标识和所述第一数据子帧信息对应的第一归一化窗函数子序列,包括:
对所述第一窗函数子序列和所述第一归一化子序列进行除运算,获取与所述第一数据帧标识和所述第一数据子帧信息对应的第一归一化窗函数子序列。
4.根据权利要求2所述的针对目标频谱矩阵的处理方法,其特征在于,所述根据所述第一数据帧标识、所述第一数据子帧信息和所述第一归一化窗函数子序列,建立数据帧信息与归一化窗函数子序列的对应关系,还包括:
根据归一化序列的周期性特点,对建立的数据帧信息与归一化窗函数子序列的对应关系进行压缩,获取压缩后的数据帧信息与归一化窗函数子序列的对应关系。
5.根据权利要求1所述的针对目标频谱矩阵的处理方法,其特征在于,所述根据所述第一数据帧信息,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据帧信息对应的第一归一化窗函数子序列,包括:
根据所述第一数据帧信息,获取第一数据帧标识和所述第一数据帧的数据子帧信息;
根据所述第一数据帧标识和所述第一数据帧的数据子帧信息,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据帧的至少一个数据子帧对应的归一化窗函数子序列。
6.根据权利要求5所述的针对目标频谱矩阵的处理方法,其特征在于,所述根据所述第一数据帧信息,获取所述第一数据帧的数据子帧信息,包括:
根据所述第一数据帧信息,按照预设的数据子帧的帧长数值,将所述第一数据帧划分为多个等长的数据子帧,并获取所述多个数据子帧的信息。
7.根据权利要求6所述的针对目标频谱矩阵的处理方法,其特征在于,所述根据所述第一数据帧标识和所述第一数据帧的数据子帧信息,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据帧的至少一个数据子帧对应的归一化窗函数子序列,包括:
根据所述第一数据帧的数据子帧信息,获取第一数据子帧信息,所述第一数据子帧信息包括所述第一数据子帧的第一数据子帧标识;
根据所述第一数据帧标识和所述第一数据子帧标识,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据子帧信息对应的第一归一化窗函数子序列。
8.根据权利要求7所述的针对目标频谱矩阵的处理方法,其特征在于,所述根据所述第一数据帧标识和所述第一数据子帧标识,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据子帧信息对应的第一归一化窗函数子序列,包括:
根据所述第一数据帧标识和所述第一数据子帧标识,生成索引信息;
根据所述索引信息,在数据帧信息与归一化窗函数子序列的对应关系中,查找与所述第一数据子帧信息对应的第一归一化窗函数子序列。
9.根据权利要求5所述的针对目标频谱矩阵的处理方法,其特征在于,所述根据所述第一数据帧信息和所述第一归一化窗函数子序列,获取所述第一数据帧对应的第一信号序列,包括:
根据所述第一数据帧的数据子帧信息和与所述第一数据帧的至少一个数据子帧对应的归一化窗函数子序列,获取所述第一数据帧的至少一个数据子帧对应的归一化信号子序列;
根据所述第一数据帧的数据子帧信息和所述至少一个数据子帧对应的归一化信号子序列,获取所述第一数据帧对应的第一信号序列。
10.根据权利要求9所述的针对目标频谱矩阵的处理方法,其特征在于,所述根据所述第一数据帧的数据子帧信息和与所述第一数据帧的至少一个数据子帧对应的归一化窗函数子序列,获取所述第一数据帧的至少一个数据子帧对应的归一化信号子序列,包括:
根据所述第一数据帧的数据子帧信息,获取第一数据子帧;
从与所述第一数据帧的至少一个数据子帧对应的归一化窗函数子序列中,获取与所述第一数据子帧对应的第一归一化窗函数子序列;
将所述第一数据子帧与所述第一归一化窗函数子序列相乘,获得所述第一数据子帧对应的第一归一化信号子序列。
11.根据权利要求10所述的针对目标频谱矩阵的处理方法,其特征在于,所述根据所述第一数据帧的数据子帧信息和所述至少一个数据子帧对应的归一化信号子序列,获取所述第一数据帧对应的第一信号序列,包括:
将所述第一归一化信号子序列相加,获取所述第一数据帧对应的第一信号序列。
12.根据权利要求11所述的针对目标频谱矩阵的处理方法,其特征在于,所述根据所述第一信号序列,获取与所述目标频谱矩阵对应的目标信号序列,包括:
将预设的数据子帧的帧长数值作为步进数值,将所述第一信号序列重叠排列;
将重叠排列后的所述第一信号序列相加,获取与所述目标频谱矩阵对应的目标信号序列。
13.根据权利要求9所述的针对目标频谱矩阵的处理方法,其特征在于,所述根据所述第一数据帧的数据子帧信息和与所述第一数据帧的至少一个数据子帧对应的归一化窗函数子序列,获取所述第一数据帧的至少一个数据子帧对应的归一化信号子序列,还包括:
根据所述第一数据帧的数据子帧信息,获取第一数据子帧信息,所述第一数据子帧信息包括第一数据子帧标识;
如果通过所述第一数据子帧标识判断所述第一数据子帧是所述第一数据帧中的无重叠数据子帧或最末数据帧的无重叠数据子帧,则直接输出相应数据子帧,否则,获取所述第一数据子帧对应的第一归一化窗函数子序列。
14.根据权利要求13所述的针对目标频谱矩阵的处理方法,其特征在于,所述根据所述第一数据帧的数据子帧信息和所述至少一个数据子帧对应的归一化信号子序列,获取所述第一数据帧对应的第一信号序列,包括:
针对所述直接输出的第一数据子帧进行加窗处理,并获取所述直接输出的第一数据子帧对应的未归一化信号子序列;
针对所述具有对应的归一化窗函数子序列的第一数据子帧,将所述第一数据子帧与其对应的第一归一化窗函数子序列相乘,获取所述具有对应的归一化窗函数子序列的第一数据子帧对应的归一化信号子序列;
将所述未归一化信号子序列和所述归一化信号子序列相加,获取所述第一数据帧对应的第一信号序列。
15.根据权利要求14所述的针对目标频谱矩阵的处理方法,其特征在于,所述根据所述第一信号序列,获取与所述目标频谱矩阵对应的目标信号序列,包括:
选择一个步进值,,将所述第一信号序列重叠排列,其中,所述数据帧的帧长为所述步进值的整数倍;
将重叠排列后的所述第一信号序列相加,获取与所述目标频谱矩阵对应的未完全归一化信号序列;
针对所述未完全归一化信号序列中的直接输出的所述数据子帧,进行局部归一化处理,并将局部归一化处理后的所述未完全归一化的信号序列,作为与所述目标频谱矩阵对应的目标信号序列。
16.根据权利要求15所述的针对目标频谱矩阵的处理方法,其特征在于,所述针对所述未完全归一化信号序列中的直接输出的所述数据子帧,进行局部归一化处理,包括:
获取与所述直接输出的数据子帧对应的归一化子序列;
根据所述归一化子序列,对所述直接输出的数据子帧进行归一化处理。
17.根据权利要求1所述的针对目标频谱矩阵的处理方法,其特征在于,所述目标频谱矩阵为原始语音数据对应的频谱矩阵,所述目标数据帧信息为所述原始语音数据对应的目标数据帧信息,所述目标信号序列为所述原始语音数据对应的信号序列;
所述方法,还包括:
获取待合成文字信息,其中,所述待合成文字信息为待使用所述原始语音数据进行语音合成的文字的信息;
使用获取到的所述原始语音数据对应的所述目标信号序列,合成所述待合成文字信息对应的目标语音信息。
18.一种针对目标数据帧的处理方法,其特征在于,包括:
获取目标数据帧信息,所述目标数据帧信息包括目标数据帧标识和所述目标数据帧的数据子帧信息;
根据所述目标数据帧标识和所述目标数据帧的数据子帧信息,获取与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列;
根据所述目标数据帧的数据子帧信息和与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列,获取所述目标数据帧的至少一个数据子帧对应的归一化信号子序列;
根据所述至少一个数据子帧对应的归一化信号子序列,获取与所述目标数据帧对应的信号序列。
19.一种针对目标频谱矩阵的处理装置,其特征在于,包括:
信息获取单元,用于根据目标频谱矩阵,获取目标数据帧信息,其中,所述目标数据帧信息包括与所述目标频谱矩阵对应的多个数据帧的信息;
数据帧信息获取单元,用于根据所述目标数据帧信息,获取第一数据帧信息;
归一化窗函数子序列获取单元,用于根据所述第一数据帧信息,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据帧信息对应的第一归一化窗函数子序列;
信号序列获取单元,用于根据所述第一数据帧信息和所述第一归一化窗函数子序列,获取所述第一数据帧对应的第一信号序列;
目标信号序列获取单元,用于根据所述第一信号序列,获取与所述目标频谱矩阵对应的目标信号序列。
20.一种针对目标数据帧的处理装置,其特征在于,包括:
信息获取单元,用于获取目标数据帧信息,所述目标数据帧信息包括目标数据帧标识和所述目标数据帧的数据子帧信息;
归一化窗函数子序列获取单元,用于根据所述目标数据帧标识和所述目标数据帧的数据子帧信息,获取与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列;
信号子序列获取单元,用于根据所述目标数据帧的数据子帧信息和与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列,获取所述目标数据帧的至少一个数据子帧对应的归一化信号子序列;
信号序列获取单元,用于根据所述至少一个数据子帧对应的归一化信号子序列,获取与所述目标数据帧对应的信号序列。
21.一种用于目标频谱矩阵处理的电子设备,其特征在于,包括:
存储器,以及处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
根据目标频谱矩阵,获取目标数据帧信息,其中,所述目标数据帧信息包括与所述目标频谱矩阵对应的多个数据帧的信息;
根据所述目标数据帧信息,获取第一数据帧信息;
根据所述第一数据帧信息,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据帧信息对应的第一归一化窗函数子序列;
根据所述第一数据帧信息和所述第一归一化窗函数子序列,获取所述第一数据帧对应的第一信号序列;
根据所述第一信号序列,获取与所述目标频谱矩阵对应的目标信号序列。
22.一种用于目标数据帧处理的电子设备,其特征在于,包括:
存储器,以及处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
获取目标数据帧信息,所述目标数据帧信息包括目标数据帧标识和所述目标数据帧的数据子帧信息;
根据所述目标数据帧标识和所述目标数据帧的数据子帧信息,获取与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列;
根据所述目标数据帧的数据子帧信息和与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列,获取所述目标数据帧的至少一个数据子帧对应的归一化信号子序列;
根据所述至少一个数据子帧对应的归一化信号子序列,获取与所述目标数据帧对应的信号序列。
23.一种用于目标频谱矩阵处理的存储设备,其特征在于,存储有针对目标频谱矩阵的处理方法的程序,该程序被处理器运行,执行下述步骤:
根据目标频谱矩阵,获取目标数据帧信息,其中,所述目标数据帧信息包括与所述目标频谱矩阵对应的多个数据帧的信息;
根据所述目标数据帧信息,获取第一数据帧信息;
根据所述第一数据帧信息,从数据帧信息与归一化窗函数子序列的对应关系中,获取与所述第一数据帧信息对应的第一归一化窗函数子序列;
根据所述第一数据帧信息和所述第一归一化窗函数子序列,获取所述第一数据帧对应的第一信号序列;
根据所述第一信号序列,获取与所述目标频谱矩阵对应的目标信号序列。
24.一种用于目标数据帧处理的存储设备,其特征在于,存储有针对目标频谱矩阵的处理方法的程序,该程序被处理器运行,执行下述步骤:
获取目标数据帧信息,所述目标数据帧信息包括目标数据帧标识和所述目标数据帧的数据子帧信息;
根据所述目标数据帧标识和所述目标数据帧的数据子帧信息,获取与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列;
根据所述目标数据帧的数据子帧信息和与所述目标数据帧的至少一个数据子帧对应的归一化窗函数子序列,获取所述目标数据帧的至少一个数据子帧对应的归一化信号子序列;
根据所述至少一个数据子帧对应的归一化信号子序列,获取与所述目标数据帧对应的信号序列。
25.一种用于目标频谱矩阵处理的现场可编程门阵列,其特征在于,包括权利要求19所述的针对目标频谱矩阵的处理装置。
26.一种用于目标数据帧处理的现场可编程门阵列,其特征在于,包括权利要求20所述的针对目标频谱矩阵的处理装置。
CN201910759361.7A 2019-08-16 2019-08-16 一种针对目标频谱矩阵的处理方法及装置 Pending CN112447166A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910759361.7A CN112447166A (zh) 2019-08-16 2019-08-16 一种针对目标频谱矩阵的处理方法及装置
PCT/CN2020/108599 WO2021031942A1 (zh) 2019-08-16 2020-08-12 一种针对目标频谱矩阵的处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910759361.7A CN112447166A (zh) 2019-08-16 2019-08-16 一种针对目标频谱矩阵的处理方法及装置

Publications (1)

Publication Number Publication Date
CN112447166A true CN112447166A (zh) 2021-03-05

Family

ID=74659857

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910759361.7A Pending CN112447166A (zh) 2019-08-16 2019-08-16 一种针对目标频谱矩阵的处理方法及装置

Country Status (2)

Country Link
CN (1) CN112447166A (zh)
WO (1) WO2021031942A1 (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050182620A1 (en) * 2003-09-30 2005-08-18 Stmicroelectronics Asia Pacific Pte Ltd Voice activity detector
CN101030369A (zh) * 2007-03-30 2007-09-05 清华大学 基于子词隐含马尔可夫模型的嵌入式语音识别方法
JP2008009104A (ja) * 2006-06-29 2008-01-17 Dainippon Printing Co Ltd 音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置
WO2013078974A1 (zh) * 2011-11-29 2013-06-06 中兴通讯股份有限公司 非激活音信号参数估计方法及舒适噪声产生方法及系统
US20130253920A1 (en) * 2012-03-22 2013-09-26 Qiguang Lin Method and apparatus for robust speaker and speech recognition
CN104361894A (zh) * 2014-11-27 2015-02-18 湖南省计量检测研究院 一种基于输出的客观语音质量评估的方法
CN105074818A (zh) * 2013-02-21 2015-11-18 杜比国际公司 用于参数化多声道编码的方法
CN105825871A (zh) * 2016-03-16 2016-08-03 大连理工大学 一种无前导静音段语音的端点检测方法
CN108288465A (zh) * 2018-01-29 2018-07-17 中译语通科技股份有限公司 智能语音切轴的方法、信息数据处理终端、计算机程序
CN108831500A (zh) * 2018-05-29 2018-11-16 平安科技(深圳)有限公司 语音增强方法、装置、计算机设备及存储介质
KR20190019713A (ko) * 2017-08-18 2019-02-27 인하대학교 산학협력단 무인 항공기 음향 식별을 위한 서포트 벡터 머신에 기반한 음향 특징 추출 및 분류 방법 그리고 시스템
CN109584898A (zh) * 2018-12-29 2019-04-05 上海瑾盛通信科技有限公司 一种语音信号的处理方法、装置、存储介质及电子设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005202335A (ja) * 2004-01-19 2005-07-28 Takayuki Arai 音声処理方法と装置及びプログラム
JP4649888B2 (ja) * 2004-06-24 2011-03-16 ヤマハ株式会社 音声効果付与装置及び音声効果付与プログラム
BRPI0716315A2 (pt) * 2006-10-25 2017-05-30 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V aparelhagem e método para gerar valores de sub-banda de áudio e aparelhagem e método para gerar amostras de áudio de domínio de tempo
JP2010122617A (ja) * 2008-11-21 2010-06-03 Yamaha Corp ノイズゲート、及び収音装置
JP5799707B2 (ja) * 2011-09-26 2015-10-28 ソニー株式会社 オーディオ符号化装置およびオーディオ符号化方法、オーディオ復号装置およびオーディオ復号方法、並びにプログラム
JP5898534B2 (ja) * 2012-03-12 2016-04-06 クラリオン株式会社 音響信号処理装置および音響信号処理方法
JP6078358B2 (ja) * 2013-01-29 2017-02-08 パイオニア株式会社 ノイズ低減装置、放送受信装置及びノイズ低減方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050182620A1 (en) * 2003-09-30 2005-08-18 Stmicroelectronics Asia Pacific Pte Ltd Voice activity detector
JP2008009104A (ja) * 2006-06-29 2008-01-17 Dainippon Printing Co Ltd 音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置
CN101030369A (zh) * 2007-03-30 2007-09-05 清华大学 基于子词隐含马尔可夫模型的嵌入式语音识别方法
WO2013078974A1 (zh) * 2011-11-29 2013-06-06 中兴通讯股份有限公司 非激活音信号参数估计方法及舒适噪声产生方法及系统
US20130253920A1 (en) * 2012-03-22 2013-09-26 Qiguang Lin Method and apparatus for robust speaker and speech recognition
CN105074818A (zh) * 2013-02-21 2015-11-18 杜比国际公司 用于参数化多声道编码的方法
CN104361894A (zh) * 2014-11-27 2015-02-18 湖南省计量检测研究院 一种基于输出的客观语音质量评估的方法
CN105825871A (zh) * 2016-03-16 2016-08-03 大连理工大学 一种无前导静音段语音的端点检测方法
KR20190019713A (ko) * 2017-08-18 2019-02-27 인하대학교 산학협력단 무인 항공기 음향 식별을 위한 서포트 벡터 머신에 기반한 음향 특징 추출 및 분류 방법 그리고 시스템
CN108288465A (zh) * 2018-01-29 2018-07-17 中译语通科技股份有限公司 智能语音切轴的方法、信息数据处理终端、计算机程序
CN108831500A (zh) * 2018-05-29 2018-11-16 平安科技(深圳)有限公司 语音增强方法、装置、计算机设备及存储介质
CN109584898A (zh) * 2018-12-29 2019-04-05 上海瑾盛通信科技有限公司 一种语音信号的处理方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
WO2021031942A1 (zh) 2021-02-25

Similar Documents

Publication Publication Date Title
US11294675B2 (en) Writing prefetched data into intra-core caches of cores identified by prefetching instructions
US8554818B2 (en) Signal processing method and data processing method and apparatus
WO2020062680A1 (zh) 基于双音节混搭的波形拼接方法、装置、设备及存储介质
CN109597647B (zh) 数据处理方法及设备
EP3770770A1 (en) Index generation program, index generation device and index generation method, search program
CN111324665B (zh) 一种日志回放方法及装置
CN109885628B (zh) 一种张量转置方法、装置、计算机及存储介质
JP4160564B2 (ja) 処理速度の向上した高速フーリエ変換装置およびその処理方法
CN111435383A (zh) 数据处理方法、数据处理芯片及电子设备
CN113409827B (zh) 基于局部卷积块注意力网络的语音端点检测方法及系统
US20160092492A1 (en) Sharing initial dictionaries and huffman trees between multiple compressed blocks in lz-based compression algorithms
CN111625600B (zh) 数据存储的处理方法、系统、计算机设备及存储介质
CN112447166A (zh) 一种针对目标频谱矩阵的处理方法及装置
CN109545174A (zh) 一种音频处理方法、装置及设备
US20220156081A1 (en) Processing-in-memory and method of outputting instruction using processing-in-memory
JP4159761B2 (ja) Fftのためのインプレイスメモリ管理
CN110428453B (zh) 数据处理方法、装置、数据处理设备及存储介质
JP2002032357A (ja) Fftのためのインプレースメモリ管理
CN110866141A (zh) 音频文件的处理方法、介质、装置和计算设备
CN112215330B (zh) 基于神经网络的卷积方法及装置
US20220147524A1 (en) Method for automatically generating news events of a certain topic and electronic device applying the same
JP2024023532A (ja) 電子機器、メモリアクセス効率の決定方法及び記憶媒体
CN107391029B (zh) 一种文件存储、读取方法及其对应的系统
CN116955490A (zh) 一种数据分区方法、装置、设备和存储介质
CN113672575A (zh) 数据压缩方法及装置、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination