CN106228973A - 稳定音色的音乐语音变调方法 - Google Patents

稳定音色的音乐语音变调方法 Download PDF

Info

Publication number
CN106228973A
CN106228973A CN201610573399.1A CN201610573399A CN106228973A CN 106228973 A CN106228973 A CN 106228973A CN 201610573399 A CN201610573399 A CN 201610573399A CN 106228973 A CN106228973 A CN 106228973A
Authority
CN
China
Prior art keywords
frame
voice signal
tone
music voice
tone color
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610573399.1A
Other languages
English (en)
Inventor
张栋
彭建云
余春艳
张为凡
刘宇欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN201610573399.1A priority Critical patent/CN106228973A/zh
Publication of CN106228973A publication Critical patent/CN106228973A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/125Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/15Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being formant information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/45Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser
    • G10L13/0335Pitch control

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Auxiliary Devices For Music (AREA)

Abstract

本发明涉及一种稳定音色的音乐语音变调方法,利用语音信号可分为声门激励分量和声道冲激响应分量,通过语音信号的倒谱序列导出频谱包络,然后利用频谱包络分离出语音信号的激励分量,再将语音信号的激励分量通过变调算法处理改变其音高,最后将频谱包络和音高改变后的激励分量重新合成,得到音高改变但音色稳定的音乐语音信号。本发明所提出的一种稳定音色的音乐语音变调方法,该方法简单,实现灵活,具有较强的实用性。

Description

稳定音色的音乐语音变调方法
技术领域
本发明涉及语音合成领域,特别是一种稳定音色的音乐语音变调方法。
背景技术
近年来,随着音乐娱乐的普及,对于音乐语音的声音效果处理成为研究与应用的热点,受到学术界和业界的广泛关注。众所周知,传统基于重采样的变调方法可以改变音调的高低,其实质是语音信号在频率轴上频谱整体的移动,在改变音高的同时也会使频谱包络随之改变,从而导致变调后的语音信号失去原有的声道响应信息,如男声、女声和小孩之间音调的转变。为了可以达到保持音色相对不变而音高变化,以实现音高调整或和声等效果。因此,如何在音乐语音变调处理中只改变音高而保持音色不变,是变调处理中的一个重要问题。
发明内容
本发明的目的在于提供一种稳定音色的音乐语音变调方法,能够使音乐语音信号在变调处理后只改变音高而保持音色基本不变。
为实现上述目的,本发明的技术方案是:一种稳定音色的音乐语音变调方法,按照如下步骤实现:
步骤S1:将输入的数字音乐语音信号进行预处理,包括:滤波、预加重和归一化;
步骤S2:对数字音乐语音信号进行分帧处理,分别计算每一帧的倒谱序列
步骤S3:根据倒谱序列导出频谱包络,利用频谱包络分离出数字音乐语音信号的激励分量
步骤S4:将数字音乐语音信号的激励分量通过变调处理得到音高改变的激励分量
步骤S5:将频谱包络和音高改变后的激励分量重新合成,得到音高改变且音色稳定的音乐语音信号,并将每一帧重新叠加以获得完整的语音信号
其中,n、k、i均为序列号。
在本发明一实施例中,在所述步骤S2中,所述每一帧的倒谱序列的计算按照以下步骤实现:
步骤S21:根据每一帧的帧长W和每一帧的帧移WF对数字音乐语音信号分帧后得到
步骤S22:对进行傅立叶变换得到频域信号
步骤S23:根据公式得到对数频谱,对进行逆傅立叶变换得到的倒谱序列
在本发明一实施例中,在所述步骤S2中,所述帧长W为10ms至30内的采样数,W=每一帧的时间长度*采样频率;所述帧移WF为相邻两帧未重叠部分,WF=W/3。
在本发明一实施例中,在所述步骤S3中,还包括如下步骤:
步骤S31:将所述倒谱序列乘以一个低通倒谱窗函数得到,其中,为一矩形窗函数;
步骤S32:对进行傅立叶变换得到对数频谱的包络线,并对取指数得到频谱的包络线
步骤S33:根据公式,计算得到数字语音信号的声门激励分量,其中,为一hamming窗函数。
在本发明一实施例中,在所述步骤S4中,还包括如下步骤:
步骤S41:采用波形相似重叠叠加算法对所述激励分量进行时长调整,并根据公式,得到时长变为倍的激励分量,其中,为一hanning窗函数, 为分析窗帧移,为合成窗帧移,=WF,WF为每一帧的帧移,为音高调整系数,为每帧最佳匹配点相对于分析窗帧移的偏移量,采用互相关来确定最佳匹配波形点
步骤S42:对所述激励分量进行重采样处理,重采样系数为,得到音高改变且时长不变的激励信号
在本发明一实施例中,在所述步骤S5中,根据公式,将音高改变后的激励信号和原数字音乐语音信号的频谱包络重新合成得到音高改变且音色稳定的语音信号,其中,为音高改变后的激励分量,为原语音信号的频谱包络,为一hamming窗函数;将每一帧按照帧移WF重新叠加以获得完整的语音信号
相较于现有技术,本发明具有以下有益效果:本发明提出了一种稳定音色的音乐语音变调方法,其通过倒谱序列对语音的声门激励分量和声道冲激响应分量进行分离处理,保留原有的声道冲激响应分量,改变声门激励分量的音高,从而得到音高改变而音色稳定的音乐语音信号,该方法简单,实现灵活,具有较强的实用性。
附图说明
图1为本发明中稳定音色的音乐语音变调方法的流程图。
图2(a)为本发明一实施例中原始音乐语音信号频谱图。
图2(b)为本发明一实施例中采用稳定音色的音乐语音变调方法变调处理后的音乐语音信号频谱图。
图3(a)为本发明一实施例中原始音乐语音信号的共振峰分布图。
图3(b)为本发明一实施例中采用稳定音色的音乐语音变调方法变调处理后的音乐语音信号共振峰分布图。
具体实施方式
下面结合附图,对本发明的技术方案进行具体说明。
本发明提出一种稳定音色的音乐语音变调方法,如图1所示,利用语音信号可分为声门激励分量和声道冲激响应分量,通过语音信号的倒谱序列导出频谱包络,然后利用频谱包络分离出语音信号的激励分量,再将语音信号的激励分量通过变调算法处理改变其音高,最后将频谱包络和音高改变后的激励分量重新合成,得到音高改变但音色稳定的音乐语音信号,具体如下:
步骤S1:计算语音信号的倒谱序列:首先对整个语音信号进行滤波,预加重、归一化等预处理。然后将得到的语音信号按照长度为W、帧移为WF分成小段的语音帧得到,其中,W表示帧长,W=每一帧的时间长度*采样频率;WF表示帧移,WF=W/3。对于每一帧作如下处理:首先将经过傅立叶变换得,然后根据公式得到的对数频谱,最后将经过逆傅立叶变换得到倒谱序列
步骤S2:分离语音信号的激励分量:首先将所述的倒谱序列乘以一个低通倒谱窗函数得到,其中,为矩形窗函数;然后对进行傅立叶变换得到对数频谱;接着对取指数得到频谱的包络线;最后根据公式 ,将语音信号与系统函数进行卷积加窗运算,得到语音信号的声门激励分量,其中为一hamming窗函数。
步骤S3:激励分量的变调处理:首先采用波形相似重叠叠加算法(WSOLA)对激励分量进行时长调整,根据公式,得到时长变为倍的激励分量,其中,为一hanning窗函数, 为分析窗帧移,为合成窗帧移,=WF,为音高调整系数,为每帧最佳匹配点相对于分析窗帧移的偏移量,采用互相关来确定最佳匹配波形点;然后对激励分量进行重采样处理,为了使激励分量的时间长度保持不变重采样系数设定为,得到音高改变而时长不变的激励信号
进一步的,在本实施例中,频谱包络为数字语音信号中各个频率的振幅最高点所连结起来形成的曲线。
步骤4:重新合成语音信号:根据公式,将音高改变后的激励信号和原语音信号的频谱包络重新合成得到音高改变而音色稳定的语音信号,其中,为变调后的激励分量,为原语音信号的频谱包络,为hamming窗函数。最后将每一帧 按照帧移WF重新叠加以获得完整的语音信号
为了让本领域技术人员进一步了解本发明所提出的稳定音色的音乐语音变调方法,下面结合具体实施例进行说明。
如图2(a)以及图2(b)所示,按照本发明提供的方法对一段音乐语音信号进行变调处理,将两张频谱图进行对比,可以看出变调处理后音乐语音信号的音高是原始音乐语音信号的倍。
如图3(a)以及图3(b)所示,按照本发明提供的方法对一段音乐语音信号进行变调处理,将两张共振峰分布图进行对比,可以看出处理前后的共振峰分布基本保持一致,从而使音色基本保持稳定。
因此,按照本发明提供的方法对音乐语音信号进行处理可以得到音高改变而音色稳定的音乐语音信号。
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。

Claims (6)

1.一种稳定音色的音乐语音变调方法,其特征在于,按照如下步骤实现:
步骤S1:将输入的数字音乐语音信号进行预处理,包括:滤波、预加重和归一化;
步骤S2:对数字音乐语音信号进行分帧处理,分别计算每一帧的倒谱序列
步骤S3:根据倒谱序列导出频谱包络,利用频谱包络分离出数字音乐语音信号的激励分量
步骤S4:将数字音乐语音信号的激励分量通过变调处理得到音高改变的激励分量
步骤S5:将频谱包络和音高改变后的激励分量重新合成,得到音高改变且音色稳定的音乐语音信号,并将每一帧重新叠加以获得完整的语音信号
其中,n、k、i均为序列号。
2.据权利要求1所述的稳定音色的音乐语音变调方法,其特征在于,在所述步骤S2中,所述每一帧的倒谱序列的计算按照以下步骤实现:
步骤S21:根据每一帧的帧长W和每一帧的帧移WF对数字音乐语音信号分帧后得到
步骤S22:对进行傅立叶变换得到频域信号
步骤S23:根据公式得到对数频谱,对进行逆傅立叶变换得到的倒谱序列
3.根据权利要求2所述的稳定音色的音乐语音变调方法,其特征在于,在所述步骤S2中,所述帧长W为10ms至30ms内的采样数,W=每一帧的时间长度*采样频率;所述帧移WF为相邻两帧未重叠部分,WF=W/3。
4.根据权利要求1所述的稳定音色的音乐语音变调方法,其特征在于,在所述步骤S3中,还包括如下步骤:
步骤S31:将所述倒谱序列乘以一个低通倒谱窗函数得到,其中,为一矩形窗函数;
步骤S32:对进行傅立叶变换得到对数频谱的包络线,并对取指数得到频谱的包络线
步骤S33:根据公式,计算得到数字语音信号的声门激励分量,其中,为一hamming窗函数。
5.根据权利要求1所述的稳定音色的音乐语音变调方法,其特征在于,在所述步骤S4中,还包括如下步骤:
步骤S41:采用波形相似重叠叠加算法对所述激励分量进行时长调整,并根据公式,得到时长变为倍的激励分量,其中,为一hanning窗函数, 为分析窗帧移,为合成窗帧移,=WF,WF为每一帧的帧移,为音高调整系数,为每帧最佳匹配点相对于分析窗帧移的偏移量,采用互相关来确定最佳匹配波形点
步骤S42:对所述激励分量进行重采样处理,重采样系数为,得到音高改变且时长不变的激励信号
6.根据权利要求1所述的稳定音色的音乐语音变调方法,其特征在于,在所述步骤S5中,根据公式,将音高改变后的激励信号和原数字音乐语音信号的频谱包络重新合成得到音高改变且音色稳定的语音信号,其中,为音高改变后的激励分量,为原数字音乐语音信号的频谱包络,为一hamming窗函数;将每一帧按照帧移WF重新叠加以获得完整的语音信号
CN201610573399.1A 2016-07-21 2016-07-21 稳定音色的音乐语音变调方法 Pending CN106228973A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610573399.1A CN106228973A (zh) 2016-07-21 2016-07-21 稳定音色的音乐语音变调方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610573399.1A CN106228973A (zh) 2016-07-21 2016-07-21 稳定音色的音乐语音变调方法

Publications (1)

Publication Number Publication Date
CN106228973A true CN106228973A (zh) 2016-12-14

Family

ID=57531986

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610573399.1A Pending CN106228973A (zh) 2016-07-21 2016-07-21 稳定音色的音乐语音变调方法

Country Status (1)

Country Link
CN (1) CN106228973A (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107731241A (zh) * 2017-09-29 2018-02-23 广州酷狗计算机科技有限公司 处理音频信号的方法、装置和存储介质
CN107863095A (zh) * 2017-11-21 2018-03-30 广州酷狗计算机科技有限公司 音频信号处理方法、装置和存储介质
CN108172210A (zh) * 2018-02-01 2018-06-15 福州大学 一种基于歌声节奏的演唱和声生成方法
CN108269579A (zh) * 2018-01-18 2018-07-10 厦门美图之家科技有限公司 语音数据处理方法、装置、电子设备及可读存储介质
CN108281150A (zh) * 2018-01-29 2018-07-13 上海泰亿格康复医疗科技股份有限公司 一种基于微分声门波模型的语音变调变嗓音方法
CN109003621A (zh) * 2018-09-06 2018-12-14 广州酷狗计算机科技有限公司 一种音频处理方法、装置及存储介质
CN109065068A (zh) * 2018-08-17 2018-12-21 广州酷狗计算机科技有限公司 音频处理方法、装置及存储介质
CN109147809A (zh) * 2018-09-20 2019-01-04 广州酷狗计算机科技有限公司 音频信号处理方法、装置、终端及存储介质
CN109243479A (zh) * 2018-09-20 2019-01-18 广州酷狗计算机科技有限公司 音频信号处理方法、装置、电子设备及存储介质
CN109545174A (zh) * 2018-12-26 2019-03-29 广州华多网络科技有限公司 一种音频处理方法、装置及设备
CN109697985A (zh) * 2018-12-25 2019-04-30 广州市百果园信息技术有限公司 语音信号处理方法、装置及终端
CN109754825A (zh) * 2018-12-26 2019-05-14 广州华多网络科技有限公司 一种音频处理方法、装置及设备
CN111383646A (zh) * 2018-12-28 2020-07-07 广州市百果园信息技术有限公司 一种语音信号变换方法、装置、设备和存储介质
CN111435591A (zh) * 2020-01-17 2020-07-21 珠海市杰理科技股份有限公司 声音合成方法及系统、音频处理芯片、电子设备
CN111739544A (zh) * 2019-03-25 2020-10-02 Oppo广东移动通信有限公司 语音处理方法、装置、电子设备及存储介质
CN112289330A (zh) * 2020-08-26 2021-01-29 北京字节跳动网络技术有限公司 一种音频处理方法、装置、设备及存储介质
CN112309425A (zh) * 2020-10-14 2021-02-02 浙江大华技术股份有限公司 一种声音变调方法、电子设备及计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101840703A (zh) * 2010-05-07 2010-09-22 无锡中星微电子有限公司 一种语音变调方法及装置
CN101847404A (zh) * 2010-03-18 2010-09-29 北京天籁传音数字技术有限公司 一种实现音频变调的方法和装置
CN104575508A (zh) * 2013-10-15 2015-04-29 京微雅格(北京)科技有限公司 一种音频信号变调的处理方法及其装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101847404A (zh) * 2010-03-18 2010-09-29 北京天籁传音数字技术有限公司 一种实现音频变调的方法和装置
CN101840703A (zh) * 2010-05-07 2010-09-22 无锡中星微电子有限公司 一种语音变调方法及装置
CN104575508A (zh) * 2013-10-15 2015-04-29 京微雅格(北京)科技有限公司 一种音频信号变调的处理方法及其装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张晓蕊: "语音变调算法研究及其在语音合成中的应用", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107731241A (zh) * 2017-09-29 2018-02-23 广州酷狗计算机科技有限公司 处理音频信号的方法、装置和存储介质
CN107731241B (zh) * 2017-09-29 2021-05-07 广州酷狗计算机科技有限公司 处理音频信号的方法、装置和存储介质
CN107863095A (zh) * 2017-11-21 2018-03-30 广州酷狗计算机科技有限公司 音频信号处理方法、装置和存储介质
US10964300B2 (en) 2017-11-21 2021-03-30 Guangzhou Kugou Computer Technology Co., Ltd. Audio signal processing method and apparatus, and storage medium thereof
CN108269579A (zh) * 2018-01-18 2018-07-10 厦门美图之家科技有限公司 语音数据处理方法、装置、电子设备及可读存储介质
CN108269579B (zh) * 2018-01-18 2020-11-10 厦门美图之家科技有限公司 语音数据处理方法、装置、电子设备及可读存储介质
CN108281150A (zh) * 2018-01-29 2018-07-13 上海泰亿格康复医疗科技股份有限公司 一种基于微分声门波模型的语音变调变嗓音方法
CN108172210A (zh) * 2018-02-01 2018-06-15 福州大学 一种基于歌声节奏的演唱和声生成方法
CN108172210B (zh) * 2018-02-01 2021-03-02 福州大学 一种基于歌声节奏的演唱和声生成方法
CN109065068B (zh) * 2018-08-17 2021-03-30 广州酷狗计算机科技有限公司 音频处理方法、装置及存储介质
CN109065068A (zh) * 2018-08-17 2018-12-21 广州酷狗计算机科技有限公司 音频处理方法、装置及存储介质
CN109003621A (zh) * 2018-09-06 2018-12-14 广州酷狗计算机科技有限公司 一种音频处理方法、装置及存储介质
CN109243479B (zh) * 2018-09-20 2022-06-28 广州酷狗计算机科技有限公司 音频信号处理方法、装置、电子设备及存储介质
CN109243479A (zh) * 2018-09-20 2019-01-18 广州酷狗计算机科技有限公司 音频信号处理方法、装置、电子设备及存储介质
CN109147809A (zh) * 2018-09-20 2019-01-04 广州酷狗计算机科技有限公司 音频信号处理方法、装置、终端及存储介质
CN109697985A (zh) * 2018-12-25 2019-04-30 广州市百果园信息技术有限公司 语音信号处理方法、装置及终端
CN109697985B (zh) * 2018-12-25 2021-06-29 广州市百果园信息技术有限公司 语音信号处理方法、装置及终端
CN109754825A (zh) * 2018-12-26 2019-05-14 广州华多网络科技有限公司 一种音频处理方法、装置及设备
CN109545174B (zh) * 2018-12-26 2021-08-24 广州方硅信息技术有限公司 一种音频处理方法、装置及设备
CN109545174A (zh) * 2018-12-26 2019-03-29 广州华多网络科技有限公司 一种音频处理方法、装置及设备
CN111383646A (zh) * 2018-12-28 2020-07-07 广州市百果园信息技术有限公司 一种语音信号变换方法、装置、设备和存储介质
CN111383646B (zh) * 2018-12-28 2020-12-08 广州市百果园信息技术有限公司 一种语音信号变换方法、装置、设备和存储介质
CN111739544A (zh) * 2019-03-25 2020-10-02 Oppo广东移动通信有限公司 语音处理方法、装置、电子设备及存储介质
CN111739544B (zh) * 2019-03-25 2023-10-20 Oppo广东移动通信有限公司 语音处理方法、装置、电子设备及存储介质
CN111435591A (zh) * 2020-01-17 2020-07-21 珠海市杰理科技股份有限公司 声音合成方法及系统、音频处理芯片、电子设备
CN112289330A (zh) * 2020-08-26 2021-01-29 北京字节跳动网络技术有限公司 一种音频处理方法、装置、设备及存储介质
CN112309425A (zh) * 2020-10-14 2021-02-02 浙江大华技术股份有限公司 一种声音变调方法、电子设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN106228973A (zh) 稳定音色的音乐语音变调方法
CN109584903B (zh) 一种基于深度学习的多人语音分离方法
CN107924686B (zh) 语音处理装置、语音处理方法以及存储介质
Jin et al. Adversarial data augmentation for disordered speech recognition
JP2009163121A (ja) 音声処理装置及びそのプログラム
CN108172210B (zh) 一种基于歌声节奏的演唱和声生成方法
JP2019101093A5 (ja) 音声合成方法、音声合成システムおよびプログラム
CN110782915A (zh) 一种基于深度学习的波形音乐成分分离方法
CN103489443B (zh) 一种声音模仿方法及装置
CN110503967A (zh) 一种语音增强方法、装置、介质和设备
Shifas et al. A non-causal FFTNet architecture for speech enhancement
Li et al. Spmamba: State-space model is all you need in speech separation
CN113744715A (zh) 声码器语音合成方法、装置、计算机设备及存储介质
Yoneyama et al. Nonparallel high-quality audio super resolution with domain adaptation and resampling CycleGANs
EP3149727B1 (en) Method for forming the excitation signal for a glottal pulse model based parametric speech synthesis system
CN108806721A (zh) 信号处理器
CN102231275B (zh) 一种基于加权混合激励的嵌入式语音合成方法
Suni et al. Lombard modified text-to-speech synthesis for improved intelligibility: submission for the hurricane challenge 2013.
WO2013020341A1 (zh) 一种音效变音方法及装置
Alku et al. Linear predictive method for improved spectral modeling of lower frequencies of speech with small prediction orders
Wang et al. Improve gan-based neural vocoder using pointwise relativistic leastsquare gan
Li et al. Real-Time End-to-End Monaural Multi-Speaker Speech Recognition}}
Wu et al. Robust target feature extraction based on modified cochlear filter analysis model
Doumanidis et al. Rnnoise-ex: Hybrid speech enhancement system based on rnn and spectral features
Yuan-yuan et al. Speech synthesis based on PSOLA algorithm and modified pitch parameters

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20161214

RJ01 Rejection of invention patent application after publication