CN1831940A - 基于音频解码器的音调和节奏快速调节方法 - Google Patents

基于音频解码器的音调和节奏快速调节方法 Download PDF

Info

Publication number
CN1831940A
CN1831940A CNA2006100348829A CN200610034882A CN1831940A CN 1831940 A CN1831940 A CN 1831940A CN A2006100348829 A CNA2006100348829 A CN A2006100348829A CN 200610034882 A CN200610034882 A CN 200610034882A CN 1831940 A CN1831940 A CN 1831940A
Authority
CN
China
Prior art keywords
tone
rhythm
pitch
output speed
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006100348829A
Other languages
English (en)
Other versions
CN1831940B (zh
Inventor
黄立新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Ankai Microelectronics Co.,Ltd.
Original Assignee
ANKAI (GUANGZHOU) SOFTWARE TECHN Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ANKAI (GUANGZHOU) SOFTWARE TECHN Co Ltd filed Critical ANKAI (GUANGZHOU) SOFTWARE TECHN Co Ltd
Priority to CN2006100348829A priority Critical patent/CN1831940B/zh
Publication of CN1831940A publication Critical patent/CN1831940A/zh
Application granted granted Critical
Publication of CN1831940B publication Critical patent/CN1831940B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种基于音频解码器的音调和节奏快速调节方法,音频信号先依次经音频解码器解码、反量化、频域处理,接着对频域处理后的信号进行音调调节,再接着依次经音频解码器对音调调节后的信号进行频域到时域的转换、时域处理;最后时域处理后信号进行节奏调节输出。本发明利用音频解码器中已有的前处理模块,在转换前的频域信号进行音调调节,再利用了音频解码中的频域到时域的转换,通过改变输出速率,达到节奏的调节,这样既继承了采用频域调节实现音调改变效果好的优点,同时大大减少了原有音调和节奏调节方法中需要的大量运算,也避免了使用大量的内存缓冲样点数据,同时对音频解码器增加的运算量也很小。

Description

基于音频解码器的音调和节奏快速调节方法
技术领域
本发明涉及一种音调和节奏快速调节方法,尤其是涉及一种基于音频解码器的音调和节奏快速调节方法
背景技术
随着技术的发展和成本的下降,多媒体设备逐渐得到普及,在多媒体设备上播放音乐和语音就越来越流行。随着不同应用的普及,例如便携式学习机,音调和节奏调节就越来越成为多媒体设备中不可缺少的一项功能。其中音调的调节是在不改变总的播放时间的情况下,改变基音及其谐音的频率来实现;节奏的调节是在不改变音调的情况下,延长或者缩短总的播放时间来实现,音调和节奏的调节可以同时进行。
现有技术中,节奏调节采用时域相关的方法,该方法以帧为单位来改变时域的输出样点的数量。有选择的重复或者丢弃一些样点,在相邻帧之间的过渡部分采取寻找相关最大的一段和上一帧结束的一段做混叠。例如输入N个样点为一帧,如果是节奏变快一倍,经过这个算法的处理,则输出N/2个样点。节奏变慢的方法类似。该方法处理过程中需要占用大量的内存做缓冲,同时由于寻找相关系数最大的样点需要做大量的累乘加操作,运算量较大。
对音调的改变采用频域调节的方法如图1所示,该方法的核心是把时域信号转换成频域信号,对频域信号进行音调搬移(Pitch Shifting)之后,再转换成时域信号。这种通过频域调节的方法,处理过程中需要做一次离散傅立叶变换和一次离散傅立叶反变换,需要的运算量很大。因此,如果用在用在多媒体的音频解码器中,目前常用的这些方法要对输出的音频信号进行音调和节奏的调节时,都要做为一个独立的后处理模块来进行处理,则没有充分利用音频解码器中现有的模块,多媒体中常有的音频解码器的信号处理流程如图2所示,其中有时域到频域的转换处理过程。
发明内容
本发明的目的在于提供一种具有运算量小,占用内存少的音调和节奏的快速调节方法。
上述发明目的可通过以下的技术措施来实现:一种基于音频解码器的音调和节奏快速调节方法,音频信号先依次经音频解码器解码、反量化、频域处理,接着对频域处理后的信号进行音调调节,再接着依次经音频解码器对音调调节后的信号进行频域到时域的转换、时域处理;最后时域处理后信号进行节奏调节输出。
本发明所述的音调调节的具体过程为:对频域处理后的信号先进行频谱分析,用于改善由于分帧造成的频谱失真,使得到的频谱更接近于实际的频率,再进行音调搬移,用于补偿由于改变输出速率而造成的音调偏移,最后进行频谱综合,用于修复音调搬移造成的频谱失真;频谱综合后利用音频解码器进行频域到时域的转换。
本发明所述音调搬移过程中音调搬移的大小和方向由事先设定的音调和节奏两个参数决定,最终音调搬移的幅度按下式得出:
Pitch_New=Pitch_fs×(1-Tempo)+Pitch
其中Pitch表示设定音调所需调节的幅度,大于0表示音调增高,小于0表示音调降低;Pitcn_fs表示输入样点中最高的音调值;Tempo表示设定节奏,大于1表示变快,小于1表示变慢;Pitcn_New表示最终音调搬移的幅度。
本发明所述的节奏调节的具体过程为:根据设定的节奏来改变数模转换(DA)的输出速率。数模转换的输出速率同节奏快慢成正比,节奏变快,数模转换输出速率加大;节奏变慢,数模转换输出速率减小。调节后的输出速率按下式得出:
SR_New=SR×Tempo;
其中SR是原来的DA输出速率,Tempo表示设定节奏,大于1表示变快,小于1表示变慢,SR_New表示调整后的输出速率。
本发明利用音频解码器中已有的前处理模块,在转换前的频域信号进行音调调节,再利用了音频解码中的频域到时域的转换,通过改变输出速率,达到节奏的调节,这样既继承了采用频域调节实现音调改变效果好的优点,同时大大减少了原有音调和节奏调节方法中需要的大量运算,也避免了使用大量的内存缓冲样点数据,同时对音频解码器增加的运算量也很小。
附图说明
图1为现有技术采用频域调节实现音调改变的流程图;
图2为现有的音频解码器的信号处理流程图;
图3为本发明的信号处理流程图。
具体实施方式
如图3所示,本发明具体实施步骤如下:
(1)音频信号先依次经音频解码器解码、反量化、频域处理,例如MP3解码流程中,首先进行Huffman(霍夫曼)解码,得到量化后的频谱系数,然后把量化后的频谱系数进行反量化处理,最后做一些频域处理,例如联合立体声的处理。
(2)对频域处理后的信号先进行频谱分析,根据编码时采用的时频转换方法,得到加窗的类型等信息,然后把频谱反加窗处理,使得到的频谱系数更接近真实的频谱。
(3)再进行音调搬移,音调搬移是指在原来的基础上主音偏移的大小。音调搬移过程中音调搬移的大小和方向由用户事先设置所需要的音调和节奏两个参数来决定,节奏是指播放的快慢,最终音调搬移的幅度按下式得出:
Pitch_New=Pitch_fs×(1-Tempo)+Pitch
其中Pitch表示设定音调需要调节的幅度,大于0表示音调增高,小于0表示音调降低;Pitch_fs表示输入样点中最高的音调值;Tempo表示设定的节奏,大于1表示变快,小于1表示变慢;Pitch_New表示最终音调搬移的幅度。
根据得出的Pitch_New,进行音调搬移,如果大于0,则表示提高频谱,如果小于0则表示降低频谱。
(4)进行频谱综合,根据频域到时域转换的方法,把搬移后的频谱做调整,进行加窗处理。
(5)频谱综合后利用音频解码器对音调调节后的信号进行频域到时域的转换、时域处理;例如在MP3解码器中,做MDCT(离散余弦变换)和滤波器组综合。
(6)时域处理后信号进行节奏调节输出。节奏调节的具体过程为:根据用户事先设置的节奏来改变数模转换(DA)的输出速率。DA的输出速率同节奏快慢成正比,节奏变快,DA输出速率加大;节奏变慢,DA输出速率减小。调节后的输出速率按下式得出:
SR_New=SR×Tempo;
其中SR是原来的DA输出速率,Tempo表示节奏,大于1表示变快,小于1表示变慢,SR_New表示调整后的输出速率。

Claims (4)

1、一种基于音频解码器的音调和节奏快速调节方法,其特征在于:音频信号先依次经音频解码器解码、反量化、频域处理,接着对频域处理后的信号进行音调调节,再接着依次经音频解码器对音调调节后的信号进行频域到时域的转换、时域处理;最后时域处理后信号进行节奏调节输出。
2、根据权利要求1所述的音调和节奏快速调节方法,其特征在于:所述的音调调节的具体过程为:对频域处理后的信号先进行频谱分析,用于改善由于分帧造成的频谱失真,使得到的频谱更接近于实际的频率;再进行音调搬移,用于补偿由于改变输出速率而造成的音调偏移;最后进行频谱综合,用于修复音调搬移造成的频谱失真;频谱综合后利用音频解码器进行频域到时域的转换。
3、根据权利要求2所述的音调和节奏快速调节方法,其特征在于:所述音调搬移过程中音调搬移的大小和方向由事先设定的音调和节奏两个参数决定,最终音调搬移的幅度按下式得出:
Pitch_New=Pitch_fs×(1-Tempo)+Pitch
其中Pitch表示设定音调所需调节的幅度,大于0表示音调增高,小于0表示音调降低;Pitch_fs表示输入样点中最高的音调值;Tempo表示设定节奏,大于1表示变快,小于1表示变慢;Pitch_New表示最终音调搬移的幅度。
4、根据权利要求1所述的音调和节奏快速调节方法,其特征在于:所述的节奏调节的具体过程为:根据设定的节奏来改变数模转换的输出速率;数模转换的输出速率同节奏快慢成正比,节奏变快,数模转换输出速率加大;节奏变慢,数模转换输出速率减小;调节后的输出速率按下式得出:
SR_New=SR×Tempo;
其中SR是原来的数模转换输出速率,Tempo表示设定节奏,大于1表示变快,小于1表示变慢,SR_New表示调整后的输出速率。
CN2006100348829A 2006-04-07 2006-04-07 基于音频解码器的音调和节奏调节方法 Active CN1831940B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2006100348829A CN1831940B (zh) 2006-04-07 2006-04-07 基于音频解码器的音调和节奏调节方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2006100348829A CN1831940B (zh) 2006-04-07 2006-04-07 基于音频解码器的音调和节奏调节方法

Publications (2)

Publication Number Publication Date
CN1831940A true CN1831940A (zh) 2006-09-13
CN1831940B CN1831940B (zh) 2010-06-23

Family

ID=36994198

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006100348829A Active CN1831940B (zh) 2006-04-07 2006-04-07 基于音频解码器的音调和节奏调节方法

Country Status (1)

Country Link
CN (1) CN1831940B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101165772B (zh) * 2006-10-18 2011-06-08 安凯(广州)微电子技术有限公司 一种扩展合成器音色的方法
CN102208901A (zh) * 2010-03-31 2011-10-05 安凯(广州)微电子技术有限公司 一种mp3解码过程中实现均衡器的方法
CN103354091A (zh) * 2013-06-19 2013-10-16 北京百度网讯科技有限公司 基于频域变换的音频特征提取方法及装置
CN103714824A (zh) * 2013-12-12 2014-04-09 小米科技有限责任公司 一种音频处理方法、装置及终端设备
CN104510492A (zh) * 2013-10-06 2015-04-15 吴伟 不可听信号的听诊方法及装置
WO2021143692A1 (zh) * 2020-01-13 2021-07-22 华为技术有限公司 一种音频编解码方法和音频编解码设备
WO2021244418A1 (zh) * 2020-05-30 2021-12-09 华为技术有限公司 一种音频编码方法和音频编码装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108269579B (zh) * 2018-01-18 2020-11-10 厦门美图之家科技有限公司 语音数据处理方法、装置、电子设备及可读存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3895555A (en) * 1973-10-03 1975-07-22 Richard H Peterson Teaching instrument for keyboard music instruction
JP3153669B2 (ja) * 1993-03-25 2001-04-09 富士写真フイルム株式会社 画像再生システム
CN1099777C (zh) * 1993-06-30 2003-01-22 索尼公司 数字信号的编码装置、解码装置和编码方法
JP3582589B2 (ja) * 2001-03-07 2004-10-27 日本電気株式会社 音声符号化装置及び音声復号化装置
JP3900000B2 (ja) * 2002-05-07 2007-03-28 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101165772B (zh) * 2006-10-18 2011-06-08 安凯(广州)微电子技术有限公司 一种扩展合成器音色的方法
CN102208901A (zh) * 2010-03-31 2011-10-05 安凯(广州)微电子技术有限公司 一种mp3解码过程中实现均衡器的方法
CN102208901B (zh) * 2010-03-31 2014-04-23 安凯(广州)微电子技术有限公司 一种mp3解码过程中实现均衡器的方法
CN103354091A (zh) * 2013-06-19 2013-10-16 北京百度网讯科技有限公司 基于频域变换的音频特征提取方法及装置
CN103354091B (zh) * 2013-06-19 2015-09-30 北京百度网讯科技有限公司 基于频域变换的音频特征提取方法及装置
CN104510492A (zh) * 2013-10-06 2015-04-15 吴伟 不可听信号的听诊方法及装置
CN103714824A (zh) * 2013-12-12 2014-04-09 小米科技有限责任公司 一种音频处理方法、装置及终端设备
CN103714824B (zh) * 2013-12-12 2017-06-16 小米科技有限责任公司 一种音频处理方法、装置及终端设备
WO2021143692A1 (zh) * 2020-01-13 2021-07-22 华为技术有限公司 一种音频编解码方法和音频编解码设备
US12039984B2 (en) 2020-01-13 2024-07-16 Huawei Technologies Co., Ltd. Audio encoding and decoding method and audio encoding and decoding device
WO2021244418A1 (zh) * 2020-05-30 2021-12-09 华为技术有限公司 一种音频编码方法和音频编码装置
US12062379B2 (en) 2020-05-30 2024-08-13 Huawei Technologies Co., Ltd. Audio coding of tonal components with a spectrum reservation flag

Also Published As

Publication number Publication date
CN1831940B (zh) 2010-06-23

Similar Documents

Publication Publication Date Title
CN1831940A (zh) 基于音频解码器的音调和节奏快速调节方法
CN102881294B (zh) 操纵具有瞬变事件的音频信号的方法和设备
Verma et al. Extending spectral modeling synthesis with transient modeling synthesis
CN102089812B (zh) 用以使用混叠切换方案将音频信号编码/解码的装置与方法
KR102198688B1 (ko) 고조파 전위에 기초하여 개선된 서브밴드 블록
CN105706166B (zh) 对比特流进行解码的音频解码器设备和方法
JP5283757B2 (ja) オーディオ信号のスペクトルの複数の局部重心周波数を決定するための装置及び方法
Schwarz et al. Spectral envelope estimation, representation, and morphing for sound analysis, transformation, and synthesis.
WO2008071353A2 (en) Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream
CA2966469A1 (en) Improved harmonic transposition
MX2007014555A (es) Post-filtracion de codificador-descodificador de audio.
US20050065784A1 (en) Modification of acoustic signals using sinusoidal analysis and synthesis
US20070137466A1 (en) Sound synthesis by combining a slowly varying underlying spectrum, pitch and loudness with quicker varying spectral, pitch and loudness fluctuations
WO2009039451A2 (en) Efficient design of mdct / imdct filterbanks for speech and audio coding applications
US12080311B2 (en) Machine-learned differentiable digital signal processing
CN1135531C (zh) 音调转换装置
CN112908351A (zh) 一种音频变调方法、装置、设备及存储介质
CN113241082A (zh) 变声方法、装置、设备和介质
Serra Introducing the phase vocoder
CN1874163A (zh) 数字音频数据的压缩与解压缩的方法
US10319353B2 (en) Method for audio sample playback using mapped impulse responses
CN1892821A (zh) 一种对音频数据进行处理的方法及装置
Nercessian et al. Real-time singing voice conversion plug-in
AU2022200874B2 (en) Improved Subband Block Based Harmonic Transposition
RU2813317C1 (ru) Усовершенствованное гармоническое преобразование на основе блока поддиапазонов

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 510663 301-303, 401-402, zone C1, 182 science Avenue, Science City, Guangzhou high tech Industrial Development Zone, Guangdong Province

Patentee after: Guangzhou Ankai Microelectronics Co.,Ltd.

Address before: 510663 301-303, 401-402, zone C1, 182 science Avenue, Science City, Guangzhou high tech Industrial Development Zone, Guangdong Province

Patentee before: ANYKA (GUANGZHOU) MICROELECTRONICS TECHNOLOGY Co.,Ltd.

CP01 Change in the name or title of a patent holder
CP02 Change in the address of a patent holder

Address after: 510555 No. 107 Bowen Road, Huangpu District, Guangzhou, Guangdong

Patentee after: Guangzhou Ankai Microelectronics Co.,Ltd.

Address before: 510663 301-303, 401-402, zone C1, 182 science Avenue, Science City, Guangzhou high tech Industrial Development Zone, Guangdong Province

Patentee before: Guangzhou Ankai Microelectronics Co.,Ltd.

CP02 Change in the address of a patent holder