CN101207500B - 一种音频数据变音方法 - Google Patents

一种音频数据变音方法 Download PDF

Info

Publication number
CN101207500B
CN101207500B CN200610170244XA CN200610170244A CN101207500B CN 101207500 B CN101207500 B CN 101207500B CN 200610170244X A CN200610170244X A CN 200610170244XA CN 200610170244 A CN200610170244 A CN 200610170244A CN 101207500 B CN101207500 B CN 101207500B
Authority
CN
China
Prior art keywords
voice
inflexion
media server
terminal
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200610170244XA
Other languages
English (en)
Other versions
CN101207500A (zh
Inventor
吴建军
王东
郑罡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN200610170244XA priority Critical patent/CN101207500B/zh
Publication of CN101207500A publication Critical patent/CN101207500A/zh
Application granted granted Critical
Publication of CN101207500B publication Critical patent/CN101207500B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

一种音频数据变音方法,包含如下步骤:步骤A:终端将变音参数发送至媒体服务器;步骤B:媒体服务器发送变音请求接受信息至终端;步骤C:终端接收到变音请求接受信息后,向媒体服务器发送音频数据流;步骤D:媒体服务器接收到完整可变音数据单元后,进行变音处理;步骤E:当满足变音停止条件时停止变音处理,否则重复步骤C至步骤D。本发明通过将终端上的音频数据上传至网络中的媒体服务器,由媒体服务器对该音频数据进行变音处理,并可将经过处理的音频数据实时传送至终端,使得任何具备网络访问能力的终端都能以最快最便捷的方式对音频数据进行变音处理。

Description

一种音频数据变音方法
技术领域
本发明涉及音频数据处理领域,特别涉及一种对音频数据进行变音处理的方法。
背景技术
音频变音是对音频数据进行后期处理的方法,例如,保持音频数据音调不变而加快或减慢音频节奏;保持音频数据的节奏不变而提高或降低音频数据的音调;将音频数据的固有音量放大或减小等等。
音频变音是音乐工作者、语音工作者在进行乐谱记录、语音识别、制作虚拟化人声等工作中常用的技术手段。此外,在日常生活中,出于娱乐和对个性化的追求等目的,对音频数据进行变音/混音处理,如制作个性化手机铃音等需求也大量存在。
但是,由于对音频数据进行变音处理对处理平台的硬件资源有较高的要求,并不是任何保存有音频数据的终端都能将音频数据快速、有效地进行变音处理。例如,由于缺乏相应的硬件资源,保存在手机等嵌入式设备中的音频数据通常无法在设备中直接进行变音处理。此外,由于缺乏专业的音频处理软件和丰富的音频素材,普通消费者即使将音频数据传送至个人电脑等硬件资源相对丰富的平台上,也很难对音频数据进行满足需求的变音处理。
此外,由于音频数据通常都是经过特定的算法压缩后进行传输和保存,如果缺乏对该压缩算法的支持,普通的音频处理软件也无法对音频数据进行处理。
发明内容
本发明要解决的技术问题是,克服现有技术中对音频数据进行变音处理的方法的不足,提出一种借助网络中的媒体服务器实现音频数据变音的方法,使任何具备网络通讯功能的终端都能够及时地对音频数据进行满足需求的变音处理。
为了解决上述问题,本发明提供一种音频数据变音方法,包含如下步骤:
步骤A:终端将变音参数发送至媒体服务器;
步骤B:媒体服务器发送变音请求接受信息至终端;
步骤C:终端接收到变音请求接受信息后,向媒体服务器发送音频数据流;
步骤D:媒体服务器接收到完整可变音数据单元后,进行变音处理;
步骤E:当满足变音停止条件时停止变音处理,否则重复步骤C至步骤D。
此外,在所述步骤A之前还包含如下步骤:
步骤1’:终端向网络中的媒体服务器发出音频变音服务请求;
步骤2’:媒体服务器对接收到的音频变音服务请求的有效性进行审核;若为无效请求返回错误信息,本方法结束;若为有效请求,发送变音服务请求有效信息给终端;
终端接收到变音服务请求有效信息后,执行所述步骤A。
此外,所述变音参数包含回放参数,且在所述步骤E之后还包含如下步骤:
媒体服务器根据回放参数对经过变音处理的音频数据进行回放处理。
此外,所述变音参数包含变音服务类型,音频参数。
此外,所述变音停止条件包含:音频数据或音频数据段落结束,用户终止或暂停变音操作。
此外,所述变音参数包含服务时间,所述变音停止条件包含服务时间结束。
此外,所述变音参数包含回放参数,回放参数包含回放方式,且在所述步骤D和步骤E之间还包含如下步骤:
步骤3’:若回放方式是实时模拟回放或实时数字回放,则媒体服务器将经过变音处理的音频数据发送至终端。
此外,所述回放参数包含编码格式,且在所述步骤D和步骤3’之间还包含如下步骤:
根据编码格式对音频数据进行编码。
本发明通过将终端上的音频数据上传至网络中的媒体服务器,由媒体服务器对该音频数据进行变音处理,并可将经过处理的音频数据实时传送至终端,使得任何具备网络访问能力的终端都能以最快最便捷的方式对音频数据进行变音处理。
附图说明
图1是本发明音频数据变音方法的流程图。
具体实施方式
本发明的基本思路是,将终端上的音频数据及相应的变音参数上传至网络中的媒体服务器,媒体服务器接收到完整的可变音数据单元后对音频数据进行解码和变音处理。
下面将结合附图和实施例对本发明进行详细的描述。
图1是本发明音频数据变音方法的流程图。
如图1所示,本发明的音频数据变音方法包含如下步骤:
步骤1:终端向网络中的媒体服务器发出音频变音服务请求;
上述终端可以是具有网络访问功能的个人电脑或个人数字助理(PDA)、移动音频撷取/播放装置、移动电话等嵌入式装置。
上述音频变音服务请求可以通过IP网络以命令包的形式发出,也可以通过电话网络结合IVR(Interactive Voice Response,交互式语音应答)系统等方式发送至媒体服务器。
音频变音服务请求中可包含用户名、密码等用户识别信息。
步骤2:媒体服务器对接收到的音频变音服务请求的有效性进行审核;对于无效请求返回错误信息,本方法结束;若为有效请求,则发送变音服务请求有效信息给终端;
对音频变音服务请求的审核包含对用户名、密码等用户识别信息的审核。例如,若用户名、密码不正确,或该用户没有申请变音服务,则该音频变音服务请求为无效请求。
步骤3:终端接收到变音服务请求有效信息后,将变音参数发送至媒体服务器;
上述变音参数包含变音服务类型,音频参数,服务时间,回放参数等信息;
变音服务类型可包含:变调,变节奏,固有音量调整,降噪,淡入、淡出、回声等音频特殊效果制作等。
音频参数与变音服务类型相关,如对于变调服务,音频参数可包含音调增加或降低的半音数;对于固有音量调整服务,音频参数可包含音量增加或降低的百分比;对于回声制作服务,音频参数可包含回声延迟时间等。
服务时间信息可包含服务开始时间,服务结束时间或服务时间长度等信息。
回放参数可包含回放方式,编码格式等信息。例如,当回放方式选用文件回放方式时,媒体服务器将经过变音处理的音频数据保存成音频文件,并在适当的时候通过IP网络发送至终端;若回放方式选用模拟回放方式,媒体服务器将经过变音处理的音频数据通过电话网络发送至终端,终端可以将其以模拟音频数据方式进行播放。此外,回放方式还可以是实时模拟回放,即将经过变音处理的数据以模拟语音数据的形式实时发送至终端;或实时数字回放,即将经过变音处理的数据以数字语音数据的形式实时发送至终端。编码格式可以是G711U、G711A、G723、G729等。
步骤4:媒体服务器对接收到的变音参数进行有效性检查,若变音参数错误则返回参数错误信息;若参数正确有效则发送变音请求接受信息至终端.
步骤5:终端接收到变音请求接受信息后,向媒体服务器发送音频数据流;
上述音频数据流可以是通过IP网络发送的数字音频数据包,或者是通过电话网络发送的模拟音频数据流。
步骤6:媒体服务器接收到完整可变音数据单元后,进行变音处理;
上述完整可变音数据单元的大小与终端发送的音频数据流的类型,变音服务类型、音频参数和服务时间有关。例如,当终端发送的音频流为G711U、G711A、G723、G729等编码格式的数据,则完整可变音数据单元的数据长度至少要大于该音频编码格式的完整可解码单元,即至少要接收到解码所需的所有参数,对音频数据进行正确的解码后对其进行变音处理;当终端发送的音频流为模拟音频数据,则完整可变音数据单元的时间小于或等于服务时间;对于淡出效果制作,完整可变音数据单元包含的音频数据要包含音频段落的尾端数据。
步骤7:若回放方式是实时模拟回放或实时数字回放,则媒体服务器将经过变音处理的音频数据发送至终端;
媒体服务器在将经过变音处理的音频数据发送至终端前,可根据变音参数中指定的编码格式对音频数据进行编码。
步骤8:当满足变音停止条件时停止变音处理;否则重复步骤5至步骤7;
变音停止条件可以是音频数据或音频数据段落结束,用户终止或暂停变音操作,服务时间结束等。
步骤9:媒体服务器根据回放参数对经过变音处理的音频数据进行回放处理;
回放处理可以是:将经过变音处理的音频数据通过电话网络以模拟语音的方式发送至终端;或将经过变音处理的音频数据保存成音频文件,并在适当的时候通过IP网络发送至终端指定的位置。

Claims (8)

1.一种音频数据变音方法,包含如下步骤:
步骤A:终端将变音参数发送至媒体服务器;
步骤B:媒体服务器发送变音请求接受信息至终端;
步骤C:终端接收到变音请求接受信息后,向媒体服务器发送音频数据流;
步骤D:媒体服务器接收到完整可变音数据单元后,进行变音处理;
步骤E:当满足变音停止条件时停止变音处理,否则重复步骤C至步骤D。
2.如权利要求1所述的音频数据变音方法,其特征在于,在所述步骤A之前还包含如下步骤:
步骤1’:终端向网络中的媒体服务器发出音频变音服务请求;
步骤2’:媒体服务器对接收到的音频变音服务请求的有效性进行审核;若为无效请求返回错误信息,本方法结束;若为有效请求,发送变音服务请求有效信息给终端;
终端接收到变音服务请求有效信息后,执行所述步骤A。
3.如权利要求1所述的音频数据变音方法,其特征在于,所述变音参数包含回放参数,且在所述步骤E之后还包含如下步骤:
媒体服务器根据回放参数对经过变音处理的音频数据进行回放处理。
4.如权利要求1所述的音频数据变音方法,其特征在于,所述变音参数包含变音服务类型,音频参数。
5.如权利要求1所述的音频数据变音方法,其特征在于,所述变音停止条件包含:音频数据或音频数据段落结束,用户终止或暂停变音操作。
6.如权利要求1所述的音频数据变音方法,其特征在于,所述变音参数包含服务时间,所述变音停止条件包含服务时间结束。
7.如权利要求1所述的音频数据变音方法,其特征在于,所述变音参数包含回放参数,回放参数包含回放方式,且在所述步骤D和步骤E之间还包含如下步骤:
步骤3’:若回放方式是实时模拟回放或实时数字回放,则媒体服务器将经过变音处理的音频数据发送至终端。
8.如权利要求7所述的音频数据变音方法,其特征在于,所述回放参数包含编码格式,且在所述步骤D和步骤3’之间还包含如下步骤:
根据编码格式对音频数据进行编码。
CN200610170244XA 2006-12-21 2006-12-21 一种音频数据变音方法 Expired - Fee Related CN101207500B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200610170244XA CN101207500B (zh) 2006-12-21 2006-12-21 一种音频数据变音方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200610170244XA CN101207500B (zh) 2006-12-21 2006-12-21 一种音频数据变音方法

Publications (2)

Publication Number Publication Date
CN101207500A CN101207500A (zh) 2008-06-25
CN101207500B true CN101207500B (zh) 2010-09-01

Family

ID=39567407

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200610170244XA Expired - Fee Related CN101207500B (zh) 2006-12-21 2006-12-21 一种音频数据变音方法

Country Status (1)

Country Link
CN (1) CN101207500B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103440868B (zh) * 2013-08-09 2016-05-11 中山大学 一种电子变调音频的鉴定方法
CN104575487A (zh) * 2014-12-11 2015-04-29 百度在线网络技术(北京)有限公司 一种语音信号的处理方法及装置
CN111194545A (zh) * 2017-10-09 2020-05-22 深圳传音通讯有限公司 一种移动通讯设备通话时改变原始声音的方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1313003A (zh) * 1998-06-09 2001-09-12 艾利森电话股份有限公司 带有按音响方式可编程的振铃音发生装置的电信设备和对该振铃音发生装置进行编程的方法
CN1529503A (zh) * 2003-10-17 2004-09-15 清华大学 一种选择视频网关中视频流转码的方法
CN1534955A (zh) * 2003-03-27 2004-10-06 雅马哈株式会社 便携式终端装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1313003A (zh) * 1998-06-09 2001-09-12 艾利森电话股份有限公司 带有按音响方式可编程的振铃音发生装置的电信设备和对该振铃音发生装置进行编程的方法
CN1534955A (zh) * 2003-03-27 2004-10-06 雅马哈株式会社 便携式终端装置
CN1529503A (zh) * 2003-10-17 2004-09-15 清华大学 一种选择视频网关中视频流转码的方法

Also Published As

Publication number Publication date
CN101207500A (zh) 2008-06-25

Similar Documents

Publication Publication Date Title
US20110044324A1 (en) Method and Apparatus for Voice Communication Based on Instant Messaging System
US20080039051A1 (en) Method for Playing Audio Files on a Portable Electronic Device
US8983835B2 (en) Electronic device and server for processing voice message
WO2007070860A2 (en) Intelligent codec selection to optimize audio transmission in wireless communications
CN100454884C (zh) 在线游戏系统实现多媒体信息通信的方法及其系统
CN103295576A (zh) 一种即时通信的语音识别方法和终端
RU2333546C2 (ru) Устройство и способ речевой модуляции
CN107005800A (zh) 音频文件的传输、接收方法及装置、设备及其系统
CN107800860A (zh) 语音处理方法、装置及终端设备
CN111696591A (zh) 一种云手机音频数据处理方法和系统
CN101207500B (zh) 一种音频数据变音方法
JP2003526274A (ja) ディジタル電話信号へのデータの埋め込み
CN101981872B (zh) 用于经由无线电话网络的话音信道发射数据的系统、方法及设备
CN110351419B (zh) 一种智能语音系统及其语音处理方法
US20020128826A1 (en) Speech recognition system and method, and information processing apparatus and method used in that system
CN101480036B (zh) 在便携式电子设备上播放音频文件的方法
CN1645882A (zh) 可收发语音短信息的通信系统
CN100563334C (zh) 在无线终端的视频电话模式中发送图像数据的方法
CN1937668B (zh) 将调频音乐转换为移动通信终端来电铃声的方法及其终端
US8265930B1 (en) System and method for recording voice data and converting voice data to a text file
CN101212310A (zh) 一种音频数据变音系统
RU2006134658A (ru) Система, способ и программа для обеспечения источника звука
CN102546940A (zh) 一种基于语音的提示方法及终端设备
JP2004120432A (ja) 移動通信端末
US20030065512A1 (en) Communication device and a method for transmitting and receiving of natural speech

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100901

Termination date: 20151221

EXPY Termination of patent right or utility model