CN101322375B - 音频数据包格式及其解码方法、校正移动通信终端编解码器安装错误的方法以及执行该方法的移动通信终端 - Google Patents

音频数据包格式及其解码方法、校正移动通信终端编解码器安装错误的方法以及执行该方法的移动通信终端 Download PDF

Info

Publication number
CN101322375B
CN101322375B CN2006800449372A CN200680044937A CN101322375B CN 101322375 B CN101322375 B CN 101322375B CN 2006800449372 A CN2006800449372 A CN 2006800449372A CN 200680044937 A CN200680044937 A CN 200680044937A CN 101322375 B CN101322375 B CN 101322375B
Authority
CN
China
Prior art keywords
data
codec
field
audio
mobile communication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2006800449372A
Other languages
English (en)
Other versions
CN101322375A (zh
Inventor
朴圣水
金圣根
吴世铉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SK Telecom Co Ltd
Original Assignee
SK Telecom Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020050103482A external-priority patent/KR100668686B1/ko
Application filed by SK Telecom Co Ltd filed Critical SK Telecom Co Ltd
Priority claimed from PCT/KR2006/004487 external-priority patent/WO2007066897A1/en
Publication of CN101322375A publication Critical patent/CN101322375A/zh
Application granted granted Critical
Publication of CN101322375B publication Critical patent/CN101322375B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Abstract

本发明公开了一种经由移动通信网络的语音信道来传输MPEG-4HE-AAC帧的音频数据包格式;一种对音频数据包格式进行解码的方法;一种通过基于语音时隙数据的序号来识别用于对插入在语音时隙数据的数据字段中的音源数据进行编码的编解码器,并且当移动通信终端中安装的编解码器不同于用于对音源数据进行编码的编解码器时对编解码器安装错误进行校正,来校正编解码器安装错误的方法;以及一种适于校正编解码器安装错误的移动通信终端。

Description

音频数据包格式及其解码方法、校正移动通信终端编解码器安装错误的方法以及执行该方法的移动通信终端
技术领域
本发明涉及音频数据包格式、解码这种音频数据包格式的方法、校正编解码器安装错误的方法,以及适于校正编解码器安装错误的移动通信终端。更具体地来讲,本发明涉及一种用于经由移动通信网络的语音信道来传输MPEG-4 HE-AAC(高效高级音频编码)帧的音频数据包格式及其解码方法。此外,本发明还涉及这样一种通过以下步骤来校正编解码器安装错误的方法以及一种适于以该方法来校正编解码器安装错误的移动通信终端:基于语音时隙数据的序号,来识别用来对插入到该语音时隙数据的数据字段中的音源数据进行编码的编解码器;以及当移动通信终端中安装的编解码器不同于用来对音源数据进行编码的该编解码器时对编解码器安装错误进行校正。
背景技术
如本领域公知的,随着与计算机、电子设备和通信相关联的技术的快速发展,经由移动通信网络提供了多种服务。最基本类型的移动通信服务是语音通信服务,其使得用户能够经由移动通信终端随时随地进行通信。此外,文本消息服务对语音通信服务做了补充。近来已经提供了无线互联网服务,这种服务使得移动通信终端的用户能够经由移动通信网络来访问互联网。
结果,移动通信服务的订户(subscriber)不但能随时随地与期望的对方进行通信,而且还能以文本、语音或图像的形式经由无线互联网接入来接收各种类型的日常信息(如新闻、天气、体育、股票、汇率、交通)。
由于近来通信技术的发展,移动通信服务从语音通信服务转移到用于传输例如电路数据或包数据的多媒体通信服务。近来,已经从常规的IS-95A和IS-95B网络演化出了IS-95C网络,其能够以高达307.2Kbps的数据传输速率来提供无线互联网服务,该数据传输速率远大于常规网络所支持的数据传输速率(14.1Kbps和56Kbps)。具体地来讲,IMT-2000服务不但能够改进常规语音通信和WAP服务的质量,而且还能够以更高的速率来提供各种多媒体服务(如音频点播、视频点播)。
近来,回铃音或彩铃回铃音服务正备受关注。这些服务经由通信终端为发讯者(originator)提供经收讯者(recipient)选择了的各种音源作为回铃音。具体地讲,用收讯者已经记录的各种类型的音乐或声音(如流行音乐、自然的声音)等来代替常规的机械且单调的回铃音。在收听这些新颖的回铃音时,发讯者获得了特殊的印象。
然而,当前的回铃音服务存在这样的问题:输出的音源没有出色的质量,并且如果在为提供回铃音而传输音源数据时丢失了帧,则移动通信终端不能意识到这种丢失。这导致了错误的解码。
发明内容
因此,提出本发明来解决现有技术中出现的上述问题,并且本发明的目的在于提供一种音频数据包格式,该音频数据包格式用于利用MPEG-4 HE-AAC音频编解码帧,经由语音信道来传输音频数据(如,回铃音),从而改进音频数据的质量。
本发明的另一目的在于提供一种方法,该方法通过在MPEG-4HE-AAC音频编解码帧被分割为语音时隙数据后被传输时添加序号字段而快速且准确地解码音频数据包。
本发明的另一目的在于提供一种通过以下步骤来校正编解码器安装错误的方法以及一种适于以该方法来校正编解码器安装错误的移动通信终端:基于语音时隙数据的序号,识别用来对插入到该语音时隙数据的数据字段中的音源数据进行编码的编解码器;以及当移动通信终端中安装的编解码器不同于用来对音源数据进行编码的编解码器时对编解码器安装错误进行校正。
为了实现该目的,本发明提供了一种音频数据包格式,该音频数据包格式包括:第一字段,用于包含要传输的预定大小的音频数据,该音频数据是从音频帧中分割出的;以及第二字段,用于指定分割成的音频数据的顺序,其中该音频帧基于MPEG-4 HE-AAC(高效高级音频编码)方案。
本发明的另一方面提供了一种用于对音频数据包进行解码的方法,该音频数据包具有用于包含从音频帧中分割出的预定大小的音频数据的第一字段和用于指定分割成的音频数据的顺序的第二字段,该方法包括下述步骤:(a)利用移动通信终端的解码器来初始化参考序号;(b)检查接收到的音频数据的第二字段,以确认是否发送了该音频帧的第一位流;(c)如果发送了新音频帧的第一位流,则对当前接收的数据之前的数据进行解码;(d)存储当前接收到的数据;(e)重置该参考序号;以及(f)返回步骤(b)。
本发明的另一方面提供了一种通过在移动通信终端中安装有多媒体音频编解码器时对从移动通信网络接收的语音时隙数据进行分析,并识别用于对插入到该语音时隙数据的数据字段中的音源数据进行编码的编解码器以确认移动通信终端与移动通信网络是否具有相同的编解码器,来校正移动通信终端中的编解码器安装错误的方法,该方法包括以下步骤:(a)检查插入在每个接收到的语音时隙数据的数据字段中的序号,并且当该语音时隙数据不是按顺序被接收时,确定存在编解码器安装错误;以及(b)当确定了存在编解码器安装错误时,用语音编解码器来代替多媒体音频编解码器。
本发明的另一方面提供了一种通过在移动通信终端中安装有语音编解码器时对从移动通信网络接收的语音时隙数据进行分析,并识别用于对插入到该语音时隙数据的数据字段中的音源数据进行编码的编解码器以确认移动通信终端与移动通信网络是否具有相同的编解码器,来校正移动通信终端中的编解码器安装错误的方法,该方法包括以下步骤:(a)检查插入在每个接收到的语音时隙数据的数据字段中的序号SEQ,并且当语音时隙数据是按顺序被接收时,确定存在编解码器安装错误;以及(b)当确定了存在编解码器安装错误时,用多媒体音频编解码器来代替语音编解码器。
本发明的另一方面提供了一种通过对从移动通信网络接收的语音时隙数据进行分析,并识别用于对插入到该语音时隙数据的数据字段中的音源数据进行编码的编解码器以确认移动通信终端与移动通信网络是否具有相同的编解码器,来校正编解码器安装错误的移动通信终端,该移动通信终端包括:语音编解码器,用于对在语音通信期间插入在语音时隙数据中并传输的语音数据进行解码和输出;多媒体音频编解码器,用于对由提供CRBT(彩铃回铃音)服务的CRBT服务器发送的音乐数据进行解码和输出,该音乐数据是插入在语音时隙数据中并传输的;以及编解码器控制单元,用于执行第一功能和第二功能,第一功能为:当从该移动通信网络接收到通知语音通信开始的控制消息时驱动该语音编解码器;当接收到通知回铃音发送的控制消息时驱动该多媒体音频编解码器;当在该多媒体音频编解码器运行时接收到该语音时隙数据时检查插入在每个接收到的语音时隙数据的数据字段中的序号;当该语音时隙数据不是按顺序被接收时确定存在编解码器安装错误;限制该多媒体音频编解码器的运行;以及使该语音编解码器运行,第二功能为:当在该语音编解码器运行时接收到该语音时隙数据时,检查插入在每个接收到的语音时隙数据的数据字段中的序号;当该语音时隙数据是按顺序被接收时确定存在编解码器安装错误;限制该语音编解码器的运行;以及驱动该多媒体音频编解码器。
附图说明
通过以下结合附图进行的详细描述,本发明的上述和其他目的、特征和优点将变得更明显,附图中:
图1示出了常规EVRC数据包的构造;
图2示出了根据本发明的音频数据包格式的构造;
图3示出了包括帧边界部分标识符的音频数据包格式的例子;
图4是示出根据本发明的用于对音频数据包进行解码的方法的流程图;
图5是示出根据本发明优选实施方式的用于对提供回铃音服务的移动通信终端中的编解码器安装错误进行校正的方法的流程图,其中,当移动通信终端中已安装了HE-AAC编解码器时,使用序号字段来检查移动通信系统和移动通信终端是否具有相同的编解码器;
图6是示出根据本发明优选实施方式的用于对提供回铃音服务的移动通信终端中的编解码器安装错误进行校正的方法的流程图,其中,当移动通信终端中已安装了EVRC时,使用序号字段来检查移动通信系统和移动通信终端是否具有相同的编解码器;而
图7简要示出了根据本发明优选实施方式的适于在提供回铃音服务的同时对编解码器安装错误进行校正的移动通信终端的构造。
具体实施方式
以下,将参照附图来描述本发明的优选实施方式。在下面的描述和附图中,相同的参考标号用于指示相同或相似的组件,因此将省略对相同或相似的组件的重复描述。
图1示出了常规EVRC数据包的构造。
大多数移动通信终端都采用了具有可变传输速率的语音编解码器,如EVRC(增强型可变速率编解码器),以便经由优化的无线信道来提供有效的语音通信。EVRC对数字移动通信系统所使用的语音进行数字转换,并且具有8Kbps的传输速率。EVRC可以有效地防止声音质量的劣化。此外,EVRC根据信息量可变地对语音信息进行编码。具体地来讲,当信息量较小时(即,谈话者沉默时),EVRC以低速率对语音进行编码,而当信息量较大时,以高速率进行编码。这样,EVRC与编码速率恒定的情况相比具有更好的语音编码效率。这扩展了移动通信系统的容量并减小了功耗。
图1示出了EVRC所用数据包的构造。尽管实际的EVRC数据包包括80字节的两个旁路帧(bypass frame),但是为了简明在图1中仅示出了一个帧。
旁路帧包括32位的前导字段、32位的消息报头字段、352位的编码包数据字段、194位的哑(dummy)字段以及30位的CRC(循环冗余校验)字段。编码包数据字段包括8字节的报头字段、34字节的语音包字段以及2字节的哑字段。语音包字段包括171位的有效载荷字段和101位的哑字段,使得压缩的音源数据可以加载到有效载荷字段上。
这样,EVRC数据包的被实际数据占据的部分对应于171位。根据本发明,用于音频数据传输的HE-AAC帧包括在这一部分中并被传输,以便改善音频数据(例如,回铃音)的质量。
这里使用的AAC(高级音频编码)是指一种数字音频信号的编码方案,并且已经被宣布为基于ISO/IEC的MPEG的国际标准。AAC帧具有取决于压缩率的可变大小。这意味着整个文件容量可以显著减小。与MP3文件相比,AAC帧的文件容量可以减小到30%。此外,AAC帧采用了TNS(暂态噪声整形)和预测技术从而改善了声音质量。TNS是量化校正技术之一,并且可以智能地减少当连续模拟数据被转换成0和1的数字数据时所出现的错误,从而减少噪声并再现出近似原声。预测技术存储经TNS校正的数字值。具体地来讲,存储之前经过校正的信息并且稍后在出现相同类型的数据时使用。当声音在量化处理期间变为具有不同校正值时,可能将其视为不同的声音。预测技术避免了这种情况。这样,AAC具有优于MP3的声音质量。
由于性能优良且质量高,AAC已经被MPEG-4、3GPP以及3GPP2标准所采用,并且作为用于互联网、无线和数字广播领域的一种新型音频编解码器而备受关注。此外,已经从AAC演进出了MPEG4 HE-AAC(以下称为HE-AAC),其即使在低传输速率下也能够提供CD级别的声音质量。人们期望的是,如果将HE-AAC编解码器应用于例如回铃音服务,则它能够保证非常高的声音质量。
为了将HE-AAC编解码器应用到例如回铃音服务,实时解码所需的数据传输速率应当符合CDMA语音通信信道的传输速率。此外,应当把HE-AAC帧分割为多个位流(bit stream)并根据CDMA语音通信信道的时隙(slot)结构来传输。具体地来讲,按照CDMA语音通信信道所要求的8Kbps的传输速率和信道时隙结构,多达171位的信息应当传输20ms。
图2示出了根据本发明的语音数据包格式的构造。
如果要按照用于CDMA语音通信信道的EVRC数据包格式来传输HE-AAC帧,则该帧应当包括在如图1所示的有效载荷字段中。HE-AAC帧具有可变长度,并且被分割为可经由20ms时隙来传输的大小。然后,通过无线链路以位流来传输该帧。在传输到移动通信终端后,HE-AAC位流经该终端组合,并且重构为HE-AAC帧。
在传输HE-AAC位流的过程中,基站控制器向每个位流中添加1位的复用速率模式信息(字段M)、12位的CRC信息以及8位的编码器尾部(tail)信息(字段T)。
为了将HE-AAC帧有效地映射到CDMA语音信道时隙上,应当以字节为单位来进行处理。为了进行这种映射,使用了数据字段(171位)的168位(21字节),而其余3位数据区保留为可作他用的剩余空间。根据本发明,该剩余空间用作序号字段SEQ。
重要的是,单个CDMA语音时隙包括整个HE-AAC帧。因此,HE-AAC帧应当被分割为至少一个位流并被传输。在该过程中,同一CDMA语音时隙内可能连续出现两个HE-AAC帧。由移动通信终端的解码器来区分连续的HE-AAC帧,该解码器搜索作为用于区分帧的标识符的ADTS(音频数据传送流)。
ADTS报头基本上包括在HE-AAC帧中。ADTS报头包括:12位的Syncword字段;1位的ID字段;2位的Layer字段;1位的Protection_Absent字段;2位的Profile_ObjectType字段;1位的Private_bit字段;4位的Sampling_Frequency_Index字段;3位的Channel_Configuration字段;1位的Home字段;以及1位的Original/Copy字段。
移动通信终端的解码器没有掌握与ADTS报头位于所接收的数据的哪个部分有关的任何信息。因此,解码器要检查每个接收数据的帧区分标识符。这就增加了处理负荷。即使无线信道环境变差并且传输包丢失,移动通信终端的调制解调器也会向仍然不知道传输包丢失的解码器发送错误数据。结果,帧的长度或内容可能在HE-AAC解码过程中发生变化。
因此,为了校正由于无线信道错误而产生的解码错误,有效地区分HE-AAC帧,并且指定单个HE-AAC帧所分割成的多个位流的顺序,将有效载荷(171位)中的3位(空闲位)指定为序号字段SEQ。这解决了由于帧区分以及解码错误而导致的负载增大的问题。
例如,序号字段SEQ可以包含从“000”到“111”的二进制数位(digit)。信息“000”被插入到包含新开始的HE-AAC帧的时隙中。同一HE-AAC帧的下一语音时隙被赋予增大了1的值。当该下一HE-AAC帧被插入到语音时隙中时,其被再次指定为“000”。
基于序号,移动通信终端的解码器可以容易地确定包括HE-AAC帧的语音时隙是否丢失,并且容易地获得与下一HE-AAC的开始有关的信息(即,语音时隙数据的哪个部分包括ADTS报头)。由于SEQ字段的位置是固定的,所以解码器搜索接收到的数据,如果SEQ字段已被指定为“000”,则确定ADTS报头在相应位流的前端。
总而言之,本发明采用了EVRC格式来传输音频数据包。被指定为有效载荷字段的整个区的第一字段被用于传输数据,而第二字段被用于传输序号。在接收到音频数据包后,移动通信终端可以容易地确定HE-AAC帧是否有丢失,清楚地彼此区分各帧,并且快速重构出HE-AAC帧。例如,为第一字段分配168位,而为第二字段分配3位。
图3示出了包括帧边界部分标识符的音频数据包格式的例子。
作为区分HE-AAC帧的标识符的ADTS报头位于第一位流(即,SEQ字段被指定为“000”的位流)的前端。这样,SEQ字段被用于区分各帧,从而如果包括ADTS报头的时隙丢失,则可以通过简单地检查序号字段来定位该时隙,而不必在丢失的时隙后的所有语音时隙内搜索数据流。
图4是示出根据本发明的用于对音频数据包进行解码的方法的流程图。
移动通信终端的解码器对参考序号值进行初始化,该参考序号值用于区分各帧或指定位流的顺序(S101)。
在从移动通信网络接收到音频数据时(S103),解码器检查接收到的数据的序号字段SEQ,并且确认序号是否为0或000(二进制数位),这意味着接收到了新的帧(S105)。
如果确认了序号为0,则解码器检查ADTS报头(S107),并且将ADTS报头信息之前的所有数据都存储在缓冲器中(S109)。然后,解码器通过组合(coupling)存储在缓冲器中的语音数据来进行解码(S111)。
解码器将包括ADTS报头的剩余信息存储在缓冲器中(S113),并且重置参考序号,使得在接收到下一HE-AAC帧时,可以将其序号与该参考序号进行比较(S115)。在此情形下,参考序号被更改为当前接收数据中包括的序号。
在重置了参考序号后,解码器等待直到接收到下一数据为止(S103)。然后,重复随后的步骤。
如果在步骤S105确认了接收到的数据的序号不为0,则解码器检查当前接收到的位流的序号是否等于参考序号加1(S117)。在此情形下,即,如果确认了当前接收到的位流属于和先前接收到的位流相同的帧并紧跟着它,则解码器存储接收到的数据(S119)。解码器将参考序号更改为当前接收到的位流的序号(S121),并返回步骤S103。
如果在步骤S117确认了当前接收到的位流的序号不等于参考序号加1,则解码器确定数据传输中出现了错误,并删除接收到的数据(S123)。然后,解码器重置参考序号(S125)。具体地来讲,将参考序号更改为序号字段可以表示的最高值,从而由于出现了错误,所以在接收到新的HE-AAC帧之前不开始解码。
尽管附图中没有示出,但是根据本发明的优选实施方式,还可以接收数据,将其序号与参考序号进行比较,并且将丢失的序号(如果有的话)通知给交换机(exchanger),使得可以重传所丢失的数据。
上述方法的优点在于,可以防止帧的内容或长度在解码过程中由于HE-AAC帧的丢失而发生变化。此外,通过定位包括ADTS报头信息的CDMA语音时隙,可以减少移动通信终端所需的处理量。
然而,将该方法应用于回铃音服务可能导致下面的问题。
当提供回铃音服务时,在回铃音部分中使用多媒体音频编解码器(例如,HE-AAC),而在语音部分中使用语音编解码器(例如,EVRC)。如果移动通信终端的编解码器安装不同于系统的编解码器安装,则无论该方案可能多有效服务都不能成功。
因此,下面将描述一种利用序号字段来校正移动通信终端中的编解码器安装错误的方法。
图5是示出根据本发明优选实施方式的用于对提供回铃音服务的移动通信终端中的编解码器安装错误进行校正的方法的流程图,其中,当移动通信终端中已经安装了HE-AAC编解码器时,使用序号字段来检查移动通信系统和移动通信终端是否具有相同的编解码器。
如参照图2和3所述的,如果分布在并映射到CDMA语音时隙中的数据是经HE-AAC编解码器编码的HE-AAC帧,则从移动通信网络传输到移动通信终端的每个CDMA语音时隙数据都具有按顺序指派给它的序号。
因此,移动通信终端搜索CDMA语音时隙数据的序号字段,如果CDMA语音时隙数据不是以正确顺序被接收的,则确定编解码器的安装中出现了错误,然后用语音编解码器(即,EVRC编解码器)来代替它。
更具体地来讲,在从基站接收到CDMA语音时隙数据时(S500),移动通信终端将已插入在接收到的CDMA语音时隙数据的数据字段中的序号字段的序号SEQ指定为参考序号Bseq,并初始化编解码器计数Ecount(S502)。
在接收到下一CDMA语音时隙数据时(S504),终端确定接收到的CDMA语音时隙数据的序号SEQ是否比参考序号Bseq大1(S506)。如果不是,则终端确定序号SEQ是否为“000”(S508)。
如果序号SEQ不为“000”,则终端使编解码器计数增加1(S510),并且确定编解码器计数是否等于或大于预定数N(S512)。
如果确定了编解码器计数等于或大于该预定数N,则终端确认存在编解码器安装错误。然后,终端用语音编解码器(即,EVRC编解码器)来代替当前安装的HE-AAC编解码器(S516)。
如果在步骤S506确定了序号SEQ比参考序号Bseq大1,如果在步骤S508确定了序号SEQ为“000”,或如果在步骤S512确定了编解码器计数小于预定数N,则终端将接收到的序号SEQ指定为参考序号Bseq(S514),并进行到步骤S504。
预定数N被选择为,可以将编解码器安装错误与CDMA语音时隙数据的丢失区分开,并且优选地等于或大于2。
图6是示出根据本发明优选实施方式的用于对提供回铃音服务的移动通信终端中的编解码器安装错误进行校正在的方法的流程图,其中,当移动通信终端中已安装了EVRC时,使用序号字段来检查移动通信系统和移动通信终端是否具有相同的编解码器。
在按顺序接收到CDMA语音时隙数据至少预定次数后,移动通信终端确认移动通信系统的编解码器是HE-AAC编解码器,并用该HE-AAC编解码器来代替当前安装的EVRC编解码器。
更具体地来讲,在从基站接收到CDMA语音时隙数据后(S600),移动通信终端将已插入在接收到的CDMA语音时隙数据的数据字段中的序号字段的序号SEQ指定为参考序号Bseq,并且初始化编解码器计数Ecount(S602)。
在接收到下一CDMA语音时隙数据时(S604),终端确定接收到的CDMA语音时隙数据的序号是否比参考序号Bseq大1(S606)。如果是,则终端使编解码器计数增加1(S608),并且确定编解码器计数Ecount是否等于或大于预定数N(S612)。
如果在步骤S606确定了序号SEQ不比参考序号Bseq大1,则终端确定序号SEQ是否为“000”(S610),如果是,则进行到步骤S612。
如果在步骤S610确定了序号SEQ不为“000”,或者在步骤S612确定了编解码器计数Ecount小于预定数N,则终端将接收到的序号SEQ指定为参考计数,并且进行到步骤S604(S614)。
如果在步骤S612确定了编解码器计数Ecounter等于或大于预定数N,则终端确认移动通信系统的编解码器是HE-AAC编解码器,并用HE-AAC编解码器来代替当前移动通信终端中已安装的EVRC语音编解码器(S616)。
图7简要示出了根据本发明优选实施方式的适于在提供回铃音服务的同时对编解码器安装错误进行校正的移动通信终端的构造。
根据本发明的优选实施方式的适于在提供回铃音服务的同时对编解码器安装错误进行校正的移动终端包括RF信号处理单元700、信道解码器710、信号处理单元720、编解码器控制单元730、语音编解码器740和多媒体音频编解码器750。
RF信号处理单元700适于将经由天线接收到的无线信号转换为数字信号。信道解码器710适于对从RF信号处理单元700接收到的数字信号进行解码,从而将它们分割为信号部分和数据部分。信号部分被传输给信号处理单元,而数据部分被传输给编解码器控制单元730。
在从移动通信网络接收到通知语音通信开始的控制消息(警告信息消息)时,编解码器控制单元730驱动语音编解码器750。在接收到通知发送了回铃音的控制消息(通知安装了多媒体音频编解码器的数据突发消息)时,编解码器控制单元730驱动多媒体音频编解码器740。
具体地来讲,如果编解码器控制单元730在驱动多媒体音频编解码器740的同时接收到了语音时隙数据,则它检查插入在每个接收到的语音时隙数据的数据字段中的序号。如果语音时隙数据不是以正确顺序被接收的,则编解码器控制单元730确定存在编解码器安装错误。然后,编解码器控制单元730限制对音频编解码器740的驱动,并且按照与上面参照图4所述相同的方法来驱动语音编解码器750(第一功能)。
如果编解码器控制单元730在驱动语音编解码器750的同时接收到了语音时隙数据,则它检查插入在每个接收到的语音时隙数据的数据字段中的序号。如果语音时隙数据是以正确顺序被接收的,则编解码器控制单元730确定存在编解码器安装错误。然后,编解码器控制单元730限制对语音编解码器750的驱动,并且按照与参照图5所述相同的方式来驱动多媒体音频编解码器740(第二功能)。
语音编解码器740适于对在语音传输期间被插入到语音时隙数据的情况下传输的语音数据进行解码。EVRC编解码器优选地用作语音编解码器740。
多媒体音频编解码器750适于对由提供CRBT服务的CRBT服务器发送的音乐数据进行解码。尽管可以使用任何类型的音频编解码器作为多媒体音频编解码器750,但是优选地使用HE-AAC编解码器。
尽管已经出于例示的目的而描述了本发明的优选实施方式,但是本领域技术人员应该认识到,在不脱离如所附权利要求书中公开的本发明的范围和主旨的情况下可以进行各种更改、添加和替换。
工业实用性
如上所述,本发明的优点在于,通过使用音频服务的HE-AAC模式(例如,回铃音、彩铃回铃音),音频信号的质量得到了显著改善。此外,在传输HE-AAC帧时使用EVRC数据格式并应用序号减少了解码HE-AAC帧所需的时间。此外,即使数据丢失,也可以快速定位。这减少了服务时间并增大了速率。
改进的用于在HE-AAC帧之间加以区分的边界搜索和解码器的更高稳定性保证了有效的回铃音服务。
此外,即使由于在对回铃音部分使用多媒体音频编解码器而对语音通信部分使用语音编解码器的回铃音服务的情况下处理呼叫时所出现的错误而导致移动通信网络所用的编解码器不同于移动通信终端所用的编解码器,移动通信终端也可以自己做出适当的判决,并更改编解码器安装,从而可以无中断地提供回铃音服务。

Claims (7)

1.一种生成包括第一字段和第二字段的音频数据包的方法,该方法包括以下步骤:
将要发送的预定大小的音频数据映射到第一字段,该音频数据是以字节从音频帧中分割出的;以及
将分割成的音频数据的顺序映射到第二字段,
其中,所述音频帧是基于多媒体音频编解码器方案的帧。
2.根据权利要求1所述的方法,其中该音频帧包含在EVRC(高级可变速率编解码器)数据包的有效载荷字段中。
3.根据权利要求1所述的方法,其中该多媒体音频编解码器方案是MPEG-4HE-AAC(高效高级音频编码)方案。
4.根据权利要求1所述的方法,其中当分配给第二字段的值表示该音频帧的第一分割数据时,第一字段包括ADTS(音频数据传送流)报头。
5.一种用于对音频数据包进行解码的方法,该音频数据包具有用于包含从音频帧中分割出的预定大小的音频数据的第一字段和用于指定分割成的音频数据的顺序的第二字段,该方法包括以下步骤:
(a)利用移动通信终端的解码器来初始化参考序号;
(b)检查接收到的音频数据的第二字段,以确认是否接收了该音频帧的第一位流;
(c)如果接收了该音频帧的第一位流,则对当前接收到的数据之前的数据进行解码;
(d)存储当前接收到的数据;
(e)将该参考序号更改为当前接收到的数据的第二字段中所设置的值;以及
(f)返回步骤(b)。
6.根据权利要求5所述的方法,该方法还包括以下步骤:
(g)如果在步骤(b)中确认没有接收到所述音频帧的第一位流,则确认当前接收到的位流是否紧随先前接收到的位流而传输的;
(h)如果当前接收到的位流是紧随先前接收到的位流而传输的,则存储接收到的数据;
(i)将该参考序号更改为当前接收到的数据的第二字段中所设置的值;以及
(j)返回步骤(b)。
7.根据权利要求6所述的方法,该方法还包括以下步骤:
(k)如果在步骤(g)中确认为当前接收到的位流不是紧随先前接收到的位流而传输的,则删除接收到的数据;以及
(1)将该参考序号更改为能够在第二字段中设置的最大值并返回步骤(b)。
CN2006800449372A 2005-10-31 2006-10-31 音频数据包格式及其解码方法、校正移动通信终端编解码器安装错误的方法以及执行该方法的移动通信终端 Expired - Fee Related CN101322375B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
KR1020050103033 2005-10-31
KR10-2005-0103033 2005-10-31
KR1020050103482A KR100668686B1 (ko) 2005-10-31 2005-10-31 이동통신 단말기에서의 코덱 설정 오류 수정 방법 및 이를수행하는 이동통신 단말기
KR10-2005-0103482 2005-10-31
KR1020050103033A KR100706968B1 (ko) 2005-10-31 2005-10-31 오디오 데이터 패킷 생성 장치 및 이의 복조 방법
KR1020050103482 2005-10-31
PCT/KR2006/004487 WO2007066897A1 (en) 2005-10-31 2006-10-31 Audio data packet format and decoding method thereof and method for correcting mobile communication terminal codec setup error and mobile communication terminal performing same

Publications (2)

Publication Number Publication Date
CN101322375A CN101322375A (zh) 2008-12-10
CN101322375B true CN101322375B (zh) 2012-04-04

Family

ID=38161745

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800449372A Expired - Fee Related CN101322375B (zh) 2005-10-31 2006-10-31 音频数据包格式及其解码方法、校正移动通信终端编解码器安装错误的方法以及执行该方法的移动通信终端

Country Status (2)

Country Link
KR (1) KR100706968B1 (zh)
CN (1) CN101322375B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100746050B1 (ko) 2006-06-09 2007-08-06 에스케이 텔레콤주식회사 오디오 코덱의 프레임 구성 방법
KR101200825B1 (ko) * 2009-12-21 2012-11-22 서울대학교산학협력단 가청주파수 대역 음향통신에서의 데이터 수신에러 감소 시스템 및 방법, 그리고 이에 적용되는 장치
KR20120084237A (ko) 2011-01-19 2012-07-27 삼성전자주식회사 엠엠티(mmt)에서 엠엠티 인캡슐레이터를 전송하는 방법
CN103219009A (zh) * 2012-01-20 2013-07-24 旭扬半导体股份有限公司 音频数据处理装置及其方法
CN103474073B (zh) * 2012-06-07 2016-08-24 晨星软件研发(深圳)有限公司 音频解码方法及音频解码装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1160328A (zh) * 1995-11-22 1997-09-24 德来怀通用仪器公司 封包数据流中所携带的声频数据的获取和错误恢复
EP1355471A2 (en) * 2002-04-16 2003-10-22 Microsoft Corporation Error resilient windows media audio coding

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6985856B2 (en) * 2002-12-31 2006-01-10 Nokia Corporation Method and device for compressed-domain packet loss concealment
KR100566298B1 (ko) * 2003-08-18 2006-03-30 에스케이 텔레콤주식회사 가입자 기반 링백톤 서비스의 채널 코딩 적응형 음원 변환처리방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1160328A (zh) * 1995-11-22 1997-09-24 德来怀通用仪器公司 封包数据流中所携带的声频数据的获取和错误恢复
EP1355471A2 (en) * 2002-04-16 2003-10-22 Microsoft Corporation Error resilient windows media audio coding

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Sang-Uk Ryu et al..《Effective high frequency regeneration based on sinusoidal modeling for MPEG-4 HE-AAC》.《IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, 2005.》.2005,211-214. *
Sang-UkRyuetal..《EffectivehighfrequencyregenerationbasedonsinusoidalmodelingforMPEG-4HE-AAC》.《IEEEWorkshoponApplicationsofSignalProcessingtoAudioandAcoustics 2005.》.2005

Also Published As

Publication number Publication date
KR100706968B1 (ko) 2007-04-12
CN101322375A (zh) 2008-12-10

Similar Documents

Publication Publication Date Title
EP1946517B1 (en) Audio data packet format and decoding method thereof and method for correcting mobile communication terminal codec setup error and mobile communication terminal performing same
CN100420229C (zh) 在数字通信系统中交替进行语音和数据传输的方法
EP1711024B1 (en) Apparatus and method for switching a voice codec of a mobile terminal
FI96650B (fi) Menetelmä ja laitteisto puheen välittämiseksi tietoliikennejärjestelmässä
CN101536088B (zh) 用于提供冗余管理的系统和方法
CN101322375B (zh) 音频数据包格式及其解码方法、校正移动通信终端编解码器安装错误的方法以及执行该方法的移动通信终端
JP2007074751A (ja) 第1および第2の通信ネットワーク間で信号を伝送する伝送方法、移動局および移動体通信システム
JP2000091922A (ja) 源符号化器を選択するための送受信器及びかかる送受信器において実行される方法
KR100769511B1 (ko) 데이터 프레임 사이즈를 조정하기 위한 선택적인 가변레이트 인코딩
KR20020073578A (ko) 레이트 결정 코딩
US7149198B2 (en) System and method for voice processing and transporting in a protocol independent tandem free operation manner
EP1829027A1 (en) Method and device for encoding mode changing of encoded data streams
EP0875106A1 (en) A self-initialized coder and method thereof
KR100793320B1 (ko) 멀티미디어 링백톤 대체음 서비스에서 부가 정보를 이용한오디오 데이터 전송 방법, 시스템 및 장치
KR100723679B1 (ko) 착신 대기음 구간에서 cdma 이동통신망의 음성슬롯데이터 구조를 이용해 he aac 비트스트림을 전송하는방법
US20050147131A1 (en) Low-rate in-band data channel using CELP codewords
KR100668686B1 (ko) 이동통신 단말기에서의 코덱 설정 오류 수정 방법 및 이를수행하는 이동통신 단말기
KR100738914B1 (ko) 지에스엠망에서의 멀티미디어 링백톤 대체음 서비스 제공방법, 시스템, 서버 및 그를 위한 이동 단말기
KR100747712B1 (ko) 멀티미디어 링백톤 대체음 서비스를 위한 오디오 데이터전송 방법, 시스템 및 장치
KR100793294B1 (ko) 광대역 코드 분할 다중화 시스템에서 멀티미디어 링백톤대체음 서비스를 위한 오디오 프레임 생성 방법, 시스템 및장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120404

Termination date: 20191031

CF01 Termination of patent right due to non-payment of annual fee