CN101170590A - 一种背景噪声的编码码流传输的方法、系统及装置 - Google Patents
一种背景噪声的编码码流传输的方法、系统及装置 Download PDFInfo
- Publication number
- CN101170590A CN101170590A CN 200610150441 CN200610150441A CN101170590A CN 101170590 A CN101170590 A CN 101170590A CN 200610150441 CN200610150441 CN 200610150441 CN 200610150441 A CN200610150441 A CN 200610150441A CN 101170590 A CN101170590 A CN 101170590A
- Authority
- CN
- China
- Prior art keywords
- layer
- code stream
- encoding code
- background noise
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 239000010410 layer Substances 0.000 claims abstract description 149
- 239000012792 core layer Substances 0.000 claims abstract description 64
- 230000006854 communication Effects 0.000 claims abstract description 51
- 238000004891 communication Methods 0.000 claims abstract description 50
- 230000000694 effects Effects 0.000 claims abstract description 13
- 230000005540 biological transmission Effects 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 11
- 238000005728 strengthening Methods 0.000 abstract 4
- 238000005516 engineering process Methods 0.000 description 5
- 238000005086 pumping Methods 0.000 description 5
- 239000002131 composite material Substances 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005538 encapsulation Methods 0.000 description 3
- 230000005284 excitation Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 238000009432 framing Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 208000019901 Anxiety disease Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明实施例公开了一种背景噪声的编码码流传输的方法,该方法为:发送端以一编码速率通过通信信道向接收端发送背景噪声的编码码流,所述编码码流包含的编码层包括核心层和一个以上的增强层,所述核心层包含使接收端以该核心层对应的编码速率解码时能将该背景噪声独自恢复出来的编码参数,所述增强层包含增强该层以前的编码层编码效果的编码参数;接收端接收到背景噪声的编码码流后,根据该编码码流包含的层数确定解码速率并以该速率对所述编码码流进行解码。本发明实施例还公开了一种背景噪声的编码码流传输的系统及装置。采用本发明,接收端能够对编码质量进行灵活的选择和控制。
Description
技术领域
本发明涉及语音通信领域,尤其涉及一种背景噪声的编码码流传输的方法、系统及装置。
背景技术
在语音通信中,对语音的处理主要由语音编解码器来完成,最初的语音编解码器都是定速率的,即每一种语音编码器只有一个固定的速率。这些传统的定速率语音编码器从总体来讲,较高速率的编码算法能较容易的保证编码质量,但占用通信信道资源较大;较低速率的编码算法占用通信信道资源较小,但不太容易保证编码质量。
在语音通信中,由于人发声并不是连续的,大约有70%左右的空闲时间没有讲话,因此始终用同一个速率进行语音编解码显然是对通信信道资源的一种极大的浪费。基于这种考虑,人们在语音编码器中引入了语音激活检测(VoiceActivity Detector,VAD)技术,这种技术能有效区分有话语音和无话语音,在有话语音时用正常的编码速率进行编码,形成语音帧,而无话语音是一些背景噪声和静音,因此可以用简单的编码方式进行处理,形成静音描述(SilenceDescriptor,SID)帧。通过这种变速率的编码方式,有效的降低了整个通话过程的平均编码速率,节省了大量的通信信道资源,而编码质量也得到了较好的保证。
随着编码技术的发展,同一个语音编码器中的语音编码速率并不仅仅局限于针对语音的编码速率和针对背景噪声的编码速率两种。这种编码器可以为语音编码提供多种编码速率,被称为变速率语音编码器。由于变速率语音编码器可以动态的调整编码速率,使得语音通信系统在合成语音质量和系统容量之间能够灵活的折中,因此变速率语音编码器获得了快速的发展。另外,由于音频业务的快速发展,语音编码器不仅仅只处理语音信号,还会处理包括音乐在内的各种音乐信号,而这些音频信号所需要的编码速率也不太一样,因此变速率语音编码器就显得更为重要。
编码器在选择编码速率时的依据主要有两个,一个依据是语音信号本身的特性,即源控,利用VAD技术进行速率的选择就是一个源控的简单例子;另一个依据是通信信道的状况,即信道控。源控的一个典型例子是语音编码器根据语音信号是浊音还是清音,浊音是否稳定等信息对语音信号按照不同的速率进行编码。信道控的典型例子是语音编码器根据信道的状况要求编码器对语音信号按照不同的速率进行编码,若信道状况不好,较为繁忙,为节省带宽,就要求用较低的速率对语音信号进行编码,否则若信道状况较好,不繁忙,带宽充足,就要求用较高的速率对语音信号进行编码,以获得较高的合成语音质量。
传统的变速率语音编码器中,不同的编码速率通常对应不同的编码方式,因此实际的编码码流也就大不相同。而当前最新的语音编码器采用了一种全新的编码速率形成方式,这种编码速率形成方式的基础是编码器输出的语音编码码流是以分层的方式封装成帧,即编码码流由核心层和一个以上的增强层组成,每层为一组编码参数,每组编码参数对应一编码比特数,例如某一语音的编码码流由核心层和11个增强层组成,如图1所示:
层1为占用编码比特数为8kbit的核心层,层2为占用编码比特数为4kbit的窄带增强层,层3~12为占用编码比特数为2kbit的宽带增强层,假如帧速度为每秒传输一帧,则该编码码流包含的层数分别为1~12时,其对应的编码速率分别为8kbit/s、12kbit/s、14kbit/s、16kbit/s、18kbit/s、20kbit/s、22kbit/s、24kbit/s、26kbit/s、28kbit/s、30kbit/s和32kbit/s。基于这种速率形成方式,其各速率是向下兼容的,以速率12kbit/s为例,其包含层1和层2,那么在接收端除了能用12kbit/s速率进行解码外,还可以丢掉层2,保留层1,即用8kbit/s的速率进行解码。
由于这种速率分级的特点,信道不必指示编码器用哪一个速率进行编码,编码器会按32kbit/s的最高速率对语音信号进行编码,然后将这些编码码流按层传送到通信信道,信道依据当前的信道状况,决定接收的层数。若信道状况较好,信道容量较大,不繁忙,那么信道就会将这些编码码流全部接收,即接收所有的编码层;若信道状况较差,较为繁忙,可用容量较小,那么信道的接收能力就受到了限制,只会接收这些编码层中的前一部分,而将后一部分丢掉,如丢掉层7~12,这样就剩下了层6以下的部分,也即接收层1~6,如图2所示。
采用这样的速率控制方式,语音编码器就不必考虑信道的具体情况而对每种语音信号均按32kbit/s速率进行编码,并将这32kbit/s的编码码流分层传送到通信信道,让信道根据实际的信道状况选择实际的传输速率,因此这种速率选择的信道控的方式简化了交互的过程,使得信道对编码速率的控制更加灵活。
在当前的语音编码器中,在解码端,背景噪声的合成原理与语音的合成原理相同。语音的合成原理是:语音s(n)可以看成是一个激励信号e(n)激励一个合成滤波器v(n)所产生的输出,即s(n)=e(n)*v(n),这就是语音产生的数学模型。在合成背景噪声时用的也是这个模型,所以背景噪声编码码流中所传输的描述背景噪声和静音特性的特征参数内容与语音编码码流中的特征参数基本相同,为信号合成时的合成滤波器参数和激励参数。
在语音编码码流中,合成滤波器参数主要为线谱频率(Line SpectiumFrequence,LSF)量化参数,而激励信号参数包括:基音延迟参数、基音增益参数、固定码本参数和固定码本增益参数。不同的编码器,这些参数的量化比特数和量化形式有所不同;相同的编码器,如果其包含多个速率,在不同速率下,由于描述信号特性的侧重点不同,编码参数的量化比特数和量化形式也有所不同。
与语音编码参数不同,背景噪声编码参数描述的是背景噪声特性,由于背景噪声的激励信号可以认为是简单的噪声随机序列,而这些序列在编解码端均可以简单的用随机噪声产生模块产生,然后用能量参数控制这些序列的幅度,就可产生最终的激励信号,因此激励信号特征参数可以简单的用能量参数来表示,而不需要用其它的一些特征参数来进一步描述,所以在背景噪声编码码流中,其激励参数为当前背景噪声帧的能量参数,这与语音帧不同;与语音帧相同的是,背景噪声编码码流中的合成滤波器参数也为线谱频率LSF量化参数,只是具体的量化方法有所差别。通过以上分析,也可以认为背景噪声编码码流本质上就是一种低速率的“语音”编码码流。
各变速率语音编码器中针对语音或音频信号的速率较多,而在处理背景噪声时,由于背景噪声编码帧描述的只是当前语音通信环境的背景噪声,它并不是通信的主体,因此编码器在设计自己的背景噪声编码帧时都较为简单,速率较低,只是对背景噪声的一些简单信息进行了编码,在解码端恢复出来的背景噪声只是一个大致的编码端背景噪声的模拟,并不十分精确。因此也可以理解为针对背景噪声编码的编码方式实际上就是一种简单的低速率语音编码方式。
在变速率语音编码器中都有专门针对背景噪声编码的编码速率,但是每一个编码器中针对背景噪声进行编码的速率均只有一个,在对背景噪声进行编码时,每一种编码器只用同一个固定的噪声编码速率也即同一种噪声编码帧来对背景噪声进行编码。
在带宽资源充足时,对通信双方来讲,最重要的是通信的质量,在通话时,需要用高质量的编码方式对话音进行编码,在不通话时也需要用高质量的编码方式对背景噪声进行编码。前一点很容易满足,因为变速率语音编码器有众多的语音编码速率可供编码器选择,但后一点无法满足,因为不管带宽多么充足,对背景噪声进行编码时,编码码流只对应一种编码速率,这样由于编码速率的限制,虽然带宽允许,通信信道只能直接接收发送端发来的背景噪声编码码流,并将该编码码流发送到接收端,接收端也只能用该编码速率进行解码,通信信道和接收端无法对编码质量进行灵活选择和控制。
发明内容
本发明的实施例提供一种背景噪声的编码码流传输的方法、系统及装置,用以解决现有技术中存在的接收端无法对编码质量进行灵活选择和控制的问题。
本发明的实施例提供的一种背景噪声的编码码流传输的方法包括以下步骤:
A.发送端以一编码速率向接收端发送背景噪声的编码码流,
所述编码码流包含的编码层包括核心层和一个以上的增强层,每层包含一组编码参数,每组编码参数对应一编码比特数,所述编码速率是根据所述编码码流包含各层对应的编码比特数确定,所述核心层包含使接收端以该核心层对应的编码速率解码时能将该背景噪声独自恢复出来的编码参数,所述增强层包含增强该层以前的编码层编码效果的编码参数;
B.接收端接收到背景噪声的编码码流后,确定解码层,根据所述解码层确定解码速率并以该速率对所述编码码流进行解码。
本发明的实施例提供的一种背景噪声的编码码流传输的系统,该系统包括:
编码器,用于以一编码速率向解码器发送背景噪声的编码码流,所述编码码流包含的编码层包括核心层和一个以上的增强层,每层包含一组编码参数,每组编码参数对应一编码比特数,所述编码速率是根据所述编码码流包含各层对应的编码比特数确定,所述核心层包含使接收端以该核心层对应的编码速率解码时能将该背景噪声独自恢复出来的编码参数,所述增强层包含增强该层以前的编码层编码效果的编码参数;
解码器,用于接收背景噪声的编码码流,根据接收端当前的处理能力或应用环境确定解码层,根据所述解码层确定解码速率并以该速率对所述编码码流进行解码。
本发明的实施例提供的一种编码器,与解码器相连,该编码器包括:
第一处理单元,用于以一编码速率向解码器发送背景噪声的编码码流,
所述编码码流包含的编码层包括核心层和一个以上的增强层,每层包含一组编码参数,每组编码参数对应一编码比特数,所述编码速率是根据所述编码码流包含各层对应的编码比特数确定,所述核心层包含使接收端以该核心层对应的编码速率解码时能将该背景噪声独自恢复出来的编码参数,所述增强层包含增强该层以前的编码层编码效果的编码参数。
本发明的实施例提供的一种解码器,与编码器相连,该解码器包括:
第二处理单元,用于接收背景噪声的编码码流,根据接收端当前的处理能力或应用环境确定解码层,根据所述解码层确定解码速率并以该速率对所述编码码流进行解码。
与现有技术相比,本发明实施例中发送端以一编码速率将背景噪声的编码码流发送到通信信道,该编码码流包含核心层和一个以上的增强层,该编码码流到达通信信道后,通信信道可根据信道状况对接收编码码流的层数进行选择,将接收的编码码流发送到接收端,接收端还可根据当前的处理能力或应用环境确定解码速率并以该速率对所述编码码流进行解码,所以通信信道和接收端可以对编码质量进行灵活选择和控制。
附图说明
图1为现有技术中语音编码码流的结构示意图;
图2为现有技术中通信信道对接收语音编码码流的层数进行控制的示意图;
图3为本发明实施例中方法的流程示意图;
图4为本发明实施例中背景噪声编码码流的结构示意图;
图5为本发明实施例中中通信信道状况较好时接收背景噪声编码码流的示意图;
图6为本发明实施例中通信信道状况较差时接收背景噪声编码码流的示意图;
图7为现有技术中背景噪声编码帧的比特分配图;
图8为本发明实施例中背景噪声编码帧的比特分配图;
图9为本发明实施例中系统的结构示意图;
图10为本发明实施例中编码器的结构示意图;
图11为本发明实施例中解码器的结构示意图。
具体实施方式
本发明实施例提供一种背景噪声的编码码流传输的处理方法,该方法的核心思想是:发送端将包含核心层和一个以上增强层的背景噪声编码码流发送到通信信道,通信信道根据信道状况对接收编码码流的层数进行选择,将接收的编码码流发送到接收端,接收端根据该编码码流包含的层数确定解码速率并以该速率对所述编码码流进行解码。
参见图3,本发明提供的一种背景噪声的编码码流传输的方法的具体实施流程包括以下步骤:
步骤301:
发送端对背景噪声编码时,对编码码流采用分层的方式封装成帧,封装后的编码码流包含的编码层包括核心层和一个以上的增强层,每层包含一组编码参数,其中核心层包含的编码参数能使接收端以该核心层对应的编码速率解码时能将该背景噪声独自恢复出来,增强层包含的编码参数能够增强该层以前的编码层的编码效果。并且,每组编码参数对应一编码比特数,核心层对应的编码速率为该核心层对应的编码比特数乘以帧速度,其中帧速度为每秒发送的帧数。发送端根据该编码码流中包含的各层对应的编码比特数确定一编码速率,确定方法为该编码码流中包含的各层对应的编码比特数之和乘以帧速度,然后发送端将背景噪声的编码码流以该编码速率发送到通信信道。
步骤302:
发送端发来的编码码流到达通信信道后,通信信道根据当前的信道状况,比如繁忙程度,确定接收该编码码流的层数,即决定接收到背景噪声编码码流的哪一层,并按照该层数接收该编码码流。如果信道状况较差,很繁忙,带宽紧张,就会丢弃增强层,只接收核心层;如果信道状况较好,不繁忙,带宽充足,信道除了接收核心层外,还可以接收增强层。然后通信信道将接收到的编码码流发送到接收端。
步骤303:
接收端接收到通信信道发来的编码码流,首先确定解码层数,解码层数确定后,解码层也就相应确定,例如,若接收端确定的解码层数为3,那么解码层就为核心层、增强层1和增强层2,若接收端确定的解码层数为5,那么解码层就为核心层、增强层1、增强层2、增强层3和增强层4。然后,接收端根据确定的解码层确定解码速率并以该速率对接收到的编码码流进行解码。
若接收端接收到的背景噪声编码码流只包含核心层,那么解码层数为1,解码层就为该核心层,解码速率为该核心层对应的编码速率即该核心层对应的编码比特数乘以帧速度得到的速率;若接收端接收到的背景噪声编码码流包含核心层和增强层,那么接收端根据自身条件确定解码层数,解码层也就相应确定,解码速率为该解码层对应的编码速率即该解码层对应的编码比特数之和乘以帧速度得到的速率,接收端的自身条件主要有两个:
(1)接收端的当前处理能力。在对信号进行编解码时,采用的速率越高,复杂度越大,接收端所需要的处理能力越大,因此在接收端,接收端在对背景噪声编码码流进行解码时也可以依据当前自身的处理能力决定解码层数。若接收端当前的处理能力较小,那么接收端选择的解码层数就较小,相应的解码速率也就较小;若接收端当前的处理能力较强,那么接收端选择的解码层数就较大,相应的解码速率也就较大。这样接收端就可根据其当前的处理能力,灵活的进行解码速率的选择与控制。
(2)接收端的应用环境。不同的应用环境,所需的编码质量也不尽相同,对固定语音通信网络来讲,其所需的编码质量就不如移动语音通信网络的高,因此接收端就可根据当前的网络环境决定解码层数。若接收端当前的环境为固定网络环境,那么其选择的解码层数就较小,对背景噪声编码码流进行解码时的解码速率也就较小;若接收端当前的环境为移动网络环境,那么其选择的解码层数就较大,对背景噪声编码码流进行解码时的解码速率也就较大。这样,在背景噪声编码码流分层的条件下,接收端就可根据当前的应用环境灵活的选择背景噪声解码速率。
下面以一具体实施例对本发明提供的方法进行详细说明:
参见图4,某一背景噪声的编码码流包括核心层和增强层1,其中,核心层对应的编码比特数为m(1)=30bit,增强层1对应的编码比特数为m(2)=5bit,假设每秒(s)传输100帧,则发送端将该编码码流以(30bit+5bit)×100帧/s=3.5kbit/s的编码速率2发送到通信信道。接收端解码时采用核心层对应的编码速率1即30bit×100帧/s=3kbit/s进行解码能独自将背景噪声恢复出来,核心层之后的增强层是对核心层的一个补充,其能有效的增强核心层的编码效果。
现有技术中,语音编码器中用来描述背景噪声编码码流的帧称为SID帧,其速率是1.8kbit/s(每20ms为一帧,每帧35bit,所以速率是1.8kbit/s),具体的帧内容如图7所示。
通过图7,可以发现,SID帧中包括滤波器参数LSF和代表激励特征的能量参数,二者分别用29和6比特编码。本实施例中,可以以该SID帧为基础,将该SID帧设为背景噪声编码码流的核心层,然后在其核心层的基础上,再增加一些能提高编码精度的量化比特,作为增强层1,比如增加额外的能表征背景噪声特性的参数,由于背景噪声编码方式就是一种简单的语音编码方式,因此,可以将语音编码器中的特征参数如基音延迟这一特征参数引入到背景噪声编码方式中来,而具体的基音特征参数的量化方式可以采用5.15kbit/s速率下的基音延迟特征参数的量化方式来量化,这需要用20bit来编码。这样就形成了一个包括核心层和增强层1的新的能更准确的描述背景噪声的SID帧,速率为2.8kbit/s,可以称之为SIDII帧,如图8所示。
在实际应用时,在背景噪声阶段,编码器将包括核心层和增强层的SIDII帧传送到通信信道,通信信道就可根据当前的信道状况决定接收的层数,若信道状况良好,带宽充足,则将核心层和增强层全部接收,如图5所示,否则只接收核心层,如图6所示。
除了信道能够灵活的选择接收的层数,在解码端,若解码器接收到的是SIDII帧,则解码器就可以依据解码端的处理能力或应用环境来选择解码层,即选择是以1.8kbit/s还是2.8kbit/s来进行解码。
由于越来越多的包括音乐在内的音频信号也需要在通信时编码传输,因此,本方法并不局限于语音编解码器,还包括音频编解码器。另外实际的背景噪声编码码流分层的层数不限于两层,可以有多层。
参见图9,本发明实施例提供一种背景噪声的编码码流传输的系统,该系统包括编码器901和解码器902,其中,编码器901,用于以一编码速率向解码器发送背景噪声的编码码流,所述编码码流包含的编码层包括核心层和一个以上的增强层,每层包含一组编码参数,每组编码参数对应一编码比特数,所述编码速率是根据所述编码码流包含各层对应的编码比特数确定,所述核心层包含使接收端以该核心层对应的编码速率解码时能将该背景噪声独自恢复出来的编码参数,所述增强层包含增强该层以前的编码层编码效果的编码参数;解码器902,用于接收背景噪声的编码码流,确定解码层,根据所述解码层确定解码速率并以该速率对所述编码码流进行解码;
该系统还进一步包括通信信道903,用于传输编码器向解码器发送的背景噪声的编码码流,在传输过程中,根据当前的信道状况确定接收所述编码码流的层数,按照该层数接收该编码码流,并将接收的编码码流发送到解码器。
参见图10,本发明实施例还提供一种编码器,可以应用于上述背景噪声的编码码流传输的系统中,与解码器相连,该编码器包括第一处理单元1001,用于以一编码速率向解码器发送背景噪声的编码码流,所述编码码流包含的编码层包括核心层和一个以上的增强层,每层包含一组编码参数,每组编码参数对应一编码比特数,所述编码速率是根据所述编码码流包含各层对应的编码比特数确定,所述核心层包含使接收端以该核心层对应的编码速率解码时能将该背景噪声独自恢复出来的编码参数,所述增强层包含增强该层以前的编码层编码效果的编码参数;
第一处理单元1001包括第一判断单元10011和第一发送单元10012,其中,第一判断单元10011用于根据所述编码码流包含各层对应的编码比特数确定所述编码速率;第一发送单元10012,用于以所述编码速率向解码器发送背景噪声的编码码流。
参见图11,本发明实施例还提供一种解码器,可以应用于上述背景噪声的编码码流传输的系统中,与编码器相连,该解码器包括第二处理单元1101,用于接收背景噪声的编码码流,根据接收端当前的处理能力或应用环境确定解码层,根据所述解码层确定解码速率并以该速率对所述编码码流进行解码;
第二处理单元1101包括接收单元11011、第二判断单元11012和解码单元11013,其中,接收单元11011,用于接收背景噪声的编码码流;第二判断单元11012,用于根据接收端当前的处理能力或应用环境确定解码层,根据所述解码层确定解码速率;解码单元11013,用于以所述解码速率对所述编码码流进行解码。
本发明实施例提供的方法中,发送端在对背景噪声进行编码时,不必考虑通信信道的当前具体状况,通信信道也不必指示发送端按照哪种编码速率向它发送编码码流,而是直接将编码码流以一编码速率发送到通信信道,这样简化了通信信道与发送端的交互过程。
背景噪声的编码码流包含的编码层包括核心层和一个以上的增强层,核心层包含的编码参数能使接收端在以该核心层对应的编码速率进行解码时将背景噪声恢复出来,增强层包含的编码参数起到增强该层以前的编码层编码效果的作用,这样很大程度上提高了背景噪声的编码质量。
背景噪声的编码码流到达通信信道后,通信信道可以根据当前的信道状况决定接收该编码码流的层数并按照该层数接收该编码码流,若信道状况较差,信道可以选择接收码流中的较少层,若信道状况较好,信道可以选择接收码流中的较多层以充分利用信道资源。所以,通信信道可以根据自身情况灵活自由地选择接收码流的层数,从而对编码质量进行灵活控制。
接收端接收到通信信道发来的背景噪声编码码流后,还可以根据接收端当前的处理能力或应用环境等具体情况决定解码层数,根据该层数确定解码速率并以该速率对编码码流惊醒解码。可见,接收端也可以根据自身情况灵活选择解码速率,从而对编码质量进行灵活控制,接收端能够得到高质量背景噪声成为可能。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (11)
1.一种背景噪声的编码码流传输的方法,其特征在于,该方法包括以下步骤:
A.发送端以一编码速率向接收端发送背景噪声的编码码流,
所述编码码流包含的编码层包括核心层和一个以上的增强层,每层包含一组编码参数,每组编码参数对应一编码比特数,所述编码速率是根据所述编码码流包含各层对应的编码比特数确定,所述核心层包含使接收端以该核心层对应的编码速率解码时能将该背景噪声独自恢复出来的编码参数,所述增强层包含增强该层以前的编码层编码效果的编码参数;
B.接收端接收到背景噪声的编码码流后,确定解码层,根据所述解码层确定解码速率并以该速率对所述编码码流进行解码。
2.如权利要求1所述的方法,其特征在于,步骤A包括:
A1.发送端以一编码速率将背景噪声的编码码流发送给通信信道;
A2.所述通信信道确定接收所述编码码流的层数,并按照该层数接收该编码码流;
A3.所述通信信道将步骤A2接收的编码码流发送到接收端。
3.如权利要求2所述的方法,其特征在于,所述通信信道根据当前的信道状况确定接收所述编码码流的层数。
4.如权利要求2所述的方法,其特征在于,步骤B中如果所述接收端接收到的编码码流只包含核心层,所述解码层为该核心层。
5.如权利要求2所述的方法,其特征在于,步骤B中如果所述接收端接收到的编码码流包含核心层和增强层,接收端根据自身当前的处理能力或应用环境确定解码层。
6.一种背景噪声的编码码流传输的系统,其特征在于,该系统包括:
编码器,用于以一编码速率向解码器发送背景噪声的编码码流,所述编码码流包含的编码层包括核心层和一个以上的增强层,每层包含一组编码参数,每组编码参数对应一编码比特数,所述编码速率是根据所述编码码流包含各层对应的编码比特数确定,所述核心层包含使接收端以该核心层对应的编码速率解码时能将该背景噪声独自恢复出来的编码参数,所述增强层包含增强该层以前的编码层编码效果的编码参数;
解码器,用于接收背景噪声的编码码流,根据自身当前的处理能力或应用环境确定解码层,根据所述解码层确定解码速率并以该速率对所述编码码流进行解码。
7.如权利要求6所述的系统,其特征在于,该系统进一步包括:
通信信道,用于传输编码器向解码器发送的背景噪声的编码码流,在传输过程中,根据当前的信道状况确定接收所述编码码流的层数,按照该层数接收该编码码流,并将接收的编码码流发送到解码器。
8.一种编码器,与解码器相连,其特征在于,该编码器包括:
第一处理单元,用于以一编码速率向解码器发送背景噪声的编码码流,
所述编码码流包含的编码层包括核心层和一个以上的增强层,每层包含一组编码参数,每组编码参数对应一编码比特数,所述编码速率是根据所述编码码流包含各层对应的编码比特数确定,所述核心层包含使接收端以该核心层对应的编码速率解码时能将该背景噪声独自恢复出来的编码参数,所述增强层包含增强该层以前的编码层编码效果的编码参数。
9.如权利要求8所述的编码器,其特征在于,所述第一处理单元包括:
第一判断单元,用于根据所述编码码流包含各层对应的编码比特数确定所述编码速率;
第一发送单元,用于以所述编码速率向解码器发送背景噪声的编码码流。
10.一种解码器,与编码器相连,其特征在于,该解码器包括:
第二处理单元,用于接收背景噪声的编码码流,根据自身当前的处理能力或应用环境确定解码层,根据所述解码层确定解码速率并以该速率对所述编码码流进行解码。
11.如权利要求10所述的解码器,其特征在于,所述第二处理单元包括:
接收单元,用于接收背景噪声的编码码流;
第二判断单元,用于根据自身当前的处理能力或应用环境确定解码层,根据所述解码层确定解码速率;
解码单元,用于以所述解码速率对所述编码码流进行解码。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200610150441 CN101170590B (zh) | 2006-10-27 | 2006-10-27 | 一种背景噪声的编码码流传输的方法、系统及装置 |
PCT/CN2007/002680 WO2008049311A1 (fr) | 2006-10-27 | 2007-09-11 | Procédé, système et appareil pour transmettre le flux de code encodé du bruit de fond |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200610150441 CN101170590B (zh) | 2006-10-27 | 2006-10-27 | 一种背景噪声的编码码流传输的方法、系统及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101170590A true CN101170590A (zh) | 2008-04-30 |
CN101170590B CN101170590B (zh) | 2011-04-27 |
Family
ID=39324122
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200610150441 Expired - Fee Related CN101170590B (zh) | 2006-10-27 | 2006-10-27 | 一种背景噪声的编码码流传输的方法、系统及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN101170590B (zh) |
WO (1) | WO2008049311A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104113395A (zh) * | 2014-08-04 | 2014-10-22 | 北京水木云科信息技术有限公司 | 一种无线恶劣网络环境下物联网数据安全传输的方法 |
CN106796796A (zh) * | 2014-10-10 | 2017-05-31 | 高通股份有限公司 | 以信号表示用于高阶立体混响音频数据的可缩放译码的声道 |
US11138983B2 (en) | 2014-10-10 | 2021-10-05 | Qualcomm Incorporated | Signaling layers for scalable coding of higher order ambisonic audio data |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101894562A (zh) * | 2010-07-02 | 2010-11-24 | 中兴通讯股份有限公司 | 降低环境噪音对音频影响的方法及终端 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5442458A (en) * | 1991-12-18 | 1995-08-15 | Eastman Kodak Company | Method and associated apparatus for encoding bitplanes for improved coding efficiency |
KR100335611B1 (ko) * | 1997-11-20 | 2002-10-09 | 삼성전자 주식회사 | 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치 |
KR100917464B1 (ko) * | 2003-03-07 | 2009-09-14 | 삼성전자주식회사 | 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치 |
KR100923301B1 (ko) * | 2003-03-22 | 2009-10-23 | 삼성전자주식회사 | 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치 |
-
2006
- 2006-10-27 CN CN 200610150441 patent/CN101170590B/zh not_active Expired - Fee Related
-
2007
- 2007-09-11 WO PCT/CN2007/002680 patent/WO2008049311A1/zh active Application Filing
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104113395A (zh) * | 2014-08-04 | 2014-10-22 | 北京水木云科信息技术有限公司 | 一种无线恶劣网络环境下物联网数据安全传输的方法 |
CN104113395B (zh) * | 2014-08-04 | 2017-05-17 | 北京水木云科信息技术有限公司 | 一种无线恶劣网络环境下物联网数据安全传输的方法 |
CN106796796A (zh) * | 2014-10-10 | 2017-05-31 | 高通股份有限公司 | 以信号表示用于高阶立体混响音频数据的可缩放译码的声道 |
US11138983B2 (en) | 2014-10-10 | 2021-10-05 | Qualcomm Incorporated | Signaling layers for scalable coding of higher order ambisonic audio data |
US11664035B2 (en) | 2014-10-10 | 2023-05-30 | Qualcomm Incorporated | Spatial transformation of ambisonic audio data |
Also Published As
Publication number | Publication date |
---|---|
CN101170590B (zh) | 2011-04-27 |
WO2008049311A1 (fr) | 2008-05-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102985969B (zh) | 编码装置、解码装置和编码方法、解码方法 | |
US7092875B2 (en) | Speech transcoding method and apparatus for silence compression | |
CN1223989C (zh) | 可变速率语音编码器中的帧擦除补偿法及用该方法的装置 | |
CN100362568C (zh) | 用于预测量化有声语音的方法和设备 | |
CN1954367B (zh) | 支持音频编码器模式间的转换 | |
US8060363B2 (en) | Audio signal encoding | |
CN1815558B (zh) | 语音中非话音部分的低数据位速率编码 | |
CN1922660B (zh) | 通信装置和通信方法 | |
CN101087319B (zh) | 一种发送和接收背景噪声的方法和装置及静音压缩系统 | |
CN101320563B (zh) | 一种背景噪声编码/解码装置、方法和通信设备 | |
US6721712B1 (en) | Conversion scheme for use between DTX and non-DTX speech coding systems | |
EP1131816B1 (en) | Synthesis of speech from pitch prototype waveforms by time-synchronous waveform interpolation | |
CN101494055A (zh) | 用于码分多址无线系统的方法和装置 | |
US20200227061A1 (en) | Signal codec device and method in communication system | |
CN103187065A (zh) | 音频数据的处理方法、装置和系统 | |
US8380495B2 (en) | Transcoding method, transcoding device and communication apparatus used between discontinuous transmission | |
CN101170590B (zh) | 一种背景噪声的编码码流传输的方法、系统及装置 | |
WO2005091273A2 (en) | Method of comfort noise generation for speech communication | |
EP1617417A1 (en) | Voice coding/decoding method and apparatus | |
CA2293165A1 (en) | Method for transmitting data in wireless speech channels | |
Amro | Higher Compression Rates for GSM 6.10 Standard Using Lossless Compression | |
CN101127211A (zh) | 解码音频信号的方法和传送音频信号的系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110427 Termination date: 20111027 |