CN1239894C - 语音不活动期间话音传输系统间互操作性的方法和装置 - Google Patents
语音不活动期间话音传输系统间互操作性的方法和装置 Download PDFInfo
- Publication number
- CN1239894C CN1239894C CNB028065409A CN02806540A CN1239894C CN 1239894 C CN1239894 C CN 1239894C CN B028065409 A CNB028065409 A CN B028065409A CN 02806540 A CN02806540 A CN 02806540A CN 1239894 C CN1239894 C CN 1239894C
- Authority
- CN
- China
- Prior art keywords
- continuous
- discontinuous
- transmission system
- frame
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000005540 biological transmission Effects 0.000 claims abstract description 100
- 238000004891 communication Methods 0.000 claims abstract description 27
- 238000001228 spectrum Methods 0.000 claims description 80
- 238000003780 insertion Methods 0.000 claims description 29
- 230000037431 insertion Effects 0.000 claims description 29
- 239000000284 extract Substances 0.000 claims description 7
- 238000012546 transfer Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 claims description 5
- 238000013213 extrapolation Methods 0.000 claims description 5
- 238000012935 Averaging Methods 0.000 claims description 3
- 239000012536 storage buffer Substances 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 6
- VYVRIXWNTVOIRD-LRHBOZQDSA-N ciguatoxin CTX1B Chemical compound C([C@@]12[C@@H](C)[C@@H]([C@@H]3[C@H]([C@H]([C@H](C)[C@H]4O[C@H]5C[C@@H](C)C[C@H]6O[C@@]7(C)[C@H](O)C[C@H]8O[C@H]9C=C[C@H]%10O[C@H]%11C[C@@H]%12[C@H]([C@@H]([C@H]%13O[C@H](C=CC[C@@H]%13O%12)\C=C\[C@H](O)CO)O)O[C@@H]%11C=C[C@@H]%10O[C@@H]9C\C=C/C[C@@H]8O[C@@H]7C[C@@H]6O[C@@H]5C[C@@H]4O3)O)O2)C)[C@H](O)CO1 VYVRIXWNTVOIRD-LRHBOZQDSA-N 0.000 description 58
- 206010038743 Restlessness Diseases 0.000 description 20
- 238000005070 sampling Methods 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 8
- 239000002131 composite material Substances 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 239000013598 vector Substances 0.000 description 8
- 238000011002 quantification Methods 0.000 description 7
- 238000007493 shaping process Methods 0.000 description 7
- 230000005284 excitation Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 230000008676 import Effects 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 239000002245 particle Substances 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 230000005534 acoustic noise Effects 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- VJYFKVYYMZPMAB-UHFFFAOYSA-N ethoprophos Chemical compound CCCSP(=O)(OCC)SCCC VJYFKVYYMZPMAB-UHFFFAOYSA-N 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Telephonic Communication Services (AREA)
- Mobile Radio Communication Systems (AREA)
- Time-Division Multiplex Systems (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Facsimiles In General (AREA)
- Information Transfer Systems (AREA)
- Telephone Function (AREA)
Abstract
所公开的实施例提供了无声或背景噪声传输期间用于CTX和DTX通信系统间互操作性的方法和装置。连续八速率编码的噪声帧被转化为用于传送至DTX系统的不连续SID帧(402-410)。不连续SID帧被转化为连续八速率编码的噪声帧,用于由CTX系统进行解码(602-606)。CTX至DTX互操作性的应用包括CDMA和GSM互操作性(窄带话音传输系统)、CDMA下一代声码器(可选模式声码器)与工作在用于IP上话音应用的DTX模式中的新ITU-T 4 kbps声码器的互操作性、具有公共语音编码器/解码器但在语音不活动期间工作在不同CTX或DTX模式中的未来话音传输系统、以及CDMA宽带话音传输系统与具有公共宽带编解码器但操作模式(话音不活动期间的(DTX或CTX))不同的其它宽带话音传输系统的互操作性。
Description
背景
领域
所公开的实施例涉及无线通信,尤其涉及用于语音不活动期间不同话音传输系统间互操作性的一种新颖并改进了的方法和装置。
背景
通过数字技术来传输语音已得到广泛应用,特别在长途及数字无线电话应用中。它的好处在于能够确定在一个信道上传送的最少信息量,同时保持可理解的重建语音的质量。如果语音通过简单地抽样和数字化来传送,那么要求64kbps数量级的数据速率来达到常规模拟电话的语音质量。然而,通过进行语音解析、跟着适当编码、发送及接收端的重新合成,从而可以达到数据速率的显著降低。各种语音类型的这种编码方案的互操作性对于不同传输系统间的通信是必要的。活动语音和不活动语音信号是所产生信号的基本类型。活动语音代表发声,而语音不活性、即不活动语音一般包括静音和背景噪声。
采用通过提取与人的语音生成模型有关的参数来压缩语音的技术的装置称为语音编码器。语音编码器将输入的语音信号分为时间块或者解析帧。在下文中,术语“帧”和“分组”可以互换。语音编码器通常包括编码器和解码器或者一个编解码器。编码器解析输入语音帧来提取某些相关增益和频谱参数,然后将这些参数量化为二进制表示,即比特集合或二进制数据分组。数据分组在通信信道上被发送给接收机和解码器。解码器处理这些数据分组,将它们反量化以产生参数,然后再利用经反量化的参数重新合成这些帧。
语音编码器的功能是通过去除语音中固有的全部自然冗余度而将数字化的语音信号压缩成低比特速率信号。数字压缩是通过用一组参数来表示输入语音帧并且进行量化从而用一组比特来表示这些参数而实现的。如果输入语音帧具有Ni个比特、由语音编码器产生的语音分组具有No个比特,则由语音编码器实现的压缩系数就为Cr=Ni/No。难题是在取得目标压缩系数的同时获得已解码语音的高话音质量。语音编码器的性能取决于(1)语音模型或者上述解析和合成过程完成的好坏,以及(2)在每帧No比特的目标比特率下参数量化过程完成的好坏。因而,语音模型的目标就是用每帧一小组参数获得语音信号的要素或者目标话音质量。
语音编码器用时域编码器来实现,它试图通过用高分辨率处理来每次对小段语音(一般为5毫秒(ms)子帧)进行编码而获得时域语音波形。对于每个子帧而言,通过本领域已知的各种搜索算法而找到来自密码本空间的高精确度表示。或者,语音编码器可以用频域编码器来实现,它试图用一组参数来获得输入语音帧的短时语音频谱(解析),并且用相应的合成过程来从频谱参数重建语音波形。参数量化器保存参数是按照A.Gersho和R.M.Gray所著的Vector Quantization and SignalCompression(1992)中所描述的已知量化技术用编码向量的已存储表示来表示它们。给定传输系统中不同类型的语音可能用语音编码器的不同实现来编码,而不同的传输系统可能不同地实现给定语音类型的编码。
对于较低比特率下的编码而言,已经开发了各种频谱的、或者频域的语音编码方法,其中语音信号被解析为频谱的时变展开。参见如R.J.McAulay和T.F.Quatieri所撰写的
正弦编码,在“Speech Coding and Synthesis”中第四章(W.B.Kleijn和K.K.Paliwal eds.,1995)。在频谱编码器中,目标是用一组频谱参数来建模或预测每个输入语音帧的短时语音频谱,而不是精确来模拟输出语音帧。然后,频谱参数被编码,用已解码参数创建输出语音帧。所产生的已合成语音与最初的输入语音波形不匹配,但是提供相似的所观察质量。本领域中众所周知的频域编码器示例包括多频带激励编码器(MBE)、正弦变换编码器(STC)、及谐波编码器(HC)。这些频域编码器提供高质量的参数模型。它具有一小组参数可以在低比特率下可用的低比特数对它们进行精确量化。
在期望较低比特率的无线话音通信系统中,一般期望降低发射功率电平,以便减少同信道干扰并且延长便携式单元的电池寿命。减少总发射数据速率也起到减少发射数据功率电平的作用。常规的电话会话包含约40%的语音脉冲串、60%的静音和背景声学噪声。背景噪声比语音携带较少的感知信息。由于希望以最低可能的比特率发射静音和背景噪声,因此在语音不活动期间使用活动语音编码速率则是无效的。
利用会话语音中低话音活动性的常用方法是使用话音活动性检测器(VAD)单元,它在话音和非话音之间进行识别,以便以降低了的数据速率发射静音或背景噪声。然而,由诸如连续传输(CTX)系统和不连续传输(DTX)系统这样不同类型的传输系统所使用的编码方案在静音或背景噪声传输期间不兼容。在CTX系统中,即使在语音不活动期间也连续地发射数据帧。当DTX系统中没有语音时,使传输不连续以减少总传输功率。全球数字移动电话(GSM)系统的不连续传输已在下列欧洲电信标准协会向国际电信联盟(ITU)的提案中得到标准化,该提案题为“Digital CellularTelecommunication System(Phase 2+);Discontinuous Transmission(DTX)forEnhanced Full Rate(EFR)Speech Traffic Channels”,以及“Digital CellularTelecommunication System(Phase 2+);Discontinuous Transmission(DTX)forAdaptive Multi-Rate(AMR)Speech Traffic Channels”。
CTX系统要求用于系统同步和信道质量监控的连续传输模式。这样,当没有语音时,用较低速率的编码模式对背景噪声连续地进行编码。基于码分多址(CDMA)的系统为话音呼叫的可变速率传输使用该方法。在CDMA系统中,不活动期间发射八分之一速率帧。用800比特每秒(bps)或每20毫秒(ms)帧时间16比特来发射不活动语音。如CDMA这样的CTX系统在话音不活动期间发射噪声信息,用于听众的舒适感以及同步和信道质量测量。在CTX通信系统的接收机端,在语音不活动期间连续存在周围背景噪声。
在DTX系统中,不必要在不活动期间每隔20ms帧发射比特。GSM、宽带CDMA、IP上话音的系统、以及某些卫星系统是DTX系统。在这种DTX系统中,发射机在语音不活动期间被关闭。然而,在DTX系统的接收机端,语音不活动期间未接收到任何连续信号,这造成背景噪声在活动语音期间存在,但在静音期间消失。背景噪声的交替存在与消失是讨厌的并且会引起听众的反对。为了填充语音短脉冲串之间的间隙,用已发射噪声信息在接收机端产生称为“舒适噪声”的合成噪声。用静音插入描述符(SID)帧发射噪声统计量的周期性更新。GSM系统的舒适噪声已在下列欧洲电信标准协会向国际电信联盟(ITU)的提案中得到标准化,该提案题为“Digital Cellular Telecommunication System(Phase 2+);Comfort NoiseAspects for Enhanced Full Rate(EFR)Speech Traffic Channels”,以及“DigitalCellular Telecommunication System(Phase 2+);Comfort Noise Aspects forAdaptive Multi-Rate(AMR)Speech Traffic Channels”。当发射机位于诸如街道、购物中心或汽车等噪声环境中时,舒适噪声特别改进了接收机处的收听质量。
DTX系统通过在接收机处不活动语音期间用噪声合成模型产生合成的舒适噪声而补偿不连续发射的噪声的不存在。为了在DTX系统中产生合成舒适噪声,周期性地发射带有噪声信息的一个SID帧。当VAC表示静音时,一般每20帧时间发射一次代表噪声帧的周期性DTX,即SID帧。
CTX和DTX系统共有的用于在解码器处产生舒适噪声的模型使用了频谱成形滤波器。随机(白)激励与增益相乘,并且由频谱整形滤波器用接收到的增益和频谱参数进行整形,从而产生合成的舒适噪声。表现频谱整形的激励增益和频谱信息是发射的参数。在CTX系统中,增益和频谱参数以八分之一速率被编码并且在每帧被发射。在DTX系统中,每个周期都发射包含平均/量化增益和频谱值的SID帧。舒适噪声的编码和传输方案中的这些差异造成不活动语音期间CTX和DTX传输系统间的不兼容。这样,需要CTX和DTX话音通信系统间的互操作性来发射非话音信息。
概述
这里公开的实施例通过便于在CTX和DTX通信系统间发射非话音信息的话音通信系统来解决上述需求。因而,在本发明一方面,一种在非活动语音的传输期间提供连续传输通信系统和不连续传输通信系统间的互操作性的方法包括:把由连续传输系统产生的连续不活动语音帧转化成可由不连续传输系统解码的周期性静音插入描述符帧,以及把由不连续传输系统产生的周期性静音插入描述符帧转化成可由连续传输系统解码的连续非活动语音帧。另一方面,用于提供连续传输系统和不连续传输系统间的互操作性的连续至不连续接口装置包括:连续至不连续转换单元,用于把由连续传输系统产生的连续非活动语音帧转化成可由不连续传输系统解码的周期性静音插入描述符帧;以及不连续至连续转换单元,用于把由不连续传输系统产生的周期性静音插入描述符帧转化成可由连续传输系统解码的连续非活动语音帧。
附图简述
图1是各端由语音编码器终止的通信信道框图;
图2是结合图1所述编码器的无线通信系统框图,它支持不活动语音传输的CTX/DTX互操作性;
图3是用已发射噪声信息在接收机处产生舒适噪声的合成噪声发生器框图;
图4是CTX至DTX转换单元的框图;
图5是说明CTX至DTX转换的转换步骤的流程图;
图6是DTX至CTX转换单元的框图;以及
图7是说明DTX至CTX转换的转换步骤的流程图。
详细描述
所公开的实施例提供了一种方法和装置,用于在静音或背景噪声传输期间提供CTX和DTX通信系统间的互操作性。连续八分之一速率编码的噪声帧被转化成不连续SID帧,用于传输至DTX系统。不连续SID帧被转化成连续八分之一速率编码的噪声帧,由CTX系统进行解码。CTX至DTX互操作性的应用包括:CDMA和GSM互操作性(窄带话音传输系统)、CDMA下一代声码器(可选模式声码器)与工作在IP上话音应用的DTX模式中的新ITU-T 4kbps声码器的互操作性、具有公共语音编码器/解码器但在非活动语音期间工作在不同CTX或DTX模式中的未来话音传输系统、以及CDMA宽带话音传输系统与具有公共宽带声码器但在语音非活动性期间有不同工作模式(DTX或CTX)的其它宽带话音传输系统间的互操作性。
所公开的实施例从而为连续话音传输系统的声码器和不连续话音传输系统的声码器之间的接口提供了一种方法和装置。CTX系统的信息比特流被映射为DTX比特流,后者可以在DTX信道中传输并且在DTX系统的接收端由解码器进行解码。类似地,接口把比特流从DTX信道转化至CTX信道。
在图1中,第一编码器10接收数字化语音采样s(n)并对采样s(n)进行编码,用于在传输媒质12即通信信道12上发送至第一解码器14。第一解码器对已编码语音采样进行解码并且合成输出语音信号SSYNTH(n)。对于相反方向中的传输而言,第二编码器16对数字化语音采样s(n)进行编码,语音采样在通信信道18上被发出。第二解码器20接收已编码语音采样并对其进行解码,产生合成的输出语音信号SSYNTH(n)。
语音采样s(n)代表已经按照本领域已知的各种方法之一数字化和量化的语音信号,这些方法包括如,脉冲编码调制(PCM)、压扩μ-律或A-律。如本领域已知,语音采样s(n)被组织成输入数据的帧,其中每帧包括预定数量的数字化语音采样s(n)。在示例性实施例中,采用采样速率8kHz,每20ms帧包括160个采样。在下述实施例中,数据传输速率可以逐帧从全速率变为半速率、变为四分之一速率、变为八分之一速率。或者,可能使用其它数据速率。如这里所使用的,术语“全速率”或“高速率”一般是指大于或等于8kbps的数据速率,而术语“半速率”或“低速率”一般是指小于或等于4kbps的数据速率。改变数据传输速率是有利的,因为可以为包含相对少语音信息的帧选择性地采用较低比特速率。如本领域技术人员所能理解的,也可以使用其它采样速率、帧尺寸、以及数据传输速率。
第一编码器10和第二解码器20共同组成第一语音编码器,即语音编解码器。类似地,第二编码器16和第一解码器14共同组成第二语音编码器。本领域技术人员可以理解,语音编码器可以用数字信号处理器(DSP)、应用专用集成电路(ASIC)、离散门逻辑、固件、或任意常规可编程软件模块和微处理器来实现。软件模块可以驻留在RAM存储器、闪存、寄存器、或本领域已知的任意其它形式的可写存储媒体中。或者,任意常规处理器、控制器或状态机可以代替微处理器。特别为语音编码设计的示例性ASIC在美国专利号5926786和5784532中已作描述,前者题为“APPLICATION SPECIFIC INTEGRATED CIRCUIT(ASIC)FOR PERFORMING RAPIDSPEECH COMPRESSION IN A MOBILE TELEPHONE SYSTEM”,后者题目与前者相同,这两个专利都被转让给本发明的受让人并且通过引用被完全结合于此。
图2说明了无线CTX话音传输系统200的示例性实施例,该系统包括订户单元202、基站208、以及能在静音或背景噪声传输期间与DTX接口的移动交换中心(MSC)214。订户单元202可能包括移动订户的蜂窝电话、无绳电话、寻呼设备、无线本地环设备、个人数字助理(PDA)、互联网电话装置、卫星通信系统组件、或者通信系统的任意其它用户终端设备。图2的示例性实施例说明了连续话音传输系统200的编解码器218和不连续话音传输系统的编解码器(未示出)之间的CTX至DTX接口216。两个系统的编码器都包括图1所述的编码器10和解码器20。图2说明了无线话音传输系统200的基站208内实现的CTX-DTX接口的示例性实施例。在其它实施例中,CTX-DTX接口216可以位于至工作在DTX模式的其它话音传输系统的网关单元(未示出)中。然而,应该理解,CTX-DTX接口组件或者它们的功能可能以另外方式物理上位于整个系统中,而不背离所公开实施例的范围。示例性的CTX至DTX接口216包括:CTX至DTX转换单元210,用于把从订户单元202的编码器10输出的八分之一速率分组转化成DTX兼容的SID分组;以及DTX至CTX转换单元212,用于把从DTX系统接收到的SID分组转化成可由订户单元202的解码器20解码的八分之一速率分组。示例性转换单元210、212装备有与话音系统接口的编码器/解码器单元。图4详述了CTX至DTX转换单元。图6中详述了DTX至CTX转换单元。示例性订户单元202的解码器20装备有合成噪声发生器(未示出),用于从由DTX至CTX转换单元212输出的八分之一速率分组中产生舒适噪声。图3详述了合成噪声发生器。
图3说明了由图1和2所述解码器10、20所使用的合成噪声发生器的示例性实施例,用于在接收机处用已发射噪声信息产生舒适噪声。在CTX和DTX话音系统中产生背景噪声的通常方案是使用简单的滤波器-激励合成模型。分配了对于每帧可用的有限低速率比特来发射表征背景噪声的频谱参数和能量增益。在DTX系统中,使用已发射噪声参数的内插来产生舒适噪声。
随机激励信号306在乘法器302内与接收到的增益相乘,产生中间信号x(n),它代表经缩放的随机激励。经缩放的随机激励x(n)由频谱整形滤波器304用接收到的频谱参数来整形,以产生合成的背景噪声信号308,y(n)。频谱整形滤波器304的实现是本领域技术人员容易理解的。
图4说明了图2所述CTX至DTX接口216的CTX至DTX转换单元210的示例性实施例。当发射系统的VAD输出0、表示话音不活动时,发射背景噪声。当在两个CTX系统间发射背景噪声时,可变速率编码器产生包含增益和频谱信息的连续的八分之一速率数据分组,而同一系统的CTX解码器接收该八分之一速率分组并对它们进行解码以产生舒适噪声。当静音或背景噪声从CTX系统被发射到DTX系统时,可能通过CTX系统产生的连续八分之一速率分组向可由DTX系统解码的周期性SID帧的转换来提供互操作性。其中CTX和DTX系统间必需提供互操作性的一种示例性实施例是下面两个声码器之间的通信:CDMA新提出的声码器—可选模式声码器(SMV)、以及使用DTX工作模式的新提出的4kbps国际电信联盟(ITU)声码器。SMV声码器使用用于活动语音的三种编码速率(8500、4000和2000bps),以及用于编码静音和背景噪声的800bps。SMV声码器和ITU-T声码器都有可互操作的4000bps活动语音编码比特流。对于语音活动期间的互操作性而言,SMV声码器仅使用4000bps编码速率。然而,由于ITU声码器在语音缺失期间中断传输,并且周期性地产生包含背景噪声频谱和能量参数的SID帧,这些帧仅可在DTX接收机处被解码,因此声码器在语音不活动期间是不可互操作的。在N个噪声帧的周期中,ITU-T声码器发射一个SID分组来更新噪声统计量。参数N由接收DTX系统的SID帧周期来确定。
图4所述的CTX至DTX转换单元400提供了不活动语音从CTX系统到DTX系统传输期间的互操作性。八分之一速率编码的噪声帧从CTX系统(未示出)的编码器(未示出)输入八分之一速率解码器402。在一个实施例中,八分之一速率解码器402可以是完全功能的可变速率解码器。在另一实施例中,八分之一速率解码器402可以是仅能从八分之一速率分组提取增益和频谱信息的部分解码器。部分解码器仅需要对平均所需的每帧的频谱参数和增益参数进行解码。部分解码器不必要能重构全部信号。八分之一速率解码器402从N个八分之一速率分组中提取增益和频谱信息,这些分组存储在帧缓冲器404中。参数N由接收DTX系统(未示出)的SID帧周期来确定。DTX平均单元406平均N个八分之一速率帧的增益和频谱信息,用于输入SID编码器408。SID编码器408量化经平均的增益和频谱信息,并产生可由DTX接收机解码的SID帧。SID帧被输入DTX调度器410,后者在DTX接收机的SID帧周期中适当时间发送分组。这样,建立了不活动语音从CTX系统到DTX系统的传输期间的互操作性。
图5是说明按照一示例性实施例从CTX到DTX噪声转换的步骤。基站会通知产生用于转换的八分之一速率分组的CTX编码器:分组的目的地是DTX系统。在一个实施例中,MSC(图2(214))保留与连接的目标系统有关的信息。MSC系统登记识别连接的目的地,并且在基站(图2(214))处启动八分之一速率分组向周期性SID帧的转换,转换是为与目标DTX系统的SID帧周期兼容的周期性传输而适当调度的。
CTX至DTX转换产生能被传输至DTX系统的SID分组。在语音不活动期间,CTX系统的编码器把八分之一速率分组发射至CTX至DTX转换单元210的解码器402。
从步骤502开始,解码N个连续的八分之一速率噪声帧,从而为接收到的分组产生频谱和能量增益参数。N个连续八分之一速率噪声帧的频谱和能量增益参数被缓冲,控制流程进行到步骤504。
在步骤504中,使用公知的平均技术来计算代表N个帧内噪声的平均频谱参数和平均能量增益参数。控制流程进行到步骤506。
在步骤506中,经平均的频谱和能量增益参数被量化,并且从经量化的频谱和能量增益参数中产生SID帧。控制流程进行到步骤508。
在步骤508中,由DTX调度器发射SID帧。
步骤502和508每个静音或背景噪声的N个八分之一速率帧就被重复。本领域的技术人员可以理解,图5所述的步骤顺序并非限制性的。可以通过省略或重排所述步骤而容易地修正该方法,这不背离所公开实施例的范围。
图6说明了图2所述CTX至DTX接口216的DTX至CTX转换单元212的示例性实施例。当在两个DTX系统间发射背景噪声时,DTX编码器产生包含平均的增益和频谱信息的周期性SID数据分组,而同一系统的DTX解码器周期性地接收SID分组并对它们进行解码,从而产生舒适噪声。当背景噪声从DTX系统被发射至CTX系统时,可能通过由DTX系统产生周期性SID帧向可由CTX系统解码的连续八分之一速率分组的转换而提供互操作性。图6所述的示例性DTX至CTX转换单元600提供了不活动语音从DTX系统向CTX系统传输期间的互操作性。
SID编码的噪声帧从DTX系统的编码器(未示出)被输入DTX解码器602。DTX解码器602能量化SID分组以产生SID噪声帧的频谱和能量信息。在一个实施例中,DTX解码器602可以是完全功能的DTX解码器。在另一实施例中,DTX解码器602可以是仅能从SID分组提取平均频谱向量和平均增益的部分解码器。部分DTX解码器仅能对来自SID分组的平均频谱向量和平均增益进行解码。部分DTX解码器不必要能重构全部信号。平均的增益和频谱值被输入平均频谱和增益向量发生器604。
平均频谱和增益向量发生器604从接收到的SID分组中提取的一个平均频谱值和一个平均增益值中产生N个频谱值和N个增益值。使用内插技术、外插技术、以及替换来计算N个已发射噪声帧的频谱参数和能量增益值。为产生多个频谱值和增益值而使用内插技术、外插技术、重复和替换创建了合成噪声,该合成噪声比用平稳向量方案创建的合成噪声更能代表原始背景噪声。如果已发射SID分组代表实际静音,则频谱向量是静止的,但如果有汽车噪声、商场噪声等,则平衡向量变得不足。N个所产生的频谱和增益值被输入CTX八分之一编码器606,后者产生N个八分之一速率分组。CTX编码器为每个SID帧周期输出N个连续八分之一速率噪声帧。
图7是说明按照一示例性实施例的DTX至CTX转换的步骤。DTX至CTX转换为每个接收到的SID分组产生N个八分之一速率噪声分组。在语音不活动期间,DTX系统的编码器把周期性SID帧发射到DTX至CTX转换单元212的SID解码器602。
从步骤702开始,接收到周期性SID帧。控制流程进行到步骤704。
在步骤704中,从接收到的SID分组中提取平均的增益值和平均的频谱值。控制流程进行到步骤706。
在步骤706中,用内插技术、外插技术、重复和替换的任何排列从接收到的SID分组中(在一个实施例中是下一个在前SID分组)提取的一个平均频谱值和一个平均增益值中产生N个频谱值和N个增益值。用于在N个噪声帧的周期中产生N个频谱值和N个增益值的一个内插公式实施例如下:
p(n+i)=(1-i/N)p(n-N)+i/N*p(n),
其中p(n+i)是帧n+i的参数(对于i=0,1,...,N-1),p(n)是当前周期中第一帧的参数,而p(n-N)是最近第二个周期中第一帧的参数。控制流程进行到步骤708。
在步骤708中,用所产生的N个频谱值和N个增益值产生N个八分之一速率噪声分组。步骤702-708为每个接收到的SID帧而重复。
本领域的技术人员可以理解,图7所述的步骤顺序并非限制性的。可以通过省略或重排所述步骤而容易地修正该方法,而不背离所公开实施例的范围。
这样,揭示了用于语音不活动期间话音传输系统间的互操作性的新颖并改进了的方法和装置。本领域的技术人员可以理解,信息和信号可以用多种不同技术和工艺中的任一种来表示。例如,上述说明中可能涉及的数据、指令、命令、信息、信号、比特、码元和码片可以用电压、电流、电磁波、磁场或其粒子、光场或其粒子、或它们的任意组合来表示。
本领域的技术人员能进一步理解,结合这里所公开的实施例所描述的各种说明性的逻辑块、模块和算法步骤可以作为电子硬件、计算机软件或两者的组合来实现。为了清楚说明硬件和软件间的互换性,各种说明性的组件、框图、模块、电路和步骤一般按照其功能性进行了阐述。这些功能性究竟作为硬件或软件来实现取决于特定的应用和施加于整个系统所采用的设计约束。技术人员可能以对于每个特定应用以不同的方式来实现所述功能,但这种实现决定不应被解释为造成背离本发明的范围。
结合这里所描述的实施例来描述的各种说明性的逻辑块、模块和算法步骤的实现或执行可以用:通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、离散门或晶体管逻辑、离散硬件组件、或为执行这里所述功能而设计的任意组合。通用处理器可能是微处理器,然而或者,处理器可以是任何常规的处理器、控制器、微控制器或状态机。处理器也可能用计算设备的组合来实现,如,DSP和微处理器的组合、多个微处理器、结合DSP内核的一个或多个微处理器、或任意其它这种配置。
结合这里所公开实施例描述的方法或算法的步骤可能直接包含在硬件中、由处理器执行的软件模块中、或在两者的组合中。软件模块可能驻留在RAM存储器、快闪(flash)存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动盘、CD-ROM、或本领域中已知的任何其它形式的存储媒体中。示例性存储媒体与处理器耦合,使得处理器可以从存储媒体读取信息,或把信息写入存储媒体。或者,存储媒体可以与处理器整合。处理器和存储媒体可能驻留在ASIC中。ASIC可能驻留在订户单元中。或者,处理器和存储媒体可能作为离散组件驻留在用户终端中。
上述优选实施例的描述使本领域的技术人员能制造或使用本发明。这些实施例的各种修改对于本领域的技术人员来说是显而易见的,这里定义的一般原理可以被应用于其它实施例中而不使用创造能力。因此,本发明并不限于这里示出的实施例,而要符合与这里揭示的原理和新颖特征一致的最宽泛的范围。
Claims (31)
1.一种在不活动语音传输期间提供连续传输通信系统和不连续传输通信系统之间的互操作性的方法,该方法包括:
把由连续传输系统产生的连续不活动语音帧转化成可由不连续传输系统解码的周期性静音插入描述符帧;以及
把由不连续传输系统产生的周期性静音插入描述符帧转化成可由连续传输系统解码的连续不活动语音帧。
2.如权利要求1所述的方法,其特征在于,所述连续传输系统是CDMA系统。
3.如权利要求2所述的方法,其特征在于,所述CDMA系统包括可选择的模式编解码器。
4.如权利要求1所述的方法,其特征在于,所述不连续传输系统是GSM系统。
5.如权利要求1所述的方法,其特征在于,所述不连续传输系统是窄带话音传输系统。
6.如权利要求1所述的方法,其特征在于,所述不连续传输系统包括工作在互联网协议上话音应用的不连续模式中的4千比特每秒声码器。
7.如权利要求1所述的方法,其特征在于,在工作在连续模式下的至少一个话音传输系统和工作在不连续模式下的至少一个话音传输系统之间提供所述互操作性。
8.如权利要求1所述的方法,其特征在于,在第一CDMA宽带话音传输系统和具有工作在不同传输模式下的公共宽带声码器的第二宽带话音传输系统之间提供所述互操作性。
9.如权利要求1所述的方法,其特征在于,所述连续不活动语音帧以八分之一速率被编码。
10.一种连续至不连续接口装置,用于在不活动语音传输期间提供连续传输通信系统和不连续传输通信系统之间的互操作性,所述装置包括:
连续至不连续转换单元,用于把由连续传输系统产生的连续不活动语音帧转化成可由不连续传输系统解码的周期性静音插入描述符帧;以及
不连续至连续转换单元,用于把由不连续传输系统产生的周期性静音插入描述符帧转化成可由连续传输系统解码的连续不活动语音帧。
11.一种能在不活动语音传输期间提供连续传输通信系统和不连续传输通信系统之间的互操作性的基站,所述基站包括:
连续至不连续转换单元,用于把由连续传输系统产生的连续不活动语音帧转化成可由不连续传输系统解码的周期性静音插入描述符帧;以及
不连续至连续转换单元,用于把由不连续传输系统产生的周期性静音插入描述符帧转化成可由连续传输系统解码的连续不活动语音帧。
12.一种能在不活动语音传输期间提供连续传输通信系统和不连续传输通信系统之间的互操作性的网关,所述网关包括:
连续至不连续转换单元,用于把由连续传输系统产生的连续不活动语音帧转化成可由不连续传输系统解码的周期性静音插入描述符帧;以及
不连续至连续转换单元,用于把由不连续传输系统产生的周期性静音插入描述符帧转化成可由连续传输系统解码的连续不活动语音帧。
13.一种连续至不连续转换单元,用于把由连续传输系统产生的连续不活动语音帧转化成可由不连续传输系统解码的周期性静音插入描述符帧,所述转换单元包括:
解码器,用于对不活动语音帧的频谱和增益参数进行解码;
平均单元,用于平均一组不活动语音帧以产生平均增益值和平均频谱值;
静音插入描述符编码器,用于量化平均增益值和平均频谱值,并且用经平均的增益值和经平均的频谱值产生静音插入描述符帧;以及
不连续传输调度器,用于在接收不连续传输系统的静音插入描述符帧周期中在适当时刻发射静音插入描述符帧。
14.如权利要求13所述的连续至不连续转换单元,其特征在于,所述连续不活动语音帧以八分之一速率被编码。
15.如权利要求13所述的连续至不连续转换单元,其特征在于还包括存储器缓冲器,用于存储频谱和增益参数。
16.如权利要求13所述的连续至不连续转换单元,其特征在于,所述解码器是完全可变速率解码器。
17.如权利要求13所述的连续至不连续转换单元,其特征在于,所述解码器是部分八分之一速率解码器,它能从八分之一速率编码的帧中提取增益和频谱参数。
18.一种把由连续传输系统产生的连续不活动语音帧转化成可由不连续传输系统解码的周期性静音插入描述符帧的方法,包括:
对一组连续不活动语音帧进行解码以产生一组频谱参数和增益参数;
平均一组频谱参数以产生平均频谱值;
平均一组增益参数以产生平均增益值;
量化平均频谱值;
量化平均增益值;
从经量化的平均增益值和经量化的平均频谱值中产生静音插入描述符帧;以及
在接收不连续传输系统的静音插入描述符帧周期期间适当时刻发射静音插入描述符帧。
19.如权利要求18所述的方法,其特征在于,所述连续不活动语音帧以八分之一速率被编码。
20.一种不连续至连续转换单元,用于把由不连续传输系统产生的周期性静音插入描述符帧转化成可由连续传输系统解码的连续不活动语音帧,所述转换单元包括:
解码器,用于对静音插入描述符帧进行解码以产生经量化的平均增益值和经量化的平均频谱值,并且去量化所述经量化的平均增益值和经量化的平均频谱值以产生平均增益值和平均频谱值;
平均频谱和增益值发生器,用于从平均增益值和平均频谱值中产生一组频谱值和一组增益值;以及
编码器,用于从该组频谱值和该组增益值中产生一组连续不活动语音帧。
21.如权利要求20所述的不连续至连续转换单元,其特征在于,所述编码器产生连续的八分之一速率帧。
22.如权利要求20所述的不连续至连续转换单元,其特征在于,所述平均频谱和增益值发生器还包括内插器。
23.如权利要求20所述的不连续至连续转换单元,其特征在于,所述平均频谱和增益值发生器还包括外插器。
24.一种把由不连续传输系统产生的周期性静音插入描述符帧转化成可由连续传输系统解码的连续不活动语音帧的方法,所述方法包括:
接收静音插入描述符帧;
对静音插入描述符帧进行解码以产生经量化的平均增益值和经量化的平均频谱值,并且去量化该经量化的平均增益值和经量化的平均频谱值以产生平均增益值和平均频谱值;
从平均增益值和平均频谱值中产生一组频谱值和一组增益值;以及
从该组频谱值和该组增益值中编码一组连续不活动语音帧。
25.如权利要求24所述的方法,其特征在于,使用内插技术来产生该组频谱值和该组增益值。
26.如权利要求25所述的方法,其特征在于,所述内插技术采用公式p(n+i)=(1-i/N)p(n-N)+i/N*p(n),其中p(n+i)是帧n+i的参数,其中i=0,1,...N-1,其中p(n)是当前周期内第一帧的参数,其中p(n-N)是最近第二个周期内第一帧的参数,而N由接收不连续传输系统的静音插入描述符帧来确定。
27.如权利要求24所述的方法,其特征在于,使用外插技术来产生该组频谱值和该组增益值。
28.如权利要求24所述的方法,其特征在于,使用重复技术来产生该组频谱值和该组增益值。
29.如权利要求24所述的方法,其特征在于,使用替换技术来产生该组频谱值和该组增益值。
30.如权利要求24所述的方法,其特征在于,使用下一个先前的静音插入描述符帧来产生该组频谱值和该组增益值。
31.如权利要求24所述的方法,其特征在于,所述连续不活动语音以八分之一速率被编码。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/774,440 | 2001-01-31 | ||
US09/774,440 US6631139B2 (en) | 2001-01-31 | 2001-01-31 | Method and apparatus for interoperability between voice transmission systems during speech inactivity |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1514998A CN1514998A (zh) | 2004-07-21 |
CN1239894C true CN1239894C (zh) | 2006-02-01 |
Family
ID=25101236
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB028065409A Expired - Lifetime CN1239894C (zh) | 2001-01-31 | 2002-01-30 | 语音不活动期间话音传输系统间互操作性的方法和装置 |
Country Status (13)
Country | Link |
---|---|
US (2) | US6631139B2 (zh) |
EP (2) | EP1356459B1 (zh) |
JP (1) | JP4071631B2 (zh) |
KR (1) | KR100923891B1 (zh) |
CN (1) | CN1239894C (zh) |
AT (1) | ATE428166T1 (zh) |
AU (1) | AU2002235512A1 (zh) |
BR (1) | BRPI0206835B1 (zh) |
DE (1) | DE60231859D1 (zh) |
ES (1) | ES2322129T3 (zh) |
HK (1) | HK1064492A1 (zh) |
TW (1) | TW580691B (zh) |
WO (1) | WO2002065458A2 (zh) |
Families Citing this family (56)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7012901B2 (en) * | 2001-02-28 | 2006-03-14 | Cisco Systems, Inc. | Devices, software and methods for generating aggregate comfort noise in teleconferencing over VoIP networks |
US7031916B2 (en) * | 2001-06-01 | 2006-04-18 | Texas Instruments Incorporated | Method for converging a G.729 Annex B compliant voice activity detection circuit |
US20020198708A1 (en) * | 2001-06-21 | 2002-12-26 | Zak Robert A. | Vocoder for a mobile terminal using discontinuous transmission |
JP4518714B2 (ja) * | 2001-08-31 | 2010-08-04 | 富士通株式会社 | 音声符号変換方法 |
CA2392640A1 (en) * | 2002-07-05 | 2004-01-05 | Voiceage Corporation | A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems |
DE60329947D1 (de) * | 2002-07-31 | 2009-12-17 | Interdigital Tech Corp | Verbesserter CDMA-TDD-Empfänger |
US7542897B2 (en) | 2002-08-23 | 2009-06-02 | Qualcomm Incorporated | Condensed voice buffering, transmission and playback |
CN1703736A (zh) * | 2002-10-11 | 2005-11-30 | 诺基亚有限公司 | 用于源控制可变比特率宽带语音编码的方法和装置 |
EP1808852A1 (en) * | 2002-10-11 | 2007-07-18 | Nokia Corporation | Method of interoperation between adaptive multi-rate wideband (AMR-WB) and multi-mode variable bit-rate wideband (VMR-WB) codecs |
US7406096B2 (en) * | 2002-12-06 | 2008-07-29 | Qualcomm Incorporated | Tandem-free intersystem voice communication |
US8254372B2 (en) | 2003-02-21 | 2012-08-28 | Genband Us Llc | Data communication apparatus and method |
KR100546758B1 (ko) * | 2003-06-30 | 2006-01-26 | 한국전자통신연구원 | 음성의 상호부호화시 전송률 결정 장치 및 방법 |
BRPI0508489A (pt) * | 2004-03-05 | 2007-07-31 | Vanu Inc | efeitos de instabilidade de controle |
US8027265B2 (en) | 2004-03-19 | 2011-09-27 | Genband Us Llc | Providing a capability list of a predefined format in a communications network |
US7990865B2 (en) | 2004-03-19 | 2011-08-02 | Genband Us Llc | Communicating processing capabilities along a communications path |
CA2567995A1 (en) * | 2004-06-09 | 2005-12-29 | Vanu, Inc. | Reducing backhaul bandwidth |
US8670988B2 (en) * | 2004-07-23 | 2014-03-11 | Panasonic Corporation | Audio encoding/decoding apparatus and method providing multiple coding scheme interoperability |
US7911945B2 (en) * | 2004-08-12 | 2011-03-22 | Nokia Corporation | Apparatus and method for efficiently supporting VoIP in a wireless communication system |
CN100369444C (zh) * | 2004-09-30 | 2008-02-13 | 北京信威通信技术股份有限公司 | 一种在scdma系统中非连续式传输全速率语音的方法 |
US20060095590A1 (en) * | 2004-11-04 | 2006-05-04 | Nokia Corporation | Exchange of encoded data packets |
US8102872B2 (en) * | 2005-02-01 | 2012-01-24 | Qualcomm Incorporated | Method for discontinuous transmission and accurate reproduction of background noise information |
US20070064681A1 (en) * | 2005-09-22 | 2007-03-22 | Motorola, Inc. | Method and system for monitoring a data channel for discontinuous transmission activity |
CN100442933C (zh) * | 2005-11-30 | 2008-12-10 | 华为技术有限公司 | 配置上行不连续发送dtx参数的方法 |
KR100790110B1 (ko) * | 2006-03-18 | 2008-01-02 | 삼성전자주식회사 | 모폴로지 기반의 음성 신호 코덱 방법 및 장치 |
CN101090359B (zh) * | 2006-06-13 | 2010-12-08 | 中兴通讯股份有限公司 | 基于不连续发送预测的流控方法 |
KR20080003537A (ko) * | 2006-07-03 | 2008-01-08 | 엘지전자 주식회사 | 이동 단말기의 통화 중 노이즈 제거 방법 및 이를 위한이동 단말기 |
US8135047B2 (en) * | 2006-07-31 | 2012-03-13 | Qualcomm Incorporated | Systems and methods for including an identifier with a packet associated with a speech signal |
US20080058004A1 (en) * | 2006-08-29 | 2008-03-06 | Motorola, Inc. | System and method for reassigning an uplink time slot from a circuit-switched gprs mobile device to a different packet-switched gprs mobile device |
EP2092517B1 (en) * | 2006-10-10 | 2012-07-18 | QUALCOMM Incorporated | Method and apparatus for encoding and decoding audio signals |
US8209187B2 (en) * | 2006-12-05 | 2012-06-26 | Nokia Corporation | Speech coding arrangement for communication networks |
US8346239B2 (en) * | 2006-12-28 | 2013-01-01 | Genband Us Llc | Methods, systems, and computer program products for silence insertion descriptor (SID) conversion |
US20080171537A1 (en) * | 2007-01-16 | 2008-07-17 | Hung-Che Chiu | Method of providing voice stock information via mobile apparatus |
CN101246688B (zh) * | 2007-02-14 | 2011-01-12 | 华为技术有限公司 | 一种对背景噪声信号进行编解码的方法、系统和装置 |
JP5530720B2 (ja) | 2007-02-26 | 2014-06-25 | ドルビー ラボラトリーズ ライセンシング コーポレイション | エンターテイメントオーディオにおける音声強調方法、装置、およびコンピュータ読取り可能な記録媒体 |
CN101355738B (zh) * | 2007-07-25 | 2011-07-13 | 中兴通讯股份有限公司 | 一种Abis接口不连续传输模式的语音传输装置及方法 |
US20090043577A1 (en) * | 2007-08-10 | 2009-02-12 | Ditech Networks, Inc. | Signal presence detection using bi-directional communication data |
CN101394660B (zh) * | 2007-09-17 | 2012-09-05 | 华为技术有限公司 | 一种确定下行发送模式的方法和装置 |
CN101394225B (zh) * | 2007-09-17 | 2013-06-05 | 华为技术有限公司 | 一种话音传输的方法和装置 |
CN100555414C (zh) * | 2007-11-02 | 2009-10-28 | 华为技术有限公司 | 一种dtx判决方法和装置 |
DE102008009720A1 (de) * | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Dekodierung von Hintergrundrauschinformationen |
CN101335000B (zh) * | 2008-03-26 | 2010-04-21 | 华为技术有限公司 | 编码的方法及装置 |
CN101783142B (zh) * | 2009-01-21 | 2012-08-15 | 北京工业大学 | 转码方法、装置和通信设备 |
US8352252B2 (en) * | 2009-06-04 | 2013-01-08 | Qualcomm Incorporated | Systems and methods for preventing the loss of information within a speech frame |
US8908541B2 (en) | 2009-08-04 | 2014-12-09 | Genband Us Llc | Methods, systems, and computer readable media for intelligent optimization of digital signal processor (DSP) resource utilization in a media gateway |
US8589153B2 (en) * | 2011-06-28 | 2013-11-19 | Microsoft Corporation | Adaptive conference comfort noise |
US8982741B2 (en) * | 2012-05-11 | 2015-03-17 | Intel Corporation | Method, system and apparatus of time-division-duplex (TDD) uplink-downlink (UL-DL) configuration management |
WO2014075208A1 (zh) * | 2012-11-13 | 2014-05-22 | 华为技术有限公司 | 语音类问题检测方法及应用语音通信网络系统的网元设备 |
EP3550562B1 (en) * | 2013-02-22 | 2020-10-28 | Telefonaktiebolaget LM Ericsson (publ) | Methods and apparatuses for dtx hangover in audio coding |
WO2015130508A2 (en) * | 2014-02-28 | 2015-09-03 | Dolby Laboratories Licensing Corporation | Perceptually continuous mixing in a teleconference |
CN104978970B (zh) | 2014-04-08 | 2019-02-12 | 华为技术有限公司 | 一种噪声信号的处理和生成方法、编解码器和编解码系统 |
CN105101109B (zh) * | 2014-05-15 | 2019-12-03 | 哈尔滨海能达科技有限公司 | 警用数字集群系统的不连续发送的实现方法、终端和系统 |
CN105336339B (zh) | 2014-06-03 | 2019-05-03 | 华为技术有限公司 | 一种语音频信号的处理方法和装置 |
JP2016038513A (ja) | 2014-08-08 | 2016-03-22 | 富士通株式会社 | 音声切替装置、音声切替方法及び音声切替用コンピュータプログラム |
US20160323425A1 (en) * | 2015-04-29 | 2016-11-03 | Qualcomm Incorporated | Enhanced voice services (evs) in 3gpp2 network |
EP3185646B1 (en) * | 2015-12-22 | 2018-11-07 | Intel IP Corporation | Method for sharing a wireless transmission medium in a terminal device and wireless communication device and wireless communication circuit related thereto |
WO2018164165A1 (ja) * | 2017-03-10 | 2018-09-13 | 株式会社Bonx | 通信システム、通信システムに用いられるapiサーバ、ヘッドセット、及び携帯通信端末 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5784532A (en) | 1994-02-16 | 1998-07-21 | Qualcomm Incorporated | Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system |
FR2739995B1 (fr) * | 1995-10-13 | 1997-12-12 | Massaloux Dominique | Procede et dispositif de creation d'un bruit de confort dans un systeme de transmission numerique de parole |
US5828662A (en) * | 1996-06-19 | 1998-10-27 | Northern Telecom Limited | Medium access control scheme for data transmission on code division multiple access (CDMA) wireless systems |
US6269331B1 (en) * | 1996-11-14 | 2001-07-31 | Nokia Mobile Phones Limited | Transmission of comfort noise parameters during discontinuous transmission |
US5868662A (en) * | 1997-06-16 | 1999-02-09 | Advanced Urological Developments | Method for improving observation conditions in urethra and a cystoscope for carrying out the method |
US6347081B1 (en) * | 1997-08-25 | 2002-02-12 | Telefonaktiebolaget L M Ericsson (Publ) | Method for power reduced transmission of speech inactivity |
US6108560A (en) * | 1997-09-26 | 2000-08-22 | Nortel Networks Corporation | Wireless communications system |
US6182035B1 (en) * | 1998-03-26 | 2001-01-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and apparatus for detecting voice activity |
CA2351571C (en) * | 1998-11-24 | 2008-07-22 | Telefonaktiebolaget Lm Ericsson | Efficient in-band signaling for discontinuous transmission and configuration changes in adaptive multi-rate communications systems |
US6389067B1 (en) * | 1999-06-10 | 2002-05-14 | Qualcomm, Inc. | Method and apparatus for using frame energy metrics to improve rate determination |
-
2001
- 2001-01-31 US US09/774,440 patent/US6631139B2/en not_active Expired - Lifetime
-
2002
- 2002-01-30 EP EP02702129A patent/EP1356459B1/en not_active Expired - Lifetime
- 2002-01-30 JP JP2002565303A patent/JP4071631B2/ja not_active Expired - Fee Related
- 2002-01-30 AT AT02702129T patent/ATE428166T1/de not_active IP Right Cessation
- 2002-01-30 CN CNB028065409A patent/CN1239894C/zh not_active Expired - Lifetime
- 2002-01-30 EP EP07023592A patent/EP1895513A1/en not_active Ceased
- 2002-01-30 KR KR1020037010174A patent/KR100923891B1/ko active IP Right Grant
- 2002-01-30 BR BRPI0206835A patent/BRPI0206835B1/pt active IP Right Grant
- 2002-01-30 DE DE60231859T patent/DE60231859D1/de not_active Expired - Lifetime
- 2002-01-30 ES ES02702129T patent/ES2322129T3/es not_active Expired - Lifetime
- 2002-01-30 WO PCT/US2002/003013 patent/WO2002065458A2/en active Application Filing
- 2002-01-30 AU AU2002235512A patent/AU2002235512A1/en not_active Abandoned
- 2002-01-31 TW TW091101675A patent/TW580691B/zh not_active IP Right Cessation
-
2003
- 2003-07-17 US US10/622,661 patent/US7061934B2/en not_active Expired - Lifetime
-
2004
- 2004-09-21 HK HK04107251A patent/HK1064492A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
ATE428166T1 (de) | 2009-04-15 |
US20040133419A1 (en) | 2004-07-08 |
US6631139B2 (en) | 2003-10-07 |
EP1895513A1 (en) | 2008-03-05 |
WO2002065458A3 (en) | 2002-11-14 |
JP4071631B2 (ja) | 2008-04-02 |
ES2322129T3 (es) | 2009-06-17 |
DE60231859D1 (de) | 2009-05-20 |
KR20030076646A (ko) | 2003-09-26 |
EP1356459A2 (en) | 2003-10-29 |
KR100923891B1 (ko) | 2009-10-28 |
TW580691B (en) | 2004-03-21 |
AU2002235512A1 (en) | 2002-08-28 |
BRPI0206835B1 (pt) | 2016-12-06 |
HK1064492A1 (en) | 2005-01-28 |
US7061934B2 (en) | 2006-06-13 |
CN1514998A (zh) | 2004-07-21 |
WO2002065458A2 (en) | 2002-08-22 |
BR0206835A (pt) | 2004-08-24 |
US20020101844A1 (en) | 2002-08-01 |
EP1356459B1 (en) | 2009-04-08 |
JP2004527160A (ja) | 2004-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1239894C (zh) | 语音不活动期间话音传输系统间互操作性的方法和装置 | |
CN1158647C (zh) | 话音编码设备的频谱幅度量化 | |
CN1223989C (zh) | 可变速率语音编码器中的帧擦除补偿法及用该方法的装置 | |
CN1432176A (zh) | 用于预测量化有声语音的方法和设备 | |
JP5149217B2 (ja) | 望ましくないパケット生成を減少する方法および装置 | |
KR100912030B1 (ko) | 무선 통신 시스템에서 비대칭 스피치 코더를 사용하여 비대칭 링크를 생성하는 방법 및 장치 | |
CN1161749C (zh) | 保持语言编码中目标比特率的方法和装置 | |
CN1201289C (zh) | 数字信号的编码和解码方法 | |
CN101006495A (zh) | 语音编码装置、语音解码装置、通信装置以及语音编码方法 | |
CN1437747A (zh) | 闭环多模混合域线性预测(mdlp)语音编解码器 | |
CN1347550A (zh) | Celp转发 | |
CN1193786A (zh) | 频谱幅度的双子帧量化 | |
CN1200404C (zh) | 具有脉冲序列约束的码激励线性预测语音编码器译码器 | |
JP2005503574A5 (zh) | ||
AU2002235538A1 (en) | Method and apparatus for reducing undesired packet generation | |
CN1728236A (zh) | 语音编码/解码方法及装置 | |
CA2293165A1 (en) | Method for transmitting data in wireless speech channels | |
US7233896B2 (en) | Regular-pulse excitation speech coder | |
CN1815894A (zh) | 一种音频信号编码的方法和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1064492 Country of ref document: HK |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CX01 | Expiry of patent term | ||
CX01 | Expiry of patent term |
Granted publication date: 20060201 |