CN1841499A - 代码转换装置和方法 - Google Patents
代码转换装置和方法 Download PDFInfo
- Publication number
- CN1841499A CN1841499A CNA2006100668263A CN200610066826A CN1841499A CN 1841499 A CN1841499 A CN 1841499A CN A2006100668263 A CNA2006100668263 A CN A2006100668263A CN 200610066826 A CN200610066826 A CN 200610066826A CN 1841499 A CN1841499 A CN 1841499A
- Authority
- CN
- China
- Prior art keywords
- code sequence
- controlled flag
- value
- code
- speech portion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 50
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000003860 storage Methods 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 4
- 230000014759 maintenance of location Effects 0.000 claims 2
- 238000012545 processing Methods 0.000 description 13
- 238000012360 testing method Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 238000011282 treatment Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000005086 pumping Methods 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 241001269238 Data Species 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 240000005373 Panax quinquefolius Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000011328 necessary treatment Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明公开了一种代码转换装置和方法。代码转换方法用于将遵循第一语音编码方案的第一代码序列转换成遵循第二语音编码方案的第二代码序列。该方法包括以下步骤。第一步骤判别第一代码序列是对应于语音部分还是非语音部分,并生成指示判别结果的数值作为控制标志。第二步骤在控制标志的值对应于语音部分时,将第一代码序列转换成第二代码序列,并输出所述第二代码序列。第三步骤在控制标志的值对应于非语音部分时,输出与控制标志的值相对应的第二代码序列。
Description
技术领域
本发明涉及用于以低比特率发送或存储语音信号的编码和解码技术。具体而言,本发明涉及用于将通过以第一语音编码方案编码语音信号所获得的第一代码序列转换成用另一语音编码方案可解码的第二代码序列的代码转换(代码转换,transcoding)技术。
背景技术
码激励线性预测(CELP)是公知的以中低比特率来高效地编码语音信号的语音编码方案之一。CELP方案在以下文献中有所描述:
[1]M.R.Schroeder和B.S.Atal,“Code excited linear prediction:highquality speech at very low bit rates”,Proc.of IEEE Int.Conf.On Acoustics,Speech and Signal Processing,第937-940页,1985年。
根据CELP方案,编码器从输入的语音信号中分离出用于表征线性预测(LP)滤波器的线性预测系数和用于激励该LP滤波器的激励信号。编码器对LP系数和激励信号编码,并将它们发送到解码器。解码器将接收到的LP系数设置给其LP滤波器,并利用接收到的激励信号激励该LP滤波器,以再现高质量的语音信号。
该激励信号通过自适应码本(ACB)和固定码本(FCB)的加权和来表示。ACB包含输入的语音信号的基音周期,而FCB由随机数和脉冲构成。将ACB和FCB分量分别乘以它们各自的增益(ACB增益和FCB增益),从而产生激励信号。
当例如3G(第三代)移动网络和有线分组网络被互连时,在这些网络中使用的标准语音编码方案可能不同。因此,为了实现这两个网络的直接连接,将需要在不同语音编码方案之间的代码转换技术(即,代码转换)。已知串联(tandem)连接是用于语音编码的代码转换技术之一。
图1示出了基于传统串联连接的代码转换装置。这种代码转换装置将利用第一语音编码方案产生的第一代码序列转换成将以第二语音编码方案解码的第二代码序列。
参考图1,下面将描述传统的代码转换装置。代码序列按帧周期(例如20毫秒)被输入和输出,所述帧周期是语音编码和解码的处理单位。如随后将描述的,每一帧包含头部和有效载荷。
在图1中,代码序列转换电路1100由语音解码电路1050和语音编码电路1060构成。语音解码电路1050利用第一语音编码方案对被提供到输入端子10的第一代码序列进行解码。语音编码电路1060利用第二语音编码方案对从语音解码电路1050输出的解码后的语音信号进行编码(或重编码),以生成第二代码序列。
关于语音编码和解码方案,可以在以上参考文献[1]和以下文献中找到其详细描述:
[2]3GPP TS 26.090,“AMR Speech Codec;Transcoding Functions”
但是,图1中的代码转换装置需要大量处理来实现代码转换。其原因在于,在此代码转换装置中,语音解码电路对第一代码序列解码并对解码后的语音信号进行重编码。
US 2003/0065506A(参考文献[3])公开了一种代码转换装置,该装置在无需解码第一代码序列中的非语音部分的情况下,将第一输入代码序列转换成第二语音编码方案的代码序列。
在此代码转换装置中,代码分离部分将第一代码序列中的非语音代码分成多个元素码(element code),并且非语音代码转换部分将这些元素码转换成用于第二语音编码方案的多个元素码。该代码转换装置对通过该转换获得的第二元素码进行复用,以输出第二非语音代码序列。该代码转换装置还对该第二非语音代码序列和正由语音代码转换部分进行转换的第二语音代码序列进行复用,并输出第二代码序列。
该代码转换装置需要非语音代码转换电路,该电路将第一非语音代码序列转换成第二非语音代码序列。该非语音代码转换需要大量处理。例如,考虑遵循AMR方案的非语音代码序列被转换成遵循ITU-TRecommendation G.729的非语音代码序列的情况。每个代码序列包含指示谱包络的LP系数信息和用于每个帧的功率信息,作为舒适噪声(CN)信息。
但是,用于AMR方案的编码器每8帧发送这8帧期间LP系数和功率信息的平均值。另一方面,用于G.729的编码器非周期性地发送前6帧期间LP系数信息的平均值或当前帧的LP系数信息的值。用于G.729的编码器还发送前3帧期间功率信息的平均值或当前帧的功率信息的值。
即,在这两种语音编码方案之间,不仅对于CN信息的具体代码是不同的,而且对于每个元素码的发送间隔也是不同的。因此,在参考文献[3]中给出的非语音代码转换电路需要大量用于转换元素码的处理。
发明内容
本发明的第一示例性特征提供了一种代码转换装置,其减少了上述代码转换的处理量。
根据本发明的第一示例性方面,提供了一种用于将遵循第一语音编码方案的第一代码序列转换成遵循第二语音编码方案的第二代码序列的代码转换方法。该方法包括以下步骤。第一步骤判别第一代码序列是对应于语音部分还是非语音部分,并生成指示判别结果的数值作为控制标志。第二步骤在控制标志的值对应于语音部分时,将第一代码序列转换成第二代码序列,并输出所述第二代码序列。第三步骤在控制标志的值对应于非语音部分时,输出与控制标志的值相对应的第二代码序列。
本发明的第一示例性方面减少了在遵循第一语音编码方案的第一代码序列被转换成遵循第二语音编码方案的第二代码序列时,与非语音代码相关的处理量。其原因在于本发明的第一示例性方面基于从第一代码序列获得的信息来判别该代码序列是对应于语音部分还是非语音部分。指示该判别结果的数值被生成作为控制标志。并且,本发明的第一示例性方面基于该控制标志的值来生成第二代码序列的非语音部分。根据本发明第一示例性方面的非语音部分代码序列的转换不需要由利用第一语音编码方案进行解码和利用第二语音编码方案进行重编码而构成的过程。
本发明的第一示例性方面与如参考文献[2]所表示的非语音部分代码序列被转换成针对其他语音编码方案的非语音部分代码序列的转换过程相比,大大减少了处理量。其原因在于本发明第一示例性实施例不将第一非语音代码序列转换成针对第二语音编码方案的非语音代码序列,而是基于指示从第一代码序列获得的代码序列的类型的信息,来生成与针对第二语音编码方案的非语音部分相对应的代码序列(或输出预先存储的代码序列)。因此,代码转换所需的计算量可被大大减小。
从对优选实施例的描述中,本发明的其他特征和方面将变得清楚。
附图说明
从以下结合附图的详细描述中,将更全面地理解本发明的上述和其他目的、新颖特征和优点,附图中:
图1是示出现有技术的代码转换装置的框图;
图2是示出本发明的代码转换装置的第一实施例的框图;
图3示出了根据AMR语音编码方案的帧类型、有效载荷尺寸和有效载荷类型之间的关系;
图4是示出本发明的代码转换装置的第二实施例的框图;
图5是示出本发明的代码转换装置的第三实施例的框图;
图6是示出本发明的代码转换装置的第四实施例的框图;以及
图7是示出本发明的代码转换装置的第五实施例的框图。
具体实施方式
首先,说明本发明的概要和原理。
在以下描述中,“非语音”指的是除话音和音乐之外的声音。“非语音”包括静音、噪声、音调等等。
本发明的方法具有以下基本步骤。
[步骤A]该步骤利用包含在第一代码序列的每一帧中的信息来判别该帧中的第一代码序列是对应于语音部分还是对应于非语音部分,并生成指示判别结果的控制标志。
[步骤B]当控制标志指示语音部分时,该步骤将第一代码序列转换成第二代码序列。
[步骤C]当控制标志指示非语音部分时,该步骤生成与控制标志的值相对应的第二代码序列。步骤C可以读取和输出与非语音的类型信息相对应的预先存储的第二代码序列。
步骤A可以由以下步骤A1和A2代替。
[步骤A1]该步骤利用第一解码方法对来自第一代码序列的语音信号解码。
[步骤A2]该步骤利用解码后的语音信号来生成指示所述第一代码序列是与语音部分相对应还是与非语音部分相对应的控制标志。
本发明基于从第一代码序列获得的信息,判别指示第一代码序列与语音部分或非语音部分中的哪个相对应的类型信息。此外,本发明判别非语音部分的类型信息。如果非语音部分的类型数目仅为1,则用于该非语音部分的控制标志值的数目为1。当第一代码序列对应于非语音部分时,本发明基于该控制标志的值,生成用于第二语音编码方案的非语音代码序列,而无需执行代码转换过程(利用第一语音编码方案解码并利用第二语音编码方案对解码后的信号进行重编码)。
因此,本发明根据非语音部分占整个代码序列的比率,减少如下处理所需的处理量:利用针对第一语音编码方案的语音解码电路对第一代码序列解码,然后利用针对第二语音编码方案的语音编码电路对通过所述解码获得的语音信号进行重编码。一般而言,用于非语音部分的时间比例大于用于语音部分的。因此,即使如串联连接中那样,语音部分被解码和重编码,由本发明实现的必要处理量减少的效果也是显著的。
此外,本发明不需要对参考文献[3]中的技术来说必不可少的过程,即用于分离元素码,转换分离出的元素码和对转换后的元素码进行复用的过程。因此,本发明可以缩短转换非语音代码序列所需的时间。
实施例1
接下来,将参考图2来详细描述本发明的实施例1,图2是示出实施例1的结构的框图。
在图2中,与作为现有技术示例的图1中出现的元件相同或等同的元件被标以相同的标号。在图2中,除了开始条件不同于图1中的那些元件之外,输入端子10、输出端子20、语音解码电路1050和语音编码电路1060提供基本与图1所示的那些元件相同的功能。下面对实施例1的描述省略了对上述相同或等同元件的说明,并集中描述与图1所示结构之间的不同。即,下面集中于帧类型提取电路1200、判别电路1300、代码序列生成电路1400、第一开关1110和第二开关1120来描述实施例1。
帧类型提取电路1200从提供到输入端子10的第一代码序列中分离出头部和有效载荷。然后,帧类型提取电路1200从该头部中提取出帧类型信息,并将该帧类型信息输出到判别电路1300。
判别电路1300接收来自帧类型提取电路1200的帧类型信息。判别电路1300基于该帧类型信息生成控制标志。判别电路1300将该控制标志输出到第一开关1110、第二开关1120和代码序列生成电路1400。当帧类型信息指示语音部分时,判别电路1300输出值为“0”的控制标志。当帧类型信息指示噪声时,判别电路1300输出值为“1”的控制标志。当帧类型信息指示静音时,判别电路1300输出值为“2”的控制标志。即,基于帧类型信息,实施例1获得该帧内的第一代码序列的类型信息。
一般而言,第一代码序列包括头部和有效载荷。由于头部包含帧类型信息,因此判别电路无需解码第一代码序列,就可以判别来自该帧内的第一代码序列的解码后信号是对应于语音部分还是非语音部分(静音或噪声)。
头部和帧类型信息的细节在以下文献中有所描述:
[4]3GPP TS 26.101,“AMR Speech Codec Frame Structure”
当帧类型信息指示语音时,有效载荷包含与代表语音信号的参数(语音参数)相对应的代码序列。这里,语音参数例如包括LP系数、ACB、FCB、ACB增益和FCB增益。另一方面,当帧类型信息指示非语音时,有效载荷包含代表噪声的代码序列(噪声参数)。噪声参数例如包括LP系数和帧能量。
非语音有效载荷的尺寸小于语音有效载荷的尺寸,或等于0。即,对于语音部分和非语音部分,有效载荷的尺寸具有不同值。
因此,通过判别第一代码序列中的有效载荷尺寸或帧尺寸来代替判别帧类型信息,实施例1的判别电路可以针对每一帧判别来自第一代码序列的解码后信号是对应于语音部分还是非语音部分。
根据上述参考文献[4],当语音信号以12.2kbit/s的比特率被编码时,有效载荷的类型(语音、非语音或静音)、有效载荷的尺寸和帧类型之间的关系如图3所示。
在图2中,第一开关1110接收来自输入端子10的第一代码序列和来自判别电路1300的控制标志。当控制标志为“0”(指示语音)时,第一开关将第一代码序列输出到语音解码电路1050。当控制标志是“1”(指示噪声)或“2”(指示静音)时,第一开关不输出第一代码序列。
这里,实施例1可被修改为使得在控制标志为“0”或“1”时,第一开关将第一代码序列输出到语音解码电路1050。
虽然实施例1的代码序列转换电路1100具有与图1中相似的结构,但是图2中的代码序列转换电路1100只对从第一开关提供的第一代码序列利用语音解码电路1050进行解码和利用语音编码电路1060进行重编码。
代码序列生成电路1400生成与非语音部分的第一代码序列相对应的第二代码序列,并将该第二代码序列输出到第二开关1120。这里,“生成与非语音部分的第一代码序列相对应的第二代码序列”意思是“生成与控制标志的值相对应的噪声、静音或音调的第二代码序列”。
接下来,将说明控制标志指示静音的情况。在生成第二非语音代码序列时,代码序列生成电路1400参考控制标志的值。
例如,如果第二语音编码方案遵循3GPP AMR编解码器,则针对静音的有效载荷尺寸为0比特,如上所述。在此情况下,所生成的第二代码序列只包含头部(帧类型为15)。
并且,例如如果第二语音编码方案遵循ITU-T RecommendationG.711,则指示静音的代码是0xFF,而有效载荷由0xFF代码构成,这些0xFF代码的数目等于与帧长度相对应的样本数目。例如,如果帧长度是20毫秒并且采样频率是8000Hz,则与帧长度相对应的样本数目被计算为160。因此,在此情况下的有效载荷是1280比特数据,该数据具有160个0xFF代码。
G.711的细节在以下文献中给出:
[5]ITU-T Recommendation G.711,“Pulse Code Modulation(PCM)of Voice Frequencies”
虽然以上描述涉及生成针对静音的第二代码序列的示例,但是在本实施例中生成针对噪声的第二代码序列也是可能的。例如,代码序列生成电路1400在内部存储了遵循第二语音编码方案的预先编码的噪声。然后,代码序列生成电路1400可以根据控制标志的值生成该编码后的噪声。
这里,代码序列生成电路可被修改为当控制标志值为“0(语音)”之外的值时,输出与预定的替代信号(例如由该实施例的上层装置确定的替代信号)相对应的第二代码序列。例如,代码序列生成电路可被修改为即使在控制标志值指示非语音部分(“静音”、“噪声”、“音调”等)时,也输出与“静音”相对应的第二代码序列。此外,代码序列生成电路可被修改为即使在控制标志值指示非语音部分时,也输出与具有小幅度的“噪声”相对应的第二代码序列。
在图2中,当由判别电路1300提供的控制标志为“0”(指示语音)时,第二开关1120将从语音编码电路1060输出的第二代码序列输出到输出端子20。并且,当所述标志是“1”(指示噪声)或“2”(指示静音)或“3”(音调)时,第二开关1120将从代码序列生成电路1400输出的第二代码序列输出到输出端子20。
这里,如上所述,实施例1可被修改为使得当控制标志为“0”或“1”时,第二开关1120将从语音编码电路1060输出的第二代码序列输出到输出端子20。
由于该实施例无需修改语音解码电路和语音编码电路,因此遵循各自标准编码方案的所述语音解码电路和所述语音编码电路可照原样被使用。
当输入语音编码方案(第一方案)和输出语音编码方案(第二方案)是相同类型或甚至不同类型时,本实施例带来了减少处理量的效果。例如,当输入语音编码方案和输出语音编码方案是相同类型时,这对应于改变比特率。即使在这种情况下,实施例1也可以减少用于非语音部分的处理量。
此外,如果第一代码序列的第一编码方案与第二代码序列的第二编码方案相同,则本实施例还可以按如下方式来修改。在此情况下,该修改形式不要求语音部分的代码转换功能。即,在此修改形式中,图2的代码序列转换电路1100不是必须的,并且第一开关1110和第二开关1120被直接连接。
实施例2
图4是示出根据本发明的代码转换装置的实施例2的结构的图。在图4中,与图2中相同或等同的元件被标以相同的标号。
在本实施例中,在实施例1中串联连接的代码序列转换电路1100被第二代码序列转换电路2100所取代。因此,下面将描述第二代码序列转换电路2100。
第二代码序列转换电路2100对与从第一开关1110提供的语音部分的第一代码序列的语音参数相对应的每个代码执行代码转换。并且,第二代码序列转换电路2100将由通过该代码转换转换而成的代码构成的代码序列输出到第二开关1120。无串联连接的代码转换的细节在以下文献中有所描述:
[6]Hong-Goo Kang等,“Improving transcoding capability of speechcoders in clean and frame erasured channel environments”,Proc.of IEEEWorkshop on Speech Coding 2000,第78-80页,2000年。
实施例3
图5是示出根据本发明的代码转换装置的实施例3的结构的图。在图5中,与图2中相同或等同的元件被标以相同的标号。在图5中,输入端子10、输出端子20、语音解码电路1050和第二开关1120除了这些元件之间的互连有部分不同之外,基本上是与图1和2中的那些元件相同的元件。以下对实施例3的描述省略了对上述相同或等同元件的说明,并且说明与图2所示结构之间的差异,即语音信号检测电路3200、代码序列生成电路3400和语音编码电路1061。
在图5中,语音解码电路1050将解码后的语音信号提供到语音信号检测电路3200。当该解码后的语音信号对应于语音部分时,语音检测电路3200输出控制标志“0”。当该解码后的语音信号对应于非语音部分时,语音检测电路3200输出控制标志“1”。该控制标志被提供到语音编码电路1061、代码序列生成电路3400和第二开关1120。
这里,语音信号检测电路3200通过利用可从解码后的语音信号计算出的诸如基音周期、谱斜率、语音功率等表征语音信号的特征量,计算该控制标志。即,语音信号检测电路将相应的值设置给控制标志,以判别这些特征量是对应于语音部分还是非语音部分。该控制标志可以将非语音部分分类为噪声部分和静音部分,如在实施例1中的判别电路1300的输出中所发现的那样。
例如,在语音功率的特征量的情况下,最简单的方法是使具有相对较大功率的部分与语音部分相对应,并使具有相对较小功率的部分与非语音部分相对应。因此,语音信号检测电路3200在功率大时将控制标志设置为“0”,在功率小时将控制标志设置为“1”。
用于将语音信号分类为语音和非语音部分的方法的细节在以下文献中有所描述:
[7]3GPP TS 26.094,“AMR Speech Codec;Voice Activity Detector(VAD)”
非语音部分并不局限于噪声或静音。例如,音调信号也可被看作非语音部分。在此情况下,语音信号检测电路3200提供音调信号检测电路的附加功能。并且,该语音信号检测电路在解码后的语音信号对应于音调信号时,将控制标志例如设置为“3”。
用于检测音调信号的方法的细节在EP-A-1395065,“Tone detectorand method therefore”(参考文献[8])中有所描述。
在图5中,代码序列转换电路1101由语音解码电路1050和语音编码电路1061构成。
控制标志被从语音信号检测电路3200提供到语音编码电路1061。当该控制标志值为“0”(指示语音部分)时,语音编码电路1061利用第二语音编码方案对从语音解码电路1050输出的解码后的语音信号进行重编码。然后,语音编码电路1061将通过该重编码获得的代码序列提供到第二开关1120作为第二代码序列。语音编码电路1061除了语音编码处理是基于控制标志的值来执行或不执行之外,具有与图1中的语音编码电路1060类似的结构。
当从语音信号检测电路3200输出的控制标志指示除语音部分值之外的其他值时,代码序列生成电路3400生成与静音、噪声或音调相对应的第二代码序列。这样生成的第二代码序列被提供到第二开关1120。这里,代码序列生成电路3400以与图2和图4中的代码序列生成电路1400相同的方式来生成与静音或噪声相对应的第二代码序列。
与图2中的代码序列生成电路1400相同,代码序列生成电路3400可被修改为在控制标志值为除了“0(语音)”之外的值时,输出与预定的替代信号(例如由本实施例的上层装置确定的替代信号)相对应的第二代码序列。例如,代码序列生成电路可被修改为即使在控制标志值指示非语音部分(“静音”、“噪声”、“音调”等等)时,无论控制标志值如何,都输出与“静音”相对应的第二代码序列。此外,代码序列生成电路可被修改为即使在控制标志值指示非语音部分时,也输出与具有小幅度的“噪声”相对应的第二代码序列。
实施例4
图6是根据本发明的代码转换装置的实施例4的结构的图。在图6中,与图2中相同或等同的元件被标以相同的标号。
在本实施例中,实施例1中的代码序列生成电路1400被代码序列输出电路3000所取代。这种取代可被应用于实施例2和3。
下文中将说明该代码序列输出电路。
代码序列输出电路3000由存储器电路3001和输出电路3002构成。
存储器电路3001以与控制标志值相关的方式预先存储与非语音部分(静音等)相对应的第二代码序列。
例如,当第二语音编码方案遵循3GPP AMR编解码器时,第二代码序列只包含头部(帧类型为15),这是因为针对静音的有效载荷尺寸为0比特,如上所述。
当第二语音编码方案遵循ITU-T G.711时,有效载荷由0xFF代码构成,这些0xFF代码的数目与对应于帧长度的样本的数目相同。例如,如果帧长度是20毫秒并且采样频率为8000Hz,则与帧长度相对应的样本数目被计算为160。在此情况下的有效载荷被看成是具有160个0xFF代码的1280比特数据。ITU-T G.711的细节在上述参考文献[5]中给出。
以上说明用于生成针对静音的第二代码序列。如实施例1类似,针对噪声的代码序列也可以被预先存储在存储器电路3001中。
输出电路3002根据控制标志的值读出存储在存储器电路3001中的第二代码序列,并将该第二代码序列提供到第二开关1120。
在本实施例中,与实施例1类似,第二开关1120在控制标志为“0”(指示语音部分)时,将从语音编码电路1060输出的第二代码序列输出到输出端子20。当控制标志是“1”(指示噪声)或“2”(指示静音)时,第二开关1120输出从代码序列输出电路3000输出的第二代码序列。这里,与实施例1类似,第二开关1120可以在控制标志为“0”或“1”时,将从语音编码电路1060输出的第二代码序列提供到输出端子2。
实施例5
在根据本发明的上述实施例中的每一个中的代码转换装置都可以在诸如数字信号处理器之类的计算机的控制下实现。在实施例5中,将说明在诸如数字信号处理器之类的计算机的控制下的代码转换装置。
图7示意性地示出了一种装置的结构,其中,在根据本发明的上述实施例1到4中的代码转换处理由计算机来实现。实施例5包括计算机1和记录介质读出装置5。计算机1包含CPU(中央处理单元)2、存储器3和记录介质读出装置接口4。存储有计算机程序的记录介质6被装配在记录介质读出装置5中。CPU 2首先将存储在记录介质6中的程序经由记录介质读出装置接口4下载到存储器3中,并执行与上述实施例1到4中操作类似的操作。
用于执行以下处理的程序被存储在记录介质6中。
(A)通过使用包含在第一代码序列中的信息,判别第一代码序列是对应于语音部分还是非语音部分,并输出指示判别结果的控制标志的处理;
(B)在该控制标志指示语音部分时,将第一代码序列转换成第二代码序列的处理;以及
(C)在该控制标志指示非语音时,生成针对与该标志相对应的非语音的第二代码序列的处理。
处理(A)可以利用以下处理(A1)和(A2)来实现。
(A1)利用第一解码方法对来自第一代码序列的语音信号进行解码的处理;和
(A2)利用解码后的语音信号,判别第一代码序列是对应于语音还是非语音,并输出指示判别结果的控制标志的处理。
在图7中,经由记录介质读出装置5和记录介质读出装置接口4,所述程序被从记录介质6中读出到存储器3中用于执行。上述程序可被存储在非易失性存储器中,例如掩膜ROM、闪存等等。记录介质除了非易失性存储器之外,还包括CD-ROM、FD、数字多功能盘(DVD)、磁带(MT)、便携式HDD等等。此外,当计算机通过通信介质接收来自服务器装置的程序时,记录介质还包括用于承载程序的有线或无线通信介质。
此外,处理(C)可以由以下处理(C1)来实现。
(C1)通过从针对非语音预先存储的第二代码序列中选择所述第二代码序列,输出与控制标志相对应的第二代码序列的处理。在此情况下,优选地,将针对非语音的第二代码序列预先存储在记录介质6中作为程序的一部分。
虽然已经结合某些示例性实施例描述了本发明,但是将会理解,由本发明包含的主题并不局限于这些特定实施例。而是,本发明的主题希望包括可被包括在所附权利要求书的精神和范围内的所有替换、修改和等同物。此外,发明人希望即使权利要求在申请过程中被修改,也要保留所有等同物。
Claims (33)
1.一种代码转换方法,用于将遵循第一语音编码方案的第一代码序列转换成遵循第二语音编码方案的第二代码序列,所述方法包括以下步骤:
A)判别所述第一代码序列是对应于语音部分还是非语音部分,并生成指示判别结果的值作为控制标志;
B)当所述控制标志的值对应于语音部分时,将所述第一代码序列转换成第二代码序列并输出该代码序列;以及
C)当控制标志的值对应于非语音部分时,输出与所述控制标志的值相对应的第二代码序列。
2.如权利要求1所述的方法,其中,所述步骤A)通过使用包含在所述第一代码序列中的信息来生成所述控制标志。
3.如权利要求2所述的方法,其中,所述步骤A)基于在所述第一代码序列内的一帧中所包含的帧类型信息来生成所述控制标志。
4.如权利要求2所述的方法,其中,所述步骤A)基于在所述第一代码序列内的一帧中所包含的帧尺寸来生成所述控制标志。
5.如权利要求4所述的方法,其中,所述帧尺寸由该帧中的有效载荷尺寸来代表。
6.如权利要求1所述的方法,其中,所述步骤A)包括以下步骤:
A1)利用第一解码方法,从所述第一代码序列生成解码后的语音信号;以及
A2)基于所述解码后的语音信号,判别生成所述控制标志的第一代码序列是对应于语音部分还是非语音部分,并生成所述控制标志。
7.如权利要求1所述的方法,其中,所述步骤C)从与非语音部分相对应的一个或多个预先存储的第二代码序列中输出与所述控制标志相对应的第二代码序列。
8.如权利要求1所述的方法,其中,所述步骤B)包括:
B1)当所述控制标志的值对应于语音部分时,利用第一解码方法从所述第一代码序列生成解码后的语音信号;以及
B2)利用第二编码方法对所述解码后的语音信号重编码,并生成所述第二代码序列。
9.如权利要求1所述的方法,其中,所述第一语音编码方案和所述第二语音编码方案是相同的。
10.如权利要求9所述的方法,其中,所述步骤B)当所述控制标志的值对应于所述语音部分时,输出所述第一代码序列作为所述第二代码序列。
11.如权利要求1所述的方法,其中,所述步骤C)当所述控制标志的值指示所述非语音部分时,输出与预定信号或来自外部的指定信号相对应的第二代码序列。
12.一种代码转换装置,用于将遵循第一语音编码方案的第一代码序列转换成遵循第二语音编码方案的第二代码序列,所述装置包括:
判别单元,所述判别单元判别所述第一代码序列是对应于语音部分还是非语音部分,并生成指示判别结果的值作为控制标志;
语音部分转换单元,所述语音部分转换单元当所述控制标志的值对应于语音部分时,将所述第一代码序列转换成所述第二代码序列并输出该代码序列;
非语音部分生成单元,所述非语音部分生成单元当控制标志的值对应于非语音部分时,输出与所述控制标志的值相对应的第二代码序列。
13.如权利要求10所述的装置,其中,所述判别单元通过使用包含在所述第一代码序列中的信息来生成所述控制标志。
14.如权利要求13所述的装置,其中,所述判别单元基于在所述第一代码序列内的一帧中所包含的帧类型信息来生成所述控制标志。
15.如权利要求13所述的装置,其中,所述判别单元基于在所述第一代码序列内的一帧中所包含的帧尺寸来生成所述控制标志。
16.如权利要求13所述的装置,其中,所述帧尺寸由该帧中的有效载荷尺寸来代表。
17.如权利要求12所述的装置,其中,所述判别单元包括:
解码器,所述解码器利用第一解码方法,从所述第一代码序列生成解码后的语音信号;以及
语音检测电路,所述语音检测电路基于所述解码后的语音信号,判别第一代码序列是对应于语音部分还是非语音部分,并输出所述控制标志。
18.如权利要求12所述的装置,其中,所述非语音部分生成单元从与非语音部分相对应的一个或多个预先存储的第二代码序列中生成与所述控制标志相对应的第二代码序列。
19.如权利要求12所述的装置,其中,所述语音部分转换单元包括:
解码器,所述解码器当所述控制标志的值对应于语音部分时,利用第一解码方法从所述第一代码序列生成解码后的语音信号;以及
重编码器,所述重编码器利用第二编码方法对所述解码后的语音信号重编码,并生成所述第二代码序列。
20.如权利要求12所述的装置,其中,所述第一语音编码方案和所述第二语音编码方案是相同的。
21.如权利要求20所述的装置,其中,所述非语音部分生成单元当所述控制标志的值对应于所述语音部分时,输出所述第一代码序列作为所述第二代码序列。
22.如权利要求12所述的装置,其中,所述语音部分转换单元当所述控制标志的值指示所述非语音部分时,输出与预定信号或来自外部的指定信号相对应的所述第二代码序列。
23.一种记录有程序的记录介质,所述程序用于计算机执行代码转换方法,以将遵循第一语音编码方案的第一代码序列转换成遵循第二语音编码方案的第二代码序列,所述程序包括以下步骤:
A)判别所述第一代码序列是对应于语音部分还是非语音部分,并生成指示判别结果的值作为控制标志;
B)当所述控制标志的值对应于语音部分时,将所述第一代码序列转换成第二代码序列并输出该代码序列;以及
C)当控制标志的值对应于非语音部分时,输出与所述控制标志的值相对应的第二代码序列。
24.如权利要求23所述的记录介质,其中,所述步骤A)通过使用包含在所述第一代码序列中的信息来生成所述控制标志。
25.如权利要求24所述的记录介质,其中,所述步骤A)基于在所述第一代码序列内的一帧中所包含的帧类型信息来生成所述控制标志。
26.如权利要求24所述的记录介质,其中,所述步骤A)基于在所述第一代码序列内的一帧中所包含的帧尺寸来生成所述控制标志。
27.如权利要求26所述的记录介质,其中,所述帧尺寸由该帧中的有效载荷尺寸来代表。
28.如权利要求23所述的记录介质,其中,所述步骤A)包括以下步骤:
A1)利用第一解码方法,从所述第一代码序列生成解码后的语音信号;以及
A2)基于所述解码后的语音信号,判别第一代码序列是对应于语音部分还是非语音部分,并输出所述控制标志。
29.如权利要求19所述的记录介质,其中,所述步骤C)是用于从与非语音部分相对应的一个或多个预先存储的第二代码序列中生成与所述控制标志相对应的第二代码序列的步骤。
30.如权利要求23所述的记录介质,其中,所述步骤B)包括:
B1)当所述控制标志的值对应于语音部分时,利用第一解码方法从所述第一代码序列生成解码后的语音信号;以及
B2)利用第二编码方法对所述解码后的语音信号重编码,并生成所述第二代码序列。
31.如权利要求23所述的记录介质,其中,所述第一语音编码方案和所述第二语音编码方案是相同的。
32.如权利要求31所述的记录介质,其中,所述步骤B)当所述控制标志的值对应于所述语音部分时,输出所述第一代码序列作为所述第二代码序列。
33.如权利要求23所述的记录介质,其中,所述步骤C)当所述控制标志的值指示所述非语音部分时,输出与预定信号或来自外部的指定信号相对应的所述第二代码序列。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005095735A JP4793539B2 (ja) | 2005-03-29 | 2005-03-29 | 符号変換方法及び装置とプログラム並びにその記憶媒体 |
JP2005095735 | 2005-03-29 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1841499A true CN1841499A (zh) | 2006-10-04 |
Family
ID=36660723
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2006100668263A Pending CN1841499A (zh) | 2005-03-29 | 2006-03-29 | 代码转换装置和方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US8374852B2 (zh) |
EP (1) | EP1708174B1 (zh) |
JP (1) | JP4793539B2 (zh) |
KR (1) | KR100796836B1 (zh) |
CN (1) | CN1841499A (zh) |
CA (1) | CA2539675A1 (zh) |
DE (1) | DE602006001889D1 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004151123A (ja) * | 2002-10-23 | 2004-05-27 | Nec Corp | 符号変換方法、符号変換装置、プログラム及びその記憶媒体 |
CN101584248B (zh) * | 2007-01-18 | 2013-01-02 | 艾利森电话股份有限公司 | 沿复杂的呼叫路径控制编解码器选择的技术 |
IL205394A (en) * | 2010-04-28 | 2016-09-29 | Verint Systems Ltd | A system and method for automatically identifying a speech encoding scheme |
TWI591620B (zh) | 2012-03-21 | 2017-07-11 | 三星電子股份有限公司 | 產生高頻雜訊的方法 |
JP6929062B2 (ja) | 2016-12-28 | 2021-09-01 | キヤノン株式会社 | 印刷システム、印刷システムの制御方法、及びプログラム |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63231500A (ja) | 1987-03-20 | 1988-09-27 | 松下電器産業株式会社 | 音声符号化方式 |
FI101439B (fi) * | 1995-04-13 | 1998-06-15 | Nokia Telecommunications Oy | Transkooderi, jossa on tandem-koodauksen esto |
JPH08330972A (ja) | 1995-06-01 | 1996-12-13 | Japan Radio Co Ltd | 音声符号化装置及び音声符号化伝送速度低減方法 |
FI105001B (fi) * | 1995-06-30 | 2000-05-15 | Nokia Mobile Phones Ltd | Menetelmä odotusajan selvittämiseksi puhedekooderissa epäjatkuvassa lähetyksessä ja puhedekooderi sekä lähetin-vastaanotin |
SE516595C2 (sv) * | 1998-03-13 | 2002-02-05 | Ericsson Telefon Ab L M | Kommunikationsanordning och arbetssätt för behandling av röstmeddelanden |
US6766291B2 (en) * | 1999-06-18 | 2004-07-20 | Nortel Networks Limited | Method and apparatus for controlling the transition of an audio signal converter between two operative modes based on a certain characteristic of the audio input signal |
JP4438127B2 (ja) * | 1999-06-18 | 2010-03-24 | ソニー株式会社 | 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体 |
US7010001B2 (en) * | 2000-01-10 | 2006-03-07 | Qualcomm, Incorporated | Method and apparatus for supporting adaptive multi-rate (AMR) data in a CDMA communication system |
US20020016161A1 (en) * | 2000-02-10 | 2002-02-07 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and apparatus for compression of speech encoded parameters |
JP3496618B2 (ja) | 2000-03-16 | 2004-02-16 | 日本電気株式会社 | 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法 |
JP2001316753A (ja) | 2000-05-10 | 2001-11-16 | Japan Steel Works Ltd:The | 耐食性および耐熱性に優れたマグネシウム合金およびマグネシウム合金部材 |
EP1198146A1 (en) * | 2000-10-13 | 2002-04-17 | TELEFONAKTIEBOLAGET LM ERICSSON (publ) | Method and node for the control of a connection in a communication network |
US7012901B2 (en) * | 2001-02-28 | 2006-03-14 | Cisco Systems, Inc. | Devices, software and methods for generating aggregate comfort noise in teleconferencing over VoIP networks |
US20030028386A1 (en) * | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
EP1288813A1 (en) | 2001-08-28 | 2003-03-05 | Hitachi, Ltd. | System to calculate buisiness performance index |
JP4518714B2 (ja) * | 2001-08-31 | 2010-08-04 | 富士通株式会社 | 音声符号変換方法 |
US6985857B2 (en) | 2001-09-27 | 2006-01-10 | Motorola, Inc. | Method and apparatus for speech coding using training and quantizing |
US7155255B2 (en) * | 2001-10-25 | 2006-12-26 | Motorola, Inc. | Communication equipment, transcoder device and method for processing frames associated with a plurality of wireless protocols |
JP4108317B2 (ja) * | 2001-11-13 | 2008-06-25 | 日本電気株式会社 | 符号変換方法及び装置とプログラム並びに記憶媒体 |
US6829579B2 (en) * | 2002-01-08 | 2004-12-07 | Dilithium Networks, Inc. | Transcoding method and system between CELP-based speech codes |
US6832195B2 (en) * | 2002-07-03 | 2004-12-14 | Sony Ericsson Mobile Communications Ab | System and method for robustly detecting voice and DTX modes |
DE60217859T2 (de) | 2002-08-28 | 2007-07-05 | Freescale Semiconductor, Inc., Austin | Verfahren und Vorrichtung zur Detektierung von Tonsignalen |
US7023880B2 (en) * | 2002-10-28 | 2006-04-04 | Qualcomm Incorporated | Re-formatting variable-rate vocoder frames for inter-system transmissions |
DE602004025688D1 (de) * | 2003-04-22 | 2010-04-08 | Nec Corp | Codeumsetzungsverfahren und einrichtung, programm und aufzeichnungsmedium |
US7433815B2 (en) * | 2003-09-10 | 2008-10-07 | Dilithium Networks Pty Ltd. | Method and apparatus for voice transcoding between variable rate coders |
FR2861247B1 (fr) * | 2003-10-21 | 2006-01-27 | Cit Alcatel | Terminal de telephonie a gestion de la qualite de restituton vocale pendant la reception |
US7505590B1 (en) * | 2003-11-14 | 2009-03-17 | Hewlett-Packard Development Company, L.P. | Method and system for providing transcodability to frame coded streaming media |
US20050258983A1 (en) * | 2004-05-11 | 2005-11-24 | Dilithium Holdings Pty Ltd. (An Australian Corporation) | Method and apparatus for voice trans-rating in multi-rate voice coders for telecommunications |
EP1955321A2 (en) * | 2005-11-30 | 2008-08-13 | TELEFONAKTIEBOLAGET LM ERICSSON (publ) | Efficient speech stream conversion |
-
2005
- 2005-03-29 JP JP2005095735A patent/JP4793539B2/ja not_active Expired - Fee Related
-
2006
- 2006-03-14 CA CA002539675A patent/CA2539675A1/en not_active Abandoned
- 2006-03-16 US US11/376,436 patent/US8374852B2/en not_active Expired - Fee Related
- 2006-03-17 DE DE602006001889T patent/DE602006001889D1/de active Active
- 2006-03-17 EP EP06005553A patent/EP1708174B1/en not_active Expired - Fee Related
- 2006-03-28 KR KR1020060027942A patent/KR100796836B1/ko not_active IP Right Cessation
- 2006-03-29 CN CNA2006100668263A patent/CN1841499A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
KR20060105493A (ko) | 2006-10-11 |
KR100796836B1 (ko) | 2008-01-22 |
DE602006001889D1 (de) | 2008-09-04 |
JP4793539B2 (ja) | 2011-10-12 |
US8374852B2 (en) | 2013-02-12 |
EP1708174A3 (en) | 2006-12-20 |
US20060222084A1 (en) | 2006-10-05 |
EP1708174B1 (en) | 2008-07-23 |
JP2006276476A (ja) | 2006-10-12 |
CA2539675A1 (en) | 2006-09-29 |
EP1708174A2 (en) | 2006-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1264138C (zh) | 复制语音信号、解码语音、合成语音的方法和装置 | |
CN1154086C (zh) | Celp转发 | |
CN1302459C (zh) | 用于编码和解码非话音语音的方法和设备 | |
CN1218295C (zh) | 语音解码中语音帧差错隐蔽的方法和系统 | |
CN100350453C (zh) | 强壮语音分类方法和装置 | |
CN1158648C (zh) | 语音可变速率编码方法与设备 | |
CN1223989C (zh) | 可变速率语音编码器中的帧擦除补偿法及用该方法的装置 | |
CN1202514C (zh) | 编码和解码语音及其参数的方法、编码器、解码器 | |
CN1820306A (zh) | 可变比特率宽带语音编码中增益量化的方法和装置 | |
CN1126869A (zh) | 语音编码和解码设备及其方法 | |
CN1121683C (zh) | 语音编码 | |
CN1922659A (zh) | 编码模式选择 | |
CN1692408A (zh) | 码分多址无线系统的可变比特率宽带语音编码中的有效带内半空白-突发序列信令及半速率最大操作的方法和装置 | |
AU2014317525B2 (en) | Unvoiced/voiced decision for speech processing | |
CN1265217A (zh) | 在语音通信系统中语音增强的方法和装置 | |
CN1878001A (zh) | 对音频数据编码及解码的设备及方法 | |
CN1922658A (zh) | 音频信号的分类 | |
CN101044554A (zh) | 可扩展性编码装置、可扩展性解码装置以及可扩展性编码方法 | |
CN1302460C (zh) | 语音编码中噪音鲁棒分类方法和装置 | |
CN1174457A (zh) | 语音信号传输方法及语音编码和解码系统 | |
CN1359513A (zh) | 话音解码装置和编码差错补偿方法 | |
CN1841499A (zh) | 代码转换装置和方法 | |
CN1293535C (zh) | 声音编码设备和方法以及声音解码设备和方法 | |
CN1134762C (zh) | 语音译码器和语音译码方法 | |
CN1210688C (zh) | 语音音素的编码及语音合成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20061004 |