CN113966531A - 声音信号接收解码方法、声音信号解码方法、声音信号接收侧装置、解码装置、程序以及记录介质 - Google Patents
声音信号接收解码方法、声音信号解码方法、声音信号接收侧装置、解码装置、程序以及记录介质 Download PDFInfo
- Publication number
- CN113966531A CN113966531A CN201980097329.5A CN201980097329A CN113966531A CN 113966531 A CN113966531 A CN 113966531A CN 201980097329 A CN201980097329 A CN 201980097329A CN 113966531 A CN113966531 A CN 113966531A
- Authority
- CN
- China
- Prior art keywords
- code
- monaural
- communication line
- frame
- extension
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 542
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000004891 communication Methods 0.000 claims abstract description 428
- 230000006854 communication Effects 0.000 claims abstract description 428
- 230000007480 spreading Effects 0.000 claims description 19
- 238000004458 analytical method Methods 0.000 description 36
- 238000012545 processing Methods 0.000 description 31
- 230000005540 biological transmission Effects 0.000 description 25
- 238000012986 modification Methods 0.000 description 23
- 230000004048 modification Effects 0.000 description 23
- 230000002123 temporal effect Effects 0.000 description 18
- 238000006243 chemical reaction Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 11
- 238000012935 Averaging Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000002457 bidirectional effect Effects 0.000 description 4
- 230000007175 bidirectional communication Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000002542 deteriorative effect Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Telephonic Communication Services (AREA)
Abstract
提供与仅得到所需最低限度的音质的解码声音信号的结构相比,可以得到高音质的解码声音信号而不使延迟时间大幅度地增大的技术。在连接到第一通信线路和优先级比其低的第二通信线路的终端装置中,根据从第一通信线路输入的第一代码串中包含的单声道代码、以及从第二通信线路输入的第二代码串中的帧号与该单声道代码的帧号最接近的第二代码串中包含的扩展代码,得到并输出多个声道的声音信号。
Description
技术领域
本发明涉及被连接到信息传输的优先级不同的至少两个通信网的终端装置中的声音信号的解码技术、与其对应的声音信号的编码技术的至少任意一个。
背景技术
作为被连接到信息传输的优先级不同的两个通信网的终端装置间的声音信号的编码和解码的现有技术,存在专利文献1的技术。专利文献1的编码装置对于每个规定的时间区间,即对于每个帧,将输入的声音信号进行可伸缩编码而得到作为基层的代码的低频码1、作为扩展层的代码的低频码2和高频码,将低频码1包含在优先级高的分组中而至少送出到被频带保证的网络B,将低频码2和高频码包含在优先级低的分组中而被送出到不被频带保证的网络A。专利文献1的解码装置在接收到优先级高的分组时开始限制时间经过的监视,若经过限制时间,则在该时刻用接收完毕的分组进行解码。即,由于通常网络A比网络B延迟大,则专利文献1的解码装置实质上从基层的代码的到达起上述的限制时间后,若低频码2和高频码也到达,则进行也使用低频码2和高频码的解码处理而得到高音质的解码声音信号,若低频码2和高频码未到达,则进行仅使用低频码1的解码处理而得到所需最低限度的音质的解码声音信号。
现有技术文献
专利文献
专利文献1:日本专利特开2005-117132公报
发明内容
发明要解决的课题
在专利文献1的技术中,为了在许多帧中得到高音质的解码声音信号,需要将比仅得到所需最低限度的音质的解码声音信号的结构中产生的延迟时间长得多的时间设定作为上述的限制时间。因此,在专利文献1的技术中存在以下课题,即若要在许多帧中得到高音质的解码声音信号,则必须设定上述的限制时间,使得在双方向通话时变为产生不适感那么长的延迟时间。另外,在专利文献1的技术中,若将该限制时间接近0以便在双方向通话时不产生不适感,则优先级高的分组在限制时间内到达的帧的比例非常小。因此,在专利文献1的技术中,若设定限制时间使得双方向通话时不产生不适感,则存在在大多数的帧中无法得到高音质的解码声音信号的课题。
因此,在本发明中,其目的在于提供与仅得到所需最低限度的音质的解码声音信号的结构相比,可以得到高音质的解码声音信号而不使延迟时间大幅度地增大的技术。
用于解决课题的方案
本发明的一个方式是连接到第一通信线路、优先级比所述第一通信线路低的第二通信线路的终端装置进行的声音信号接收解码方法,包括:接收步骤,对于多个帧中的预先决定的帧,输出从所述第一通信线路输入的第一代码串中包含的单声道代码、以及从所述第二通信线路输入的第二代码串中包含的扩展代码中帧号与该单声道代码的帧号最接近的扩展代码,对于所述预先决定的帧以外的帧,输出从所述第一通信线路输入的第一代码串中包含的单声道代码、以及已经输出的扩展代码中最新的扩展代码;解码步骤,对于每个帧,根据在所述接收步骤中输出的所述单声道代码、以及在所述接收步骤中输出的所述扩展代码,得到并输出C个(C是大于等于2的整数)声道的解码数字声音信号。
本发明的一个方式是连接到第一通信线路、优先级比所述第一通信线路低的第二通信线路的终端装置进行的声音信号解码方法,包括:解码步骤,对于多个帧中的预先决定的帧,根据从所述第一通信线路输入的第一代码串中包含的单声道代码、以及从所述第二通信线路输入的第二代码串中包含的扩展代码即帧号与该单声道代码的帧号最接近的扩展代码,得到并输出C个(C是大于等于2的整数)声道的解码数字声音信号,对于所述预先决定的帧以外的帧,根据从所述第一通信线路输入的第一代码串中包含的单声道代码、以及在所述预先决定的帧中使用的最新的扩展代码,得到并输出C个声道的解码数字声音信号。
本发明的一个方式是连接到第一通信线路、优先级比所述第一通信线路低的第二通信线路的终端装置进行的声音信号解码方法,包括:单声道解码步骤,对于每个帧,将从所述第一通信线路输入的第一代码串中包含的单声道代码解码并得到单声道解码数字声音信号;以及扩展解码步骤,对于多个帧中的预先决定的帧,视为所述单声道解码数字声音信号是混合了C个(C是大于等于2的整数)声道的解码数字声音信号的信号,视为根据扩展代码得到的特征参数是表示C个声道的所述解码数字声音信号中的声道间的差分的特征的信息,得到并输出C个声道的所述解码数字声音信号,其中,该扩展代码是从所述第二通信线路输入的第二代码串中包含的扩展代码、即帧号与从所述第一通信线路输入的第一代码串中包含的单声道代码的帧号最接近的扩展代码,对于所述预先决定的帧以外的帧,视为所述单声道解码数字声音信号是混合了C个声道的解码数字声音信号的信号,视为在所述预先决定的帧中得到的最新的特征参数是表示C个声道的所述解码数字声音信号中的声道间的差分的特征的信息,得到并输出C个声道的所述解码数字声音信号。
发明效果
按照本发明,与仅得到所需最低限度的音质的解码声音信号的结构相比,可以得到高音质的解码声音信号而不使延迟时间大幅度地增大。
附图说明
图1是表示电话系统的例子的框图。
图2是表示多个线路对应终端装置的例子子的框图。
图3是表示多个线路对应终端装置的声音信号发送侧装置的处理的例子的流程图。
图4是表示多个线路对应终端装置的声音信号接收侧装置的处理的例子的流程图。
图5是示意地表示多个线路对应终端装置的声音信号接收侧装置中的、被输入的代码和输出的信号的时间上的关系的图。
图6是示意地表示使用了以往技术的声音信号接收侧装置中的、被输入的代码和输出的信号的时间上的关系的图。
图7是表示多地点控制装置的例子的框图。
图8是表示多地点控制装置的处理的例子的流程图。
图9是表示多地点控制装置的例子的框图。
图10是表示多地点控制装置的处理的例子的流程图。
图11是表示电话线路专用终端装置的例子的框图。
图12是表示电话线路专用终端装置的声音信号发送侧装置的处理的例子的流程图。
图13是表示电话线路专用终端装置的声音信号接收侧装置的处理的例子的流程图。
图14是表示实现本发明的实施方式的各装置的计算机的功能结构的一个例子的图。
具体实施方式
《电话系统100》
如图1所示,电话系统100包括:多个线路对应终端装置200-m(m为1以上M以下的各整数,M为2以上的整数)、第一通信网400、以及第二通信网500。如图1中虚线所示,电话系统100也可以包括电话线路专用终端装置300-n(n为1以上N以下的各整数,N为1以上的整数)。各多个线路对应终端装置200-m能够经由第一通信网400的各通信线路即第一通信线路410-m与其它终端装置连接。进而,各多个线路对应终端装置200-m能够经由第二通信网500的各通信线路即第二通信线路510-m与其它多个线路对应终端装置连接。各电话线路专用终端装置300-n能够经由第一通信网400的各通信线路即第一通信线路420-n与其它终端装置连接。
《第一通信网400、第二通信网500》
第一通信网400和第二通信网500是信息传输的优先级不同的通信网。第一通信网400是比第二通信网500的信息传输的优先级高的通信网,且是可以用短的延迟时间将规定的比特率的代码列从某个终端装置传输到其它终端装置的通信网。第一通信网400例如是在作为传统的便携电话或智能手机的终端装置与作为传统的便携电话或智能手机的其它终端装置之间的双方向通话中使用的通信网,一般是具有称为电话线路的通信线路的通信网。第二通信网500是信息传输的优先级比第一通信网400低的通信网,且是可以不设置延迟时间的限制地将代码串从某个终端装置传输到其它终端装置的通信网。第二通信网500例如是在从作为智能手机的终端装置向作为智能手机的其它终端装置传输影像或字符串等数据的情况下使用的通信网,一般是具有称为因特网线路的通信线路的通信网。
在图1中将第一通信网400和第二通信网500分开进行记载,但是第一通信网400和第二通信网500不需要在物理上分开,只要在逻辑上分开即可。同样,在终端装置被连接到第一通信线路410-m和第二通信线路510-m两方的情况下,第一通信线路410-m和第二通信线路510-m不需要在物理上分开,只要在逻辑上分开即可。即,各终端装置也可以通过一个IP通信线路与一个IP通信网连接,通过分组的优先控制等,逻辑性地构建作为信息传输的优先级高的通信网以及通信线路的第一通信网400以及第一通信线路410-m、以及作为信息传输的优先级比第一通信网400及第一通信线路410-m低的通信网以及通信线路的第二通信网500以及第二通信线路510-m。例如,也可以为多个线路对应终端装置200-m是对应VoLTE(Voice over LTE,Voice over Long Term Evolution,LTE语音、长期演进语音)的智能手机,第一通信网400以及第一通信线路410-m的例子是LTE通信网以及LTE线路中的VoLTE通信网以及VoLTE线路,第二通信网500以及第二通信线路510-m的例子是LTE通信网以及LTE线路中的因特网通信网以及因特网线路。
另外,上述的通信网、通信线路、终端装置的例子全部是移动通信的设备,但是在各通信网是固定通信用的网还是移动通信用的网,各通信线路是有线还是无线,各终端装置是固定电话机还是便携电话等方面没有限制。
<第一实施方式>
说明第一实施方式的多个线路对应终端装置。
《多个线路对应终端装置200-m》
多个线路对应终端装置200-m例如是VoLTE对应的智能手机,如图2所示,包括声音信号发送侧装置210-m和声音信号接收侧装置220-m。声音信号发送侧装置210-m包括拾音部211-m、编码装置212-m和发送部213-m。声音信号接收侧装置220-m包括接收部221-m、解码装置222-m、再生部223-m。编码装置212-m包括信号分析部2121-m和单声道编码部2122-m。解码装置222-m包括单声道解码部2221-m和扩展解码部2222-m。另外,如用虚线所图示的那样,将信号分析部2121-m和单声道编码部2122-m统称为编码部2129-m,将单声道解码部2221-m和扩展解码部2222-m统称为解码部2229-m。另外,有时也将编码装置212-m、解码装置222-m分别称为声音信号编码装置212-m、声音信号解码装置222-m。多个线路对应终端装置200-m的声音信号发送侧装置210-m进行图3以及以下例示的步骤S211至步骤S213的处理,多个线路对应终端装置200-m的声音信号接收侧装置220-m进行图4以及以下例示的步骤S221至步骤S223的处理。
[声音信号发送侧装置210-m]
声音信号发送侧装置210-m例如对20ms的规定的每个时间区间,即对于每帧,得到作为包含与2个声道的数字声音信号对应的单声道代码的代码串的第一代码串而输出到第一通信线路410-m,得到作为包含与该2个声道的数字声音信号对应的扩展代码的代码串的第二代码串而输出到第二通信线路510-m。
[[拾音部211-m]]
拾音部211-m包括2个麦克风和2个AD转换部。各麦克风和各AD转换部一对一地相关联。麦克风将麦克风周边空间区域中发生的声音拾音而转换为模拟的电信号,输出到AD转换部。AD转换部将输入的模拟的电信号例如转换为采样频率为8kHz的PCM信号的数字声音信号而输出。即,拾音部211-m将与2个麦克风的每一个拾音的声音对应的2个声道的数字声音信号,例如左声道和右声道的双声道立体声的数字声音信号输出到编码装置212-m(步骤S211)。
另外,拾音部211-m的全部或者一部分也可以不具备在声音信号发送侧装置210-m的内部,而是被连接到声音信号发送侧装置210-m。例如,声音信号发送侧装置210-m的拾音部211-m也可以不具有麦克风,而从连接到声音信号发送侧装置210-m的麦克风将2个模拟的电信号输入到声音信号发送侧装置210-m的拾音部211-m的AD转换部。或者,声音信号发送侧装置210-m也可以不具有拾音部211-m,而是从连接到声音信号发送侧装置210-m的AD转换器等拾音设备将2个声道的数字声音信号输入到声音信号发送侧装置210-m的编码装置212-m。
[[编码装置212-m]]
在编码装置212-m中,从拾音部211-m、或者连接到声音信号发送侧装置210-m的拾音设备,被输入2个声道的数字声音信号。编码装置212-m对于每个帧,得到与输入的2个声道的数字声音信号对应的单声道代码和扩展代码,输出到发送部213-m(步骤S212)。
[[[信号分析部2121-m]]]
信号分析部2121-m对于每个帧,从被输入的2个声道的数字声音信号,得到将被输入的2个声道的数字声音信号混合后的信号即单声道信号、以及表示作为表示输入的2个声道的数字声音信号的差分的特征的参数且时间的变动小的参数的特征参数的扩展代码。信号分析部2121-m将得到的单声道信号输出到单声道编码部2122-m,将得到的扩展代码输出到发送部213-m。所谓时间的变动小的参数,是对时刻的依赖性低的参数,是时间分辨率低的参数。
〔信号分析部2121-m的第1例〕
作为第1例,说明将表示输入的2个声道的数字声音信号的时间差的信息设为特征参数的情况下的信号分析部2121-m在每个帧的动作。信号分析部2121-m首先得到作为表示输入的2个声道的数字声音信号的时间差的信息的特征参数(步骤S2121-11)。被输入的2个声道的数字声音信号的时间差可以通过公知的任意方法求出。例如,信号分析部2121-m对于预先确定的范围内的各时间差的候选样本数,计算一个声道(第一声道)的数字声音信号的样本组、与将另一个声道(第二声道)的数字声音信号的样本组提前相当于该候选样本数而得的样本组的相关值,得到作为相关值最大的候选样本数的时间差样本数作为特征参数。
信号分析部2121-m接着得到以下序列的任一个作为将2个声道的数字声音信号混合后的信号即单声道信号:第一声道的数字声音信号的样本组、与对第二声道的数字声音信号的样本组赋予了特征参数所表示的时间差后的样本组的对应的样本之间的基于加法的序列;对应的样本之间的基于平均值的序列;以及将这些基于加法和平均值的序列变形而得到的序列(步骤S2121-12)。所谓对第二声道的数字声音信号的样本组赋予了特征参数所表示的时间差的样本组例如是将第二声道的数字声音信号的样本组提前相当于特征参数所表示的时间差样本数而得的样本组。
信号分析部2121-m进一步得到作为表示特征参数的代码的扩展代码(步骤S2121-13)。作为表示特征参数的代码的扩展代码通过公知的方法得到即可。例如,信号分析部2121-m将输入的2个声道的数字声音信号的时间差样本数标量量化而得到代码,输出得到的代码作为扩展代码。或者,例如信号分析部2121-m输出表示输入的2个声道的数字声音信号的时间差样本数本身的二进制数作为扩展代码。
〔信号分析部2121-m的第2例〕
作为第2例,说明将表示输入的2个声道的数字声音信号的每个频带的度差的信息设为特征参数的情况下的信号分析部2121-m的每帧的动作。另外,以下说明使用复数DFT(Discrete Fourier Transformation,离散傅里叶变换)的具体例,但是也可以使用向复数DFT以外的公知的频域的转换方法。
信号分析部2121-m首先将输入的2个声道的数字声音信号分别进行复数DFT而得到复数DFT系数串(步骤S2121-21)。复数DFT系数串也可以还使用施加在帧间有重叠的窗的处理、考虑了通过复数DFT得到的复数的对称性的处理等公知的方法得到。例如,若为帧由128点的样本构成的情况,则只要将包含紧前的帧的最后64点的样本与紧后的帧的最初64点的样本的连续的256点的数字声音信号的样本组进行复数DFT,将得到的256个复数的序列中的前半的128个复数的序列作为复数DFT系数串得到即可。以下,将f设为1以上128以下的各整数,将第一声道的复数DFT系数串的各复数DFT系数设为V1(f),将第二声道的复数DFT系数串的各复数DFT系数设为V2(f)。信号分析部2121-m接着从2个声道的复数DFT系数串,得到基于各复数DFT系数的复数面上的半径的值的序列(步骤S2121-22)。各声道的各复数DFT系数的复数面上的半径的值相当于各声道的数字声音信号的每个频率区间(bin)的强度。以下,将第一声道的复数DFT系数V1(f)的复数面上的半径的值设为V1r(f),将第二声道的复数DFT系数V2(f)的复数面上的半径的值设为V2r(f)。信号分析部2121-m接着对各个频带得到一个声道的半径的值和另一个声道的半径的值之比的平均值,得到基于平均值的序列作为特征参数(步骤S2121-23)。基于该平均值的序列是相当于表示输入的2个声道的数字声音信号的每个频带的强度差的信息的特征参数。例如,若为设为4个频带的情况,则得到对于f从1至32、33至64、65至96、97至128的4个频带的每一个的、将第一声道的半径的值V1r(f)除以第二声道的半径的值V2r(f)而得到的32个值的平均值Mr(1)、Mr(2)、Mr(3)、Mr(4),得到基于平均值的序列{Mr(1),Mr(2),Mr(3),Mr(4)}作为特征参数。
另外,频带数只要是频率区间的数目以下的值即可,作为频带数,可以使用与频率区间数相同的值,也可以使用1。在作为频带数而使用与频率区间数相同的值的情况下,信号分析部2121-m得到各频率区间的一个声道的半径的值与另一个声道的半径的值的比的值,得到基于得到的比的值的序列作为特征参数即可。在作为频带数而使用1的情况下,信号分析部2121-m得到各频率区间的一个声道的半径的值和另一个声道的半径的值的比的值,将得到的比的值的全频带的平均值作为特征参数得到即可。另外,将频带数设为多个的情况下的各频带中包含的频率区间数是任意的,例如,也可以使频率低的频带中包含的频率区间数少于频率高的频带中包含的频率区间数。
另外,信号分析部2121-m也可以取代一个声道的半径的值和另一个声道的半径的值的比,而使用一个声道的半径的值和另一个声道的半径的值的差。即,若为上述的例子,则可以取代将第一声道的半径的值V1r(f)除以第二声道的半径的值V2r(f)而得到的值,使用从第一声道的半径的值V1r(f)减去第二声道的半径的值V2r(f)而得到的值。
信号分析部2121-m还得到以下序列的任意一个作为混合了2个声道的数字声音信号的信号的单声道信号:第一声道的数字声音信号的样本组、第二声道的数字声音信号的样本组的对应的样本之间的基于加法的序列;对应的样本之间的基于平均值的序列;将这些基于加法或平均值的序列变形而得到的序列(步骤S2121-24)。另外,信号分析部2121-m也可以得到在步骤S2121-21中得到的第一声道的复数DFT系数串的各复数DFT系数V1(f)和第二声道的复数DFT系数串的各复数DFT系数V2(f)的半径的平均值VMr(f)和角度的平均值VMθ(f),将基于复数面上的半径为VMr(f)、角度为VMθ(f)的复数VM(f)的序列进行复数离散傅里叶逆变换,得到混合了2个声道的数字声音信号后的信号即单声道信号(步骤S2121-24’)。
信号分析部2121-m进一步得到作为表示特征参数的代码的扩展代码(步骤S2121-25)。作为表示特征参数的代码的扩展代码用公知的方法得到即可。例如,信号分析部2121-m将在步骤S2121-23中得到的值的序列进行向量量子化而得到代码,将得到的代码作为扩展代码输出。或者,例如,信号分析部2121-m将在步骤S2121-23中得到的值的序列中包含的值的每一个进行标量量化而得到代码,将合并了得到的代码的结果作为扩展代码输出。另外,信号分析部2121-m在步骤S2121-23中得到的是一个值的情况下,把将该一个值标量量化而得到的代码作为扩展代码输出即可。
在信号分析部2121-m的第1例中说明的被输入的2个声道的数字声音信号的时间差、或在信号分析部2121-m的第2例中说明的被输入的2个声道的数字声音信号的每个频带的强度差依赖于音源的位置。若为人或乐器等一般的音源,则音源的位置随时间变化的情况少,即使在音源的位置随时间变化的情况下只要音源不突然移动,则输入的2个声道的数字声音信号的时间差或每个频带的强度差就没什么变化。
因此,信号分析部2121-m也可以得到对包含作为处理对象的帧的连续的多个帧的、从各帧的被输入的2个声道的数字声音信号得到的特征参数的平均或者加权平均作为特征参数,输出表示得到的特征参数的扩展代码。加权平均中使用的权重只要对作为处理对象的帧设为最大的值,离作为处理对象的帧越远的帧设为越小的值即可。另外,若使用比作为处理对象的帧未来的帧的特征参数,则需要预读,延迟增加,所以信号分析部2121-m可以使用包含作为处理对象的帧的、过去侧的连续的多个帧。另外,当然,如表示多个频带的每一个的强度差的信息那样在特征参数中包含多个要素的情况下,特征参数的平均或者加权平均是将特征参数的每个要素的平均值或者加权平均值设为要素的数值串。
另外,例如,基于被输入的2个声道的数字声音信号的波形的差分即被输入的2个声道的数字声音信号的对应的样本之间的差的样本组,由于即使仅将各样本的时刻错开1个样本,也变为与被输入的2个声道的数字声音信号的波形的差分完全不同的样本组,所以是对时刻的依赖性高的信息,是时间分辨率高的信息,是时间的变动大的信息。同样,被输入的2个声道的数字声音信号的相位差,例如,在步骤S2121-21中得到的第一声道的复数DFT系数串的各复数DFT系数V1(f)的复数面上的角度与第二声道的复数DFT系数串的各复数DFT系数V2(f)的复数面上的角度之差,是对时刻的依赖性高的信息,是时间分辨率高的信息,是时间的变动大的信息。
即,信号分析部2121-m得到的扩展代码表示的特征参数不是如刚在前面例示的被输入的2个声道的数字声音信号的波形的差分、或被输入的2个声道的数字声音信号的相位差那样的、被输入的2个声道的数字声音信号的差分中的、表示依赖于音源发出的声音信号的波形的信息的参数,而是在信号分析部2121-m的第1例中表示的被输入的2个声道的数字声音信号的时间差、或在信号分析部2121-m的第2例中表示的被输入的2个声道的数字声音信号的每个频带的强度差那样的、在被输入的2个声道的数字声音信号的差分中的表示依赖于音源和麦克风的空间的相对位置的信息的参数。总而言之,信号分析部2121-m得到的扩展代码表示的特征参数也称为是表示被输入的2个声道的数字声音信号的差分的特征的参数并且时间分辨率低的参数,也称为是表示被输入的2个声道的数字声音信号的差分的特征的参数并且时间的变动小的参数,也称为是表示被输入的2个声道的数字声音信号的差分的特征的参数并且对时刻的依赖性低的参数,也称为是表示被输入的2个声道的数字声音信号的声道间的差分的特征的参数并且表示依赖于音源和麦克风的空间中的相对位置的信息的参数。
[[[单声道编码部2122-m]]]
单声道编码部2122-m对于每个帧,将输入的单声道信号以规定的编码方式编码而得到单声道代码,输出到发送部213-m。作为编码方式,需要使用单声道代码的比特率为第一通信线路410-m的通信容量以下的编码方式,例如使用3GPP EVS标准(3GPPTS26.442)的13.2kbps模式那样的便携电话用的电话频带语音的编码方式即可。
即,编码装置212-m对于每个帧,得到表示将被输入的2个声道的数字声音信号混合后的信号的单声道代码、表示是被输入的2个声道的数字声音信号的声道间的差分的特征的参数且是时间分辨率低的参数的特征参数的扩展代码。另外,在后叙述的那样,编码装置212-m得到的单声道代码是包含在第一代码串中向第一通信线路输出的代码,编码装置212-m得到的扩展代码是包含在第二代码串中向第二通信线路输出的代码。
另外,编码装置212-m也可以将表示从作为处理对象的帧的当前帧的2个声道的数字声音信号得到的特征参数、从作为处理对象的比当前帧过去的帧的2个声道的数字声音信号得到的特征参数的平均或者加权平均的代码作为扩展代码。
[[发送部213-m]]
发送部213-m对于每个帧,将作为包含从编码装置221-m输入的单声道代码的代码串的第一代码串输出到第一通信线路410-m,将作为包含从编码装置221-m输入的扩展代码的代码串的第二代码串输出到第二通信线路510-m(步骤S213)。
发送部213-m以可以确定第一代码串包含哪个帧的单声道代码的方式进行输出。例如,发送部213-m将帧号或帧对应的时刻等能够确定帧的信息作为辅助信息包含在第一代码串中输出。同样,发送部213-m以可以确定第二代码串包含哪个帧的扩展代码的方式进行输出。例如,发送部213-m将帧号或帧对应的时刻等能够确定帧的信息作为辅助信息包含在第二代码串中进行输出。另外,在本第一实施方式的声音信号接收侧装置220-m以及以后的各实施方式以及变形例中,以第一代码串和第二代码串中都包含帧号作为辅助信息的例子进行说明。
[声音信号接收侧装置220-m]
声音信号接收侧装置220-m例如对于每20ms的规定的时间区间,即对每个帧,输出基于从第一通信线路410-m输入的第一代码串中包含的单声道代码、从第二通信线路510-m输入的第二代码串中包含的扩展代码的声音。
[[接收部221-m]]
接收部221-m,对于每个帧,将从第一通信线路410-m输入的第一代码串中包含的单声道代码、从第二通信线路510-m输入的第二代码串中包含的扩展代码中与该单声道代码的帧号最接近的扩展代码输出到解码装置222-m(步骤S221)。
第一通信线路410-m是在双方向通话中使用的优先级高的通信网,所以在接收部221-m中从第一通信线路410-m输入包含单声道代码的第一代码串,使得可以将通话对方端的多个线路对应终端装置200-m’(m’是与m不同的1以上M以下的整数)的声音信号发送侧装置210-m’的编码装置212-m’按照帧号顺序输出的单声道代码按照该帧号顺序以帧长的时间间隔(即,例如以20ms的规定的时间间隔)输出。另外,电话系统100是以顺滑地实现双方向通话为目的的系统,所以接收部221-m希望将通话对方端的声音信号发送侧装置210-m’的编码装置212-m’输出的代码以尽量低延迟输出到解码装置222-m。因此,接收部221-m将通话对方端的声音信号发送侧装置210-m’输出的第一代码串中包含的单声道代码,按照该通话对方端的声音信号发送侧装置210-m’输出的帧号顺序,以帧长的时间间隔,输出到解码装置222-m,而与包含与各单声道代码相同的帧号的扩展代码的第二代码串是否被输入到接收部221-m无关。
第二通信线路510-m是优先级低的通信网,所以通常,通话对方端的声音信号发送侧装置210-m’输出的某帧的第二代码串在该帧的第一代码串从第一通信线路410-m被输入之后,从第二通信线路510-m输入到接收部221-m中。即,在接收部221-m对解码装置222-m输出单声道代码的时刻,通常,包含与该单声道代码相同的帧号的扩展代码的第二代码串不被输入到接收部221-m,无法将与该单声道代码相同的帧号的扩展代码输出到解码装置222-m。另外,第二通信线路510-m是优先级低的通信网,所以通话对方端的声音信号发送侧装置210-m’输出的各帧的第二代码串不必按照帧号顺序从第二通信线路510-m被输入。当然,根据第二通信网500的状况,例如在第二通信网500空闲的情况下等,与该帧的第一代码串从第一通信线路410-m被输入的同时或者在其之前,通话对方端的声音信号发送侧装置210-m’输出的某帧的第二代码串也能够从第二通信线路510-m被输入到接收部221-m中。即,有时在接收部221-m对解码装置222-m输出单声道代码的时刻,包含帧号与该单声道代码相同的帧号的扩展代码的第二代码串被输入到接收部221-m,从而可以将帧号与该单声道代码相同的帧号的扩展代码输出到解码装置222-m。因此,接收部221-m对于每个帧,取代在从第二通信线路510-m输入的第二代码串中包含的扩展代码中帧号与输出到解码装置222-m的单声道代码的帧号相同的扩展代码,而将从第二通信线路510-m输入的第二代码串中包含的扩展代码中帧号与输出到解码装置222-m的单声道代码的帧号最接近的扩展代码输出到解码装置222-m。换言之,接收部221-m对于每个帧,将从第二通信线路510-m输入的第二代码串中、帧号与包含了输出到解码装置222-m的单声道代码的第一代码串的帧号最接近的第二代码串中包含的扩展代码,输出到解码装置222-m。
这里,所谓从第二通信线路510-m输入的第二代码串中包含的扩展代码中、帧号与输出到解码装置222-m的单声道代码的帧号最接近的扩展代码,是在从第二通信线路510-m输入的第二代码串中包含的扩展代码中,包含帧号与输出到解码装置222-m的单声道代码的帧号相同的扩展代码的情况下,从第二通信线路510-m输入的第二代码串中包含的扩展代码中的、帧号与输出到解码装置222-m输出的单声道代码的帧号相同的扩展代码,在从第二通信线路510-m输入的第二代码串中包含的扩展代码中不包含帧号与输出到解码装置222-m的单声道代码的帧号相同的扩展代码的情况下,是帧号与输出到解码装置222-m的单声道代码的帧号最接近的扩展代码(即,在从第二通信线路510-m输入的第二代码串中包含的扩展代码中,虽然帧号与输出到解码装置222-m的单声道代码的帧号不相同,但是帧号与输出到解码装置222-m的单声道代码的帧号最接近的扩展代码)。这在后述的实施方式或变形例中也同样。
即,接收部221-m对于每个帧,输出从第一通信线路410-m输入的第一代码串中包含的单声道代码、从第二通信线路510-m输入的第二代码串中包含的扩展代码中帧号与该单声道代码的帧号最接近的扩展代码。当然,接收部221-m对于单声道代码按照帧号顺序输出。更具体地说,接收部221-m接受来自第一通信线路410-m的第一代码串的输入和来自第二通信线路510-m的第二代码串的输入,对于每个帧,输出从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码),在从第二通信线路510-m输入完毕的第二代码串中包含的扩展代码中、包含帧号与该单声道代码的帧号相同的扩展代码的情况下,输出帧号与该单声道代码的帧号相同的扩展代码,在从第二通信线路510-m输入完毕的第二代码串中包含的扩展代码中,不包含帧号与该单声道代码的帧号相同的扩展代码的情况下,在从第二通信线路输入完毕的第二代码串中包含的扩展代码中,输出帧号与该单声道代码的帧号最接近的扩展代码(即,在从第二通信线路输入的第二代码串中包含的扩展代码中,虽然帧号与该单声道代码的帧号不同,但是帧号与该单声道代码的帧号最接近的扩展代码)。
另外,虽然因为是公知技术所以不详细叙述,但是在接收部221-m中具有未图示的存储部,该存储部累积多个帧的、由于进行包含波动或重发控制等的通信而从各通信线路非同步地接收到的代码串,虽然从各通信线路代码串不一定按照规定的时间区间间隔或帧号顺序输入到接收部221-m中,但只要是在存储部中累积的代码串中包含的代码,接收部221-m就可以输出。即,接收部221-m接受并存储来自第一通信线路410-m的第一代码串的输入,存储输入完毕的第一代码串,只要是存储的第一代码串就可以输出。另外,接收部221-m接受并存储来自第二通信线路510-m的第二代码串的输入,存储输入完毕的第二代码串,只要是存储的第二代码串则可以输出。因此,接收部221-m对于每个规定的时间区间,即每个帧,可以按照帧号顺序取出单声道代码,或取出帧号与该单声道代码的帧号最接近的扩展代码。
[[解码装置222-m]]
对于每个帧,接收部221-m输出的单声道代码和扩展代码被输入到解码装置222-m中。解码装置222-m对于每个帧,得到与输入的单声道代码和扩展代码对应的2个声道的解码数字声音信号,输出到再生部223-m(步骤S222)。
被输入到解码装置222-m的是,从第一通信线路410-m按照帧号顺序输入的第一代码串各自中包含的帧号顺序的单声道代码、以及作为从第二通信线路510-m输入的第二代码串中包含的扩展代码即帧号与各单声道代码的帧号最接近的扩展代码。即,解码装置222-m对于每个帧,根据从第一通信线路410-m输入的第一代码串中包含的单声道代码、以及作为从第二通信线路510-m输入的第二代码串中包含的扩展代码即帧号与该单声道代码的帧号最接近的扩展代码,得到并输出2个声道的解码数字声音信号。另外,解码装置222-m使用的单声道代码当然是帧号顺序。
换言之,被输入到解码装置222-m的是,通话对方端的声音信号发送侧装置210-m’的编码装置212-m’输出的帧号顺序的单声道代码、以及帧号与该单声道代码的帧号最接近的扩展代码。即,解码装置222-m对于每个帧,由通话对方端的声音信号发送侧装置210-m’的编码装置212-m’输出的帧号顺序的单声道代码、以及帧号与该单声道代码的帧号最接近的扩展代码,得到2个声道的解码数字声音信号而输出到再生部223-m。
这里,在从第二通信线路510-m输入的第二代码串中包含的扩展代码中,包含帧号与从第一通信线路410-m输入的第一代码串中包含的单声道代码的帧号相同的扩展代码的帧的情况下,被输入到解码装置222-m的扩展代码是从第二通信线路510-m输入的第二代码串中包含的扩展代码即帧号与该帧的单声道代码的帧号相同的扩展代码,在从第二通信线路510-m输入的第二代码串中包含的扩展代码中,不包含帧号与从第一通信线路410-m输入的第一代码串中包含的单声道代码的帧号相同的扩展代码的帧的情况下,被输入到解码装置222-m的扩展代码是从第二通信线路510-m输入的第二代码串中包含的扩展代码即帧号与该帧的单声道代码的帧号最接近的扩展代码(即,虽然帧号与该帧的单声道代码的帧号不同,但是帧号与该帧的单声道代码的帧号最接近的扩展代码)。这在后述的实施方式或变形例中也同样。
因此,解码装置222-m对于每个帧,在从第二通信线路510-m输入的第二代码串中包含的扩展代码中包含帧号与从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)的帧号相同的扩展代码的情况下,根据从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)、以及帧号与该单声道代码的帧号相同的扩展代码,得到并输出2个声道的解码数字声音信号,在从第二通信线路510-m输入的第二代码串中包含的扩展代码中不包含帧号与从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)的帧号相同的扩展代码的情况下,根据从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)、以及作为从第二通信线路510-m输入的第二代码串中包含的扩展代码即帧号与该单声道代码的帧号最接近的扩展代码(即,虽然帧号与该单声道代码的帧号不相同,但是帧号与该单声道代码的帧号最接近的扩展代码),得到并输出2个声道的解码数字声音信号。
[[[单声道解码部2221-m]]]
对于每个帧,被输入到解码装置222-m的单声道代码被输入到单声道解码部2221-m中。单声道解码部2221-m对于每个帧,将输入的单声道代码以规定的解码方式解码而得到单声道的解码数字声音信号,输出到扩展解码部2222-m。作为规定的解码方式,使用与在通话对方端的声音信号发送侧装置210-m’的编码装置212-m’的单声道编码部2122-m’中使用的编码方式对应的解码方式。
被输入到单声道解码部2221-m是,通话对方端的声音信号发送侧装置210-m’的编码装置212-m’输出的帧号顺序的单声道代码。即,单声道解码部2221-m对于每个帧,得到通话对方端的声音信号发送侧装置210-m’的编码装置212-m’编码的帧号顺序的单声道的解码数字声音信号,输出到扩展解码部2222-m。
[[[扩展解码部2222-m]]]
对于每个帧,单声道解码部2221-m输出的单声道的解码数字声音信号、和输入到解码装置222-m的扩展代码被输入到扩展解码部2222-m中。扩展解码部2222-m对于每个帧,由输入的单声道的解码数字声音信号和扩展代码,得到2个声道的解码数字声音信号而输出到再生部223-m。
被输入到扩展解码部2222-m的单声道的解码数字声音信号是通话对方端的声音信号发送侧装置210-m’的编码装置212-m’编码的帧号顺序,输入到解码装置222-m的扩展代码是帧号与该单声道的解码数字声音信号的帧号最接近的扩展代码。即,扩展解码部2222-m对于每个帧,由通话对方端的声音信号发送侧装置210-m’的编码装置212-m’输出的帧号顺序的单声道的解码数字声音信号、以及帧号与该单声道的解码数字声音信号的帧号最接近的扩展代码,得到2个声道的解码数字声音信号而输出到再生部223-m。另外,扩展代码是通话对方端的多个线路对应终端装置200-m’的声音信号发送侧装置210-m’的编码装置212-m’得到的表示特征参数的代码,表示用于表示2个声道的数字声音信号的差分的特征的参数。即,扩展解码部2222-m对于每个帧,输入的单声道的解码数字声音信号视为是混合了2个声道的解码数字声音信号后的信号,从扩展代码得到的特征参数视为是表示2个声道的数字声音信号的差分的特征的信息,得到2个声道的解码数字声音信号而输出到再生部223-m。
〔扩展解码部2222-m的第1例〕
作为第1例,说明特征参数是表示2个声道的数字声音信号的时间差的信息的情况下的扩展解码部2222-m的每个帧的动作。扩展解码部2222-m首先从输入的扩展代码,得到作为该扩展代码表示的特征参数的表示时间差的信息(步骤S2222-11)。扩展解码部2222-m的通话对方端的声音信号发送侧装置210-m’的编码装置212-m’的信号分析部2121-m’以与从特征参数得到扩展代码的方式对应的方式,从扩展代码得到特征参数。作为特征参数的表示时间差的信息,例如是时间差样本数。例如,扩展解码部2222-m将输入的扩展代码进行标量解码,得到与输入的扩展代码对应的标量值作为时间差样本数。或者,例如,扩展解码部2222-m设输入的扩展代码为2进制数的值,得到与该2进制数对应的10进数作为时间差样本数。
扩展解码部2222-m接着根据输入的单声道的解码数字声音信号和在步骤S2222-11中得到的特征参数,视为输入的单声道的解码数字声音信号是混合了2个解码数字声音信号的信号,视为特征参数是表示2个解码数字声音信号的时间差的信息,得到并输出2个解码数字声音信号(步骤S2222-12)。更具体地说,扩展解码部2222-m得到以下任意一个序列作为第一声道的数字声音信号输出:输入的单声道的数字声音信号的样本组本身、将输入的单声道的数字声音信号的样本组的各样本的值除以2后的值的序列、将这些任一个样本组变形而得到的序列(步骤S2222-121)。扩展解码部2222-m进而得到使第一声道的数字声音信号延迟特征参数所表示的时间差样本数后的样本组,作为第二声道的数字声音信号的样本组输出(步骤S2222-122)。
〔扩展解码部2222-m的第2例〕
作为第2例,说明特征参数为表示2个声道的数字声音信号的每个频带的强度差的信息的情况下的扩展解码部2222-m的每个帧的动作。扩展解码部2222-m首先将输入的扩展代码解码而得到表示每个频带的强度差的信息(步骤S2222-21)。扩展解码部2222-m以与通话对方端的声音信号发送侧装置210-m’的编码装置212-m’的信号分析部2121-m’由表示每个频带的强度差的信息得到扩展代码的方式对应的方式,从扩展代码得到特征参数。例如,扩展解码部2222-m将输入的扩展代码进行向量解码,得到与输入的扩展代码对应的向量的各要素值作为表示多个表示每个频带的强度差的信息。或者,例如,扩展解码部2222-m将输入的扩展代码中包含的代码的每一个进行标量解码而得到表示每个频带的强度差的信息。另外,在频带数为1的情况下,扩展解码部2222-m将输入的扩展代码进行标量解码而得到表示一个频带即全频带的强度差的信息。
扩展解码部2222-m接着根据输入的单声道的解码数字声音信号和在步骤S2222-21中得到的特征参数,视为输入的单声道的解码数字声音信号是混合了2个解码数字声音信号后的信号,视为特征参数是表示2个解码数字声音信号的每个频带的强度差的信息,得到并输出2个解码数字声音信号(步骤S2222-22)。若为通话对方端的声音信号发送侧装置210-m’的编码装置212-m’的信号分析部2121-m’进行了使用了复数DFT的上述的具体例的动作的情况下,扩展解码部2222-m进行以下的动作。
扩展解码部2222-m首先将输入的单声道的解码数字声音信号进行复数DFT而得到复数DFT系数串(步骤S2222-221)。以下,扩展解码部2222-m将得到的单声道的复数DFT系数串的各复数DFT系数设为MQ(f)。扩展解码部2222-m接着从单声道的复数DFT系数串,得到各复数DFT系数的复数面上的半径的值MQr(f)和各复数DFT系数的复数面上的角度的值MQθ(f)(步骤S2222-222)。扩展解码部2222-m接着得到对各半径的值MQr(f)乘以了特征参数中的对应的值的平方根后的值作为第一声道的各半径的值VLQr(f),得到将各半径的值MQr(f)除以特征参数中的对应的值的平方根后的值作为第二声道的各半径的值VRQr(f)(步骤S2222-223)。对于各频率区间的特征参数中的对应的值来说,若为上述的4个频带的例子,则f从1至32为Mr(1),f从33至64为Mr(2),f从65至96为Mr(3),f从97至128为Mr(4)。另外,通话对方端的声音信号发送侧装置210-m’的编码装置212-m’的信号分析部2121-m’在取代第一声道的半径的值和第二声道的半径的值的比而使用了第一声道的半径的值和第二声道的半径的值的差的情况下,扩展解码部2222-m也可以得到对各半径的值MQr(f)加上将特征参数中的对应的值除以2而得的值的值作为第一声道的各半径的值VLQr(f),得到从各半径的值MQr(f)减去将特征参数中的对应的值除以2后的值的值作为第二声道的各半径的值VRQr(f)。扩展解码部2222-m接着对基于复数面上的半径为VLQr(f)且角度为MQθ(f)的复数的序列进行复数离散傅里叶逆变换,得到并输出第一声道的解码数字声音信号,对基于复数面上的半径为VRQr(f)且角度为MQθ(f)的复数的序列进行复数离散傅里叶逆变换,得到并输出第二声道的解码数字声音信号(步骤S2222-224)。
[[再生部223-m]]
再生部223-m输出与被输入的2个声道的解码数字声音信号对应的声音(步骤S223)。
再生部223-m例如包含2个DA转换部和2个扬声器。DA转换部将输入的解码数字声音信号转换为模拟的电信号后输出。扬声器产生与从DA转换部输入的模拟的电信号对应的声音。扬声器也可以是在立体声头戴式耳机或立体声耳机中具备的扬声器。在该情况下,例如,再生部223-m使DA转换部和扬声器一对一相对应,从2个扬声器分别产生与2个解码数字声音信号分别对应的声音(解码声音信号)。
另外,再生部223-m的全部或者一部分也可以不具备在声音信号接收侧装置220-m的内部,而是与声音信号接收侧装置220-m连接。例如,声音信号接收侧装置220-m的再生部223-m也可以不具有扬声器,而是对于声音信号接收侧装置220-m连接的扬声器输出声音信号接收侧装置220-m的再生部223-m的DA转换部得到的2个模拟的电信号。或者,声音信号接收侧装置220-m也可以不具有再生部223-m,而声音信号接收侧装置220-m的解码装置222-m对于声音信号接收侧装置220-m连接的DA转换器等再生设备输出2个声道的解码数字声音信号。
〔声音信号接收侧装置220-m的动作例〕
图5是去除了依赖于装置的处理能力的处理延迟而示意地表示了从第一通信线路410-m输入到声音信号接收侧装置220-m的第一代码串中包含的单声道代码、从第二通信线路510-m输入到声音信号接收侧装置220-m的第二代码串中包含的扩展代码、声音信号接收侧装置220-m输出的解码声音信号的时间上的关系的图。图5的横轴是时间轴。括弧内的编号i是通话对方端的多个线路对应终端装置200-m’的声音信号发送侧装置210-m’的编码装置212-m’中的帧号。CM(i)是从第一通信线路410-m输入到声音信号接收侧装置220-m的第一代码串中包含的单声道代码。CE(i)是从第二通信线路510-m输入到声音信号接收侧装置220-m的第二代码串中包含的扩展代码。YS'(i)是声音信号接收侧装置220-m输出的解码声音信号。图5是,在声音信号接收侧装置220-m中,第二代码串从作为优先级低的通信网的第二通信线路510-m按照帧号顺序输入,但是第二代码串在与来自作为优先级高的通信网的第一通信线路410-m的帧号顺序的第一代码串相比5帧之后被输入的例子。
接收部221-m在从第一通信线路410-m接收包含帧号6的单声道代码CM(6)的第一代码串已结束的时刻,将从第一通信线路410-m输入的第一代码串中包含的单声道代码CM(6)、以及在从第二通信线路510-m输入的第二代码串中帧号与单声道代码CM(6)的帧号最接近的第二代码串中包含的扩展代码CE(1)输出到解码装置222-m。解码装置222-m在单声道代码CM(6)和扩展代码CE(1)被输入了的时刻,得到与被输入的单声道代码CM(6)和扩展代码CE(1)对应的2个声道的解码数字声音信号而输出到再生部223-m。再生部223-m从被输入了与单声道代码CM(6)和扩展代码CE(1)对应的2个声道的解码数字声音信号的时刻起,开始与被输入的2个解码数字声音信号对应的2个声道的解码声音信号YS'(6)的输出。由此,在接收部221-m结束了从第一通信线路410-m接收包含帧号6的单声道代码CM(6)的第一代码串的时刻,声音信号接收侧装置220-m可以根据帧号6的单声道代码CM(6)、与其帧号最接近的第二代码串中包含的扩展代码CE(1)得到2个声道的解码声音信号YS'(6),开始输出。
以下也同样,在接收部221-m结束了从第一通信线路410-m接收包含帧号7的单声道代码CM(7)的第一代码串的时刻,声音信号接收侧装置220-m根据帧号7的单声道代码CM(7)、与其帧号最接近的第二代码串中包含的扩展代码CE(2)得到2个声道的解码声音信号YS'(7),开始输出,在接收部221-m结束了从第一通信线路410-m接收包含帧号8的单声道代码CM(8)的第一代码串的时刻,声音信号接收侧装置220-m根据帧号8的单声道代码CM(8)、与其帧号最接近的第二代码串中包含的扩展代码CE(3),得到2个声道的解码声音信号YS'(8),开始输出,…这样进行动作。
图6是去除了依赖于装置的处理能力的处理延迟而示意地表示了在使用了专利文献1的技术的情况下的、对声音信号接收侧装置从第一通信线路410-m输入的第一代码串中包含的单声道代码、对声音信号接收侧装置220-m从第二通信线路510-m输入的第二代码串中包含的扩展代码、声音信号接收侧装置输出的解码声音信号的时间上的关系的图。图6的横轴、括弧内的编号i、CM(i)、CE(i)与图5相同。YS(i)是使用了专利文献1的技术的声音信号接收侧装置输出的解码声音信号。图6也与图5同样,是在声音信号接收侧装置中,输入从作为优先级低的通信网的第二通信线路510-m按照帧号顺序输入第二代码串,但是第二代码串在与来自作为优先级高的通信网的第一通信线路410-m的帧号顺序的第一代码串相比5帧后被输入的例子。图6是使用了专利文献1的技术的声音信号接收侧装置转达上述的限制时间为相当于5帧的时间的例子。
使用了专利文献1的技术的声音信号接收侧装置得到与从第一通信线路410-m输入的单声道代码CM(6)、在从输入单声道代码CM(6)起正好5帧的限制时间时从第二通信线路510-m输入的扩展代码CE(6)对应的2个声道的解码声音信号YS(6),开始输出。以下也同样,使用了专利文献1的技术的声音信号接收侧装置根据帧号7的单声道代码CM(7)、在从结束从第一通信线路410-m接收单声道代码CM(7)起经过了5帧的时刻从第二通信线路510-m输入的帧号7的扩展代码CE(7),得到2个声道的解码声音信号YS(7),开始输出;根据帧号8的单声道代码CM(8)、在从结束从第一通信线路410-m接收单声道代码CM(8)起经过了5帧的时刻从第二通信线路510-m输入的帧号8的扩展代码CE(8),得到2个声道的解码声音信号YS(8),开始输出,…这样进行动作。
〔效果〕
从图6和图5可知,在专利文献1的技术中,为了得到高音质的解码声音信号,与得到最低限度的音质的解码声音信号相比导致多了5帧的延迟,但是在第一实施方式的技术中,与得到最低限度的音质的解码声音信号的情况相比不大幅度地增加延迟时间,即可以以在双方向通话时不产生不适感的程度的延迟时间,得到高音质的解码声音信号。
<第二实施方式>
在第一实施方式中,得到并输出每帧的扩展代码,但是也可以在多个帧中仅得到并输出1次扩展代码。将该方式作为第二实施方式进行说明。
第二实施方式与第一实施方式的不同之处在于声音信号发送侧装置210-m的编码装置212-m的信号分析部2121-m和发送部213-m的动作。以下,说明第二实施方式与第一实施方式的不同点。
[[[信号分析部2121-m]]]
与第一实施方式的信号分析部2121-m相同,信号分析部2121-m对于各帧,由被输入的2个声道的数字声音信号,得到并输出将被输入的2个声道的数字声音信号混合后的信号即单声道信号,但是与第一实施方式的信号分析部2121-m不同,仅对多个帧中的预先决定的帧,得到并输出表示特征参数的扩展代码,所述特征参数是表示被输入的2个声道的数字声音信号的差分的特征的参数、并且时间的变动小的参数。
例如,信号分析部2121-m对于帧号为奇数的帧,由被输入的2个声道的数字声音信号得到特征参数,得到并输出表示该特征参数的扩展代码,但是对于帧号为偶数的帧,不得到特征参数,也不得到并不输出表示特征参数的扩展代码。另外,在信号分析部2121-m采用在得到单声道信号时使用特征参数的结构的情况下,信号分析部2121-m对于不得到特征参数的帧,使用该帧的被输入的2个声道的数字声音信号、以及与已经被输出的扩展代码中的最新的扩展代码对应的特征参数,得到单声道信号。
或者,例如,信号分析部2121-m对于帧号为奇数的帧,虽然由被输入的2个声道的数字声音信号得到特征参数,但是不得到并不输出表示该特征参数的扩展代码,对于帧号为偶数的帧,由被输入的2个声道的数字声音信号得到特征参数,得到并输出扩展代码,该扩展代码表示不得到表示特征参数的扩展代码而不输出的紧前的帧的特征参数、与该帧的特征参数的平均或者加权平均。在加权平均中使用的权重只要是该帧的权重比紧前的帧的权重大的值即可。
上述的两个例子是2帧中得到并输出1次扩展代码的结构,但是也可以设为3帧以上得到并输出1次扩展代码的结构,也可以是对于多个帧中的预先决定的帧得到并输出扩展代码的结构。
即,本第二实施方式的编码装置212-m对于每个帧,得到表示将被输入的2个声道的数字声音信号混合后的信号的单声道代码,对于多个帧中的预先决定的帧,得到表示作为表示被输入的2个声道的数字声音信号的声道间的差分的特征的参数且作为时间分辨率低的参数的特征参数的扩展代码。
或者,本第二实施方式的编码装置212-m对于每个帧,得到表示将被输入的2个声道的数字声音信号混合而得的信号的单声道代码,对于每个帧,得到作为表示被输入的2个声道的数字声音信号的声道间的差分的特征的参数且作为时间分辨率低的参数的特征参数,对于多个帧中的预先决定的帧,得到表示在紧前的预先决定的帧之后的各帧中得到的特征参数的平均或者加权平均的扩展代码。在加权平均中使用的权重设为对于该帧为最大的值,离该帧越远的帧设为越小的值即可。
另外,在后叙述的那样,编码装置212-m得到的单声道代码是包含在第一代码串中而在第一通信线路中输出的代码,编码装置212-m得到的扩展代码是包含在第二代码串中而在第二通信线路中输出的代码。
[[发送部213-m]]
发送部213-m与第一实施方式的发送部213-m同样,对于各帧,将包含输入的单声道代码的代码串即第一代码串在第一通信线路410-m上输出,但是与第一实施方式的发送部213不同,仅对于被输入了扩展代码的帧,即仅对于多个帧中的预先决定的帧,将包含被输入的扩展代码的代码串即第二代码串在第二通信线路510-m上输出。
〔效果〕
如在第一实施方式中说明的那样,在声音信号接收侧装置220-m中使用的扩展代码是帧号与单声道代码的帧号最接近的扩展代码,所以帧号与单声道代码的帧号相同的扩展代码被输入到声音信号接收侧装置220-m不是必须的。另外,原本特征参数就是时间的变动小的参数。因此,按照本实施方式,通过采用了对多个帧仅得到并输出1次扩展代码的结构,与第一实施方式相比,可以降低信号分析部2121-m的运算处理量而不使解码声音信号的质量大幅恶化,另外,可以使用于传输特征参数的代码的量比第一实施方式少。
<第三实施方式>
在第一实施方式中,声音信号接收侧装置220-m在每帧得到用于解码的扩展代码,但是也可以声音信号接收侧装置220-m在多个帧中仅得到1次用于解码的扩展代码。将该方式作为第三实施方式进行说明。
第三实施方式的声音信号接收侧装置220-m与第一实施方式的声音信号接收侧装置220-m的不同之处在于,接收部221-m和解码装置222-m的扩展解码部2222-m的动作。以下,说明第三实施方式与第一实施方式的不同点。
[[接收部221-m]]
接收部221-m与第一实施方式的接收部221-m同样,对于各帧,将从第一通信线路410-m输入的第一代码串中包含的单声道代码输出到解码装置222-m,但是与第一实施方式的接收部221-m不同,仅对于多个帧中的预先决定的帧,得到并输出被输入的第二代码串中包含的扩展代码中的帧号与单声道代码的帧号最接近的扩展代码。即,更具体地说,接收部221-m仅对于多个帧中的预先决定的帧,从接收部221-m内的未图示的存储部得到被输第二代码串中包含的扩展代码中的帧号与单声道代码的帧号最接近的扩展代码并输出。
[[[扩展解码部2222-m]]]
与第一实施方式的扩展解码部2222-m同样,对于各帧,单声道解码部2221-m输出的单声道的解码数字声音信号被输入到扩展解码部2222-m中,但是与第一实施方式的扩展解码部2222-m不同,仅对于多个帧中的预先决定的帧,输入扩展代码。扩展解码部2222-m对于多个帧中的预先决定的帧、即也输入了扩展代码的帧,与第一实施方式的扩展解码部2222-m同样,根据输入的单声道的解码数字声音信号和扩展代码,得到并输出2个声道的解码数字声音信号,对于多个帧中的预先决定的帧以外的帧、即未输入扩展代码的帧,与第一实施方式的扩展解码部2222-m不同,根据输入的单声道的解码数字声音信号、以及已输入的扩展代码中的最新的扩展代码,得到并输出2个声道的解码数字声音信号。
即,解码装置222-m对于多个帧中的预先决定的帧,根据从第一通信线路410-m输入的第一代码串中包含的单声道代码、以及作为在从第二通信线路510-m输入的第二代码串中包含的扩展代码的帧号与该单声道代码的帧号最接近的扩展代码,得到并输出2个声道的解码数字声音信号,对于预先决定的帧以外的帧,根据从第一通信线路410-m输入的第一代码串中包含的单声道代码、以及在预先决定的帧中使用的最新的扩展代码,得到并输出2个声道的解码数字声音信号。具体地说,解码装置222-m对于多个帧中的预先决定的帧,在从第二通信线路510-m输入的第二代码串中包含的扩展代码中包含帧号与从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)的帧号相同的扩展代码的情况下,根据从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)、以及帧号与该单声道代码的帧号相同的扩展代码,得到并输出2个声道的解码数字声音信号,在从第二通信线路510-m输入的第二代码串中包含的扩展代码中不包含帧号与从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)的帧号相同的扩展代码的情况下,根据从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)、以及作为在从第二通信线路510-m输入的第二代码串中包含的扩展代码的帧号与该单声道代码的帧号最接近的扩展代码(即,虽然帧号与该单声道代码的帧号不相同,但是帧号与该单声道代码的帧号最接近的扩展代码),得到并输出2个声道的解码数字声音信号,对于预先决定的帧以外的帧,根据从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)、以及在预先决定的帧中使用的最新的扩展代码,得到并输出2个声道的解码数字声音信号。
更具体地说,解码装置222-m的单声道解码部2221-m对于每个帧,将从第一通信线路410-m输入的第一代码串中包含的单声道代码解码而得到单声道的解码数字声音信号,解码装置222-m的扩展解码部2222-m对于多个帧中的预先决定的帧,视为单声道的解码数字声音信号是混合了2个声道的解码数字声音信号的信号,视为根据作为在从第二通信线路510-m输入的第二代码串中包含的扩展代码的、帧号与从第一通信线路410-m输入的第一代码串中包含的单声道代码的帧号最接近的扩展代码而得到的特征参数是表示2个声道的解码数字声音信号中的声道间的差分的特征的信息,得到并输出2个声道的解码数字声音信号。另外,扩展解码部2222-m在预先决定的帧中使用根据扩展代码得到的特征参数,所以可以存储该特征参数,在预先决定的帧以外的帧中使用。即,扩展解码部2222-m在预先决定的帧以外的帧中,视为单声道的解码数字声音信号是混合了2个声道的解码数字声音信号的信号,视为在预先决定的帧中得到的最新的特征参数是表示2个声道的解码数字声音信号中的声道间的差分的特征的信息,得到并输出2个声道的解码数字声音信号。
即,解码装置222-m的单声道解码部2221-m对于每个帧,将从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)解码而得到单声道的解码数字声音信号,解码装置222-m的扩展解码部2222-m对于多个帧中的预先决定的帧,视为在从第二通信线路510-m输入的第二代码串中包含的扩展代码中包含帧号与从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)的帧号相同的扩展代码的情况下,单声道的解码数字声音信号是混合了2个声道的解码数字声音信号的信号,视为根据帧号与该单声道代码的帧号相同的扩展代码得到的特征参数是表示2个声道的解码数字声音信号中的声道间的差分的特征的信息,得到并输出2个声道的解码数字声音信号,在从第二通信线路510-m输入的第二代码串中包含的扩展代码中不包含帧号与从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)的帧号相同的扩展代码的情况下,视为单声道的解码数字声音信号是混合了2个声道的解码数字声音信号的信号,视为根据作为从第二通信线路510-m输入的第二代码串中包含的扩展代码的帧号与从第一通信线路410-m输入的第一代码串中包含的单声道代码的帧号最接近的扩展代码(即,虽然帧号与该单声道代码的帧号不相同,但是帧号与该单声道代码的帧号最接近的扩展代码)得到的特征参数是表示2个声道的解码数字声音信号中的声道间的差分的特征的信息,得到并输出2个声道的解码数字声音信号,视为在预先决定的帧以外的帧中,单声道的解码数字声音信号是混合了2个声道的解码数字声音信号的信号,视为在预先决定的帧中得到的最新的特征参数是表示2个声道的解码数字声音信号中的声道间的差分的特征的信息,得到并输出2个声道的解码数字声音信号。
<第三实施方式的变形例>
另外,也可以取代第三实施方式,扩展解码部2222-m进行与第一实施方式同样的动作,接收部221-m对于多个帧中的预先决定的帧,输出从第一通信线路410-m输入的第一代码串中包含的单声道代码、以及在从第二通信线路510-m输入的第二代码串中包含的扩展代码中的帧号与该单声道代码的帧号最接近的扩展代码,对于多个帧中的预先决定的帧以外的帧,输出从第一通信线路410-m输入的第一代码串中包含的单声道代码、以及已经输出的扩展代码中的最新的扩展代码。
更具体地说,接收部221-m对于多个帧中的预先决定的帧,在从第二通信线路510-m输入的第二代码串中包含的扩展代码中包含帧号与从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)的帧号相同的扩展代码的情况下,输出该单声道代码和帧号与该单声道代码的帧号相同的扩展代码,在从第二通信线路510-m输入的第二代码串中包含的扩展代码中不包含帧号与从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)的帧号相同的扩展代码的情况下,输出从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)、以及在从第二通信线路510-m输入的第二代码串中包含的扩展代码中帧号与该单声道代码的帧号最接近的扩展代码(即,在从第二通信线路510-m输入的第二代码串中包含的扩展代码中,虽然帧号与该单声道代码的帧号不相同,但是帧号与该单声道代码的帧号最接近的扩展代码),对于多个帧中的预先决定的帧以外的帧,输出从第一通信线路410-m输入的第一代码串中包含的单声道代码(帧号顺序的单声道代码)、以及已经输出的扩展代码中的最新的扩展代码。
〔效果〕
如在第一实施方式中说明的那样,在声音信号接收侧装置220-m中使用的扩展代码是帧号与单声道代码的帧号最接近的扩展代码,所以帧号与单声道代码的帧号相同的扩展代码被输入到扩展解码部2222-m不是必须的。另外,原本特征参数是时间的变动小的参数。因此,按照本实施方式及其变形例,通过采用了在多个帧仅得到1次扩展代码的结构,与第一实施方式相比,可以降低接收部221-m的运算处理量或输出的信息的量,而不使解码声音信号的品质大幅度恶化。
<第四实施方式>
作为第一实施方式的声音信号接收侧装置220-m在得到2个解码数字声音信号时使用的特征参数,也可以使用在处理对象的帧中输入的扩展代码表示的特征参数、意见过去的帧的特征参数的平均或加权平均。将该方式作为第四实施方式进行说明。
第四实施方式与第一实施方式的不同之处在于,声音信号接收侧装置220-m的解码装置222-m的扩展解码部2222-m的动作。以下,说明第四实施方式与第一实施方式的不同点。以下,对每个帧进行处理的扩展解码部2222-m将在该时刻作为处理对象的帧称为当前帧,将比过去的帧称为过去帧。
[[[扩展解码部2222-m]]]
与第一实施方式的扩展解码部2222-m同样,对于每个帧,单声道解码部2221-m输出的单声道的解码数字声音信号、以及输入到解码装置222-m的扩展代码被输入到扩展解码部2222-m中。扩展解码部2222-m具有未图示的存储部。在存储部中,存储扩展解码部2222-m在过去帧中得到的特征参数。扩展解码部2222-m对于每个帧,由输入的单声道的解码数字声音信号、输入的扩展代码、以及存储部中存储的过去帧的特征参数,得到2个声道的解码数字声音信号而输出到再生部223-m。具体地说,扩展解码部2222-m对于每个帧进行以下的步骤S2222-31至步骤S2222-35。
扩展解码部2222-m首先从输入的扩展代码得到该扩展代码表示的特征参数(步骤S2222-31),将得到的特征参数存储在存储部中(步骤S2222-32)。扩展解码部2222-m接着读出存储在存储部中的过去帧的特征参数中的K个(K为1以上的整数)(步骤S2222-33)。例如,读出与当前帧连续的过去K个过去帧的特征参数。扩展解码部2222-m接着得到从存储部读出的K个过去帧的特征参数和当前帧的特征参数的平均或者加权平均(步骤S2222-34)。在加权平均中使用的权重对于当前帧的特征参数设为最大的值,离当前帧越远的帧设为越小的值即可。扩展解码部2222-m接着由输入的单声道的解码数字声音信号和在步骤S2222-34中得到的特征参数的平均或者加权平均,视为输入的单声道的解码数字声音信号是混合了2个解码数字声音信号的信号,视为在步骤S2222-34中得到的特征参数的平均或者加权平均是表示2个解码数字声音信号的差分的特征的信息,得到2个解码数字声音信号而输出到再生部223-m(步骤S2222-35)。另外,扩展解码部2222-m也可以取代将扩展代码表示的特征参数存储在存储部的步骤S2222-32,而将在步骤S2222-34中得到的平均或者加权平均作为当前帧的特征参数存储在存储部中。另外,在扩展解码部2222-m的存储部中,过去帧的特征参数只要仅存储K个即可,所以在当前帧的下一个帧的处理中,可以从存储部删除K+1个以上过去了的过去帧的特征参数。
<第四实施方式的变形例>
与第一实施方式的声音信号接收侧装置220-m同样,在第三实施方式的声音信号接收侧装置220-m中,作为在得到2个解码数字声音信号时使用的特征参数,也可以使用在处理对象的帧中输入的扩展代码表示的特征参数、和过去的帧的特征参数的平均或加权平均。即,在第三实施方式的声音信号接收侧装置220-m的解码装置222-m的扩展解码部2222-m中,对于多个帧中的预先决定的帧,作为得到2个解码数字声音信号时使用的特征参数,也可以使用在处理对象的帧中输入的扩展代码表示的特征参数、和过去的帧的特征参数的平均或加权平均。将该方式职务第四实施方式的变形例进行说明。
第四实施方式的变形例与第三实施方式的不同之处在于,声音信号接收侧装置220-m的解码装置222-m的扩展解码部2222-m的动作。以下,说明第四实施方式的变形例与第三实施方式的不同点。以下,对每个帧进行处理的扩展解码部2222-m将在该时刻作为处理对象的帧称为当前帧,将比它过去的帧称为过去帧。
[[[扩展解码部2222-m]]]
在扩展解码部2222-m中,与第三实施方式的扩展解码部2222-m同样,对于各帧,被输入单声道解码部2221-m输出的单声道的解码数字声音信号,仅对于多个帧中的预先决定的帧输入扩展代码。扩展解码部2222-m具有未图示的存储部。在存储部中至少存储扩展解码部2222-m在过去帧中得到的特征参数的平均或者加权平均,有时也存储过去帧的扩展代码表示的特征参数。
扩展解码部2222-m对于多个帧中的预先决定的帧,即也被输入了扩展代码的帧,进行以下的步骤S2222-41至步骤S2222-46。
扩展解码部2222-m首先从输入的扩展代码得到该扩展代码表示的特征参数(步骤S2222-41),将得到的特征参数存储在存储部中(步骤S2222-42)。扩展解码部2222-m接着读出存储部中存储的过去帧的特征参数中的K个(K为1以上的整数)(步骤S2222-43)。例如,读出与当前帧最接近的过去K个过去帧的特征参数。将特征参数存储在存储部中的仅是也被输入了扩展代码的帧,所以被读出的特征参数是也被输入了扩展代码的帧中的与当前帧连续的K个帧的特征参数。扩展解码部2222-m接着得到从存储部读出的K个过去帧的特征参数与当前帧的特征参数的平均或者加权平均(步骤S2222-44),将得到的特征参数的平均或者加权平均存储在存储部中(步骤S2222-45)。在加权平均中使用的权重对当前帧的特征参数设为最大的值,离当前帧越远的帧设为越小的值即可。扩展解码部2222-m接着由输入的单声道的解码数字声音信号和在步骤S2222-44中得到的特征参数的平均或者加权平均,视为输入的单声道的解码数字声音信号是混合了2个解码数字声音信号的信号,视为在步骤S2222-44中得到的特征参数的平均或者加权平均是表示2个解码数字声音信号的差分的信息,得到2个解码数字声音信号而输出到再生部223-m(步骤S2222-46)。另外,扩展解码部2222-m也可以不进行将扩展代码表示的特征参数存储在存储部中的步骤S2222-42,而将在步骤S2222-45中存储在存储部中的平均或者加权平均在步骤S2222-43中作为过去帧的特征参数读出。另外,在扩展解码部2222-m的存储部中,仅存储K个过去帧的特征参数即可,所以在当前帧的下一个帧的处理中,K+1个以上过去了的过去帧的特征参数可以从存储部删除。另外,在扩展解码部2222-m的存储部中,仅存储在步骤S2222-44中得到的特征参数的平均或者加权平均中最新的结果即可,所以在进行步骤S2222-45的时刻,存储部中存储的特征参数的平均或者加权平均可以从存储部删除。
第四实施方式的变形例的扩展解码部2222-m对于多个帧中的预先决定的帧以外的帧,即扩展代码未被输入的帧,进行以下的步骤S2222-47至步骤S2222-48。
扩展解码部2222-m首先从存储部读出存储部中存储的最新的特征参数的平均或者加权平均(步骤S2222-47)。扩展解码部2222-m接着由输入的单声道的解码数字声音信号和在步骤S2222-47中得到的特征参数的平均或者加权平均,视为输入的单声道的解码数字声音信号是混合了2个解码数字声音信号的信号,视为在步骤S2222-47中得到的特征参数的平均或者加权平均是表示2个解码数字声音信号的差分的信息,得到2个解码数字声音信号而输出到再生部223-m(步骤S2222-48)。
〔效果〕
虽然特征参数从统计的方式看是时间的变动小的参数,但由于反映着各帧的声音信号的特征,所以在涵盖多个帧而为完全相同的值的情况较少,另外,有时在帧间,值有很大不同。因此,在声音信号接收侧装置220-m中,与使用与该帧本来的扩展代码不同的某个扩展代码所代表的特征参数相比,如本第四实施方式以及变形例那样,通过使用时间上接近的多个扩展代码代表的特征参数的平均或加权平均等,可以抑制解码声音信号的声道间的急剧的变动或异常音的发生等。
<第五实施方式>
在第一实施方式中,声音信号接收侧装置220-m对于各帧,使用单声道代码和帧号最接近的扩展代码来得到2个声道的解码数字声音信号,但是对于没有单声道代码和规定的限制时间范围内的扩展代码的帧,也可以将解码单声道代码而得到的解码数字声音信号设为2个声道的解码数字声音信号。将该方式职务第五实施方式进行说明。
第五实施方式与第一实施方式的不同之处在于,声音信号接收侧装置220-m的接收部221-m和解码装置222-m的动作。另外,在解码装置222-m中,第五实施方式进行与第一实施方式不同的动作的是扩展解码部2222-m。以下,对第五实施方式与第一实施方式的不同点进行说明。
[[接收部221-m]]
接收部221-m对于从第一通信线路410-m输入的第一代码串中包含的单声道代码、与在从第二通信线路510-m输入的第二代码串中包含的扩展代码中帧号与该单声道代码的帧号最接近的扩展代码的帧号之差小于预先决定的值的帧,输出从第一通信线路410-m输入的第一代码串中包含的单声道代码、以及在从第二通信线路510-m输入的第二代码串中包含的扩展代码中帧号与该单声道代码的帧号最接近的扩展代码,对于上述的帧号之差小于预先决定的值的帧,输出从第一通信线路410-m输入的第一代码串中包含的单声道代码。具体地说,接收部221-m对于每个帧,进行以下的步骤S221-11至步骤S221-15。
接收部221-m将从第一通信线路410-m输入的第一代码串中包含的单声道代码输出到解码装置222-m(步骤S221-11)。接收部221-m接着得到在步骤S221-11中输出的单声道代码的帧号(步骤S221-12)。接收部221-m接着在从第二通信线路510-m输入的第二代码串中,得到帧号与在步骤S221-12中得到的单声道代码的帧号最接近的第二代码串中包含的扩展代码、以及该扩展代码的帧号(步骤S221-13)。接收部221-m接着判断在步骤S221-12中得到的单声道代码的帧号与在步骤S221-13中得到的扩展代码的帧号之差是否小于预先决定的值(步骤S221-14)。接收部221-m接着在步骤S221-14中单声道代码的帧号与扩展代码的帧号之差小于预先决定的值的情况下,将扩展代码输出到解码装置222-m(步骤S221-15)。接收部221-m在步骤S221-14中单声道代码的帧号与扩展代码的帧号之差变为了小于预先决定的值的情况下,不输出扩展代码。即,接收部221-m在步骤S221-14中单声道代码的帧号与扩展代码的帧号之差变为小于预先决定的值的情况下,仅输出单声道代码即可。
这里,预先决定的值是2以上的值。即,接收部221-m对于从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)、与在从第二通信线路510-m输入的第二代码串中包含的扩展代码中的帧号与该单声道代码的帧号最接近的扩展代码的帧号之差为0的帧(即,在从第二通信线路510-m输入的第二代码串中,包含帧号与从第一通信线路410-m输入的第一代码串中包含的单声道代码的帧号相同的扩展代码的帧),输出从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)、以及在从第二通信线路510-m输入的第二代码串中包含的扩展代码中帧号与该单声道代码的帧号相同的扩展代码,对于上述的帧号之差大于0且小于预先决定的值的帧,输出从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)、以及在从第二通信线路510-m输入的第二代码串中包含的扩展代码中帧号与该单声道代码的帧号最接近的扩展代码(即,在从第二通信线路510-m输入的第二代码串中包含的扩展代码中,虽然帧号与该单声道代码的帧号不相同,但是帧号与该单声道代码的帧号最接近的扩展代码),对于上述的帧号之差小于预先决定的值的帧,仅输出从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)。
[[解码装置222-m]]
在解码装置222-m中,对于每个帧,接收部221-m输出的单声道代码必定被输入,接收部221-m输出的扩展代码有时被输入。解码装置222-m对于每个帧,得到对应于被输入的单声道代码和扩展代码,或者,被输入的单声道代码的2个声道的解码数字声音信号而输出到再生部223-m。具体地说,解码装置222-m对于上述的帧号之差小于预先决定的值的帧,根据接收部221-m输出的单声道代码、以及接收部221-m输出的扩展代码,得到并输出2个声道的解码数字声音信号,对于上述的帧号之差不小于预先决定的值的帧,将基于接收部221-m输出的单声道代码的单声道数字信号原样作为2个声道的解码数字声音信号输出。
[[[扩展解码部2222-m]]]
在扩展解码部2222-m中,对于每个帧,单声道解码部2221-m输出的单声道的解码数字声音信号必定被输入,被输入到解码装置222-m的扩展代码有时被输入。扩展解码部2222-m对于单声道的解码数字声音信号和扩展代码被输入了的帧,由输入的单声道的解码数字声音信号和扩展代码,通过与第一实施方式的扩展解码部2222-m相同的动作,得到2个声道的解码数字声音信号而输出到再生部223-m。扩展解码部2222-m对于仅单声道的解码数字声音信号被输入的帧,将输入的单声道的解码数字声音信号原样作为2个声道的解码数字声音信号得到,输出到再生部223-m。
即,解码装置222-m对于从第一通信线路410-m输入的第一代码串中包含的单声道代码、与作为在从第二通信线路510-m输入的第二代码串中包含的扩展代码且帧号与该单声道代码的帧号最接近的扩展代码的帧号之差小于预先决定的值的帧,根据该单声道代码和帧号与该单声道代码的帧号最接近的扩展代码,得到并输出2个声道的解码数字声音信号,对于上述的帧号之差不小于预先决定的值的帧,将基于从第一通信线路410-m输入的第一代码串中包含的单声道代码的解码数字声音信号原样作为2个声道的解码数字声音信号输出。
更具体地说,解码装置222-m对于从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)、与作为在从第二通信线路510-m输入的第二代码串中包含的扩展代码的帧号与该单声道代码的帧号最接近的扩展代码的帧号之差为0的帧(即,在从第二通信线路510-m输入的第二代码串中,包含帧号与从第一通信线路410-m输入的第一代码串中包含的单声道代码的帧号相同的扩展代码的帧),根据该单声道代码、帧号与该单声道代码的帧号相同的扩展代码,得到并输出2个声道的解码数字声音信号,对于上述的帧号之差大于0且小于预先决定的值的帧,根据从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)、以及帧号与该单声道代码的帧号最接近的扩展代码(即,在从第二通信线路510-m输入的第二代码串中包含的扩展代码中,虽然帧号与该单声道代码的帧号不相同,但是帧号与该单声道代码的帧号最接近的扩展代码),得到并输出2个声道的解码数字声音信号,对于上述的帧号之差不小于预先决定的值的帧,将基于从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)的解码数字声音信号作为2个声道的解码数字声音信号输出。
<第五实施方式的变形例>
以上说明的是基于第一实施方式的声音信号接收侧装置220-m的结构的第五实施方式的声音信号接收侧装置220-m及其动作,但是也可以构成基于第三实施方式以及第四实施方式以及它们的变形例的任一个的声音信号接收侧装置220-m的第五实施方式的声音信号接收侧装置220-m而动作。
〔效果〕
通话对方端的多个线路对应终端装置200-m’的声音信号发送侧装置210-m’的编码装置212-m’对于规定的时间区间的每个帧进行编码,所以单声道代码的帧号和扩展代码的帧号之差与通话对方端的多个线路对应终端装置200-m’的声音信号发送侧装置210-m’的编码装置212-m’编码的数字声音信号的时间差对应。例如,若帧长为20ms,若帧号之差为150,则得到单声道代码的数字声音信号、与得到扩展代码的数字声音信号中有3秒的时间差。即使是时间上变动小的参数,若时刻大不相同,则存在值较大改变的可能性。因此,扩展代码表示的特征参数有很大程度不同的时间差的情况下,在反映了2个声道的差分的特征的2个声道的解码声音信号中,存在声道间的信号的分割上产生较大差错的可能性。按照本第五实施方式,通过对从第一通信线路接收的第一代码串中包含的单声道代码与从第二通信线路接收的第二代码串中包含的扩展代码中的帧号与该单声道代码的帧号最接近的扩展代码的帧号之差大的帧,使2个声道的解码声音信号中不产生差值,可以抑制解码声音信号的声道间的信号的分割的较大的差错。例如,设想若时间差变为400ms以上则特征参数产生较大不同,则若在帧长为20ms的情况下则帧号之差变为20以上时特征参数产生较大不同,因此上述的预先决定的值例如设为20即可。
<第六实施方式>
声音信号接收侧装置220-m根据在规定的时间范围内测量的、从第一通信线路410-m输入的第一代码串、以及与该第一代码串相同的帧号的从第二通信线路510-m输入的第二代码串的时间差的平均值,在该时间差的平均值不在预先决定的限制时间内的情况下,可以将解码单声道代码而得到的解码数字声音信号设为2个声道的解码数字声音信号。将该方式作为第六实施方式进行说明。
第六实施方式与第一实施方式的不同之处在于,声音信号接收侧装置220-m的接收部221-m和解码装置222-m的动作。另外,在解码装置222-m中进行第六实施方式与第一实施方式不同的动作的是扩展解码部2222-m。以下,对第六实施方式与第一实施方式的不同点进行说明。
[[接收部221-m]]
在接收部221-m中,通话对方端的声音信号发送侧装置210-m’输出的第一代码串从第一通信线路410-m被输入,通话对方端的声音信号发送侧装置210-m’输出的第二代码串从第二通信线路510-m被输入。第二通信线路是优先级低的通信网,所以通常通话对方端的声音信号发送侧装置210-m’输出的某帧的第二代码串在该帧的第一代码串从第一通信线路410-m被输入之后从第二通信线路510-m被输入接收部221-m中。
接收部221-m首先判断:对于从第一通信线路410-m接收到的第一代码串和对应于该第一代码串的从第二通信线路510-m接收到的第二代码串的组的、该第一代码串和该第二代码串被接收到的时刻之差的对于多个组的平均值是否小于预先决定的限制时间Tmax。另外,限制时间Tmax例如是400ms。
例如,接收部221-m进行以下的步骤S221-21至步骤S221-24。接收部221-m对于从开始接收第一代码串起预先决定的个数的第一代码串,读出帧号,测量接收到的时刻,将帧号和第一代码串被接收到的时刻相关联,存储在接收部221-m内的未图示的存储部中(步骤S221-21)。接收部221-m,还对于接收到的第二代码串,读出帧号,在读出的帧号与存储部中存储的帧号的任一个一致的情况下,测量接收到的时刻,对存储部中存储的帧号和第一代码串被接收到的时刻,也关联第二代码串被接收到的时刻,存储在存储部中(步骤S221-22)。接收部221-m接着使用存储部中关联存储的帧号、第一代码串被接收到的时刻和第二代码串被接收到的时刻,得到每个帧号的从第二代码串被接收到的时刻减去第一代码串被接收到的时刻后的值的、对于上述的预先决定的个数的平均值(步骤S221-23)。接收部221-m接着判断在步骤S221-23中得到的平均值是否小于预先决定的限制时间Tmax(步骤S221-24)。
接收部221-m接着在上述的判断中平均值小于限制时间Tmax的情况下,对于这以后的帧,将从第一通信线路410-m输入的第一代码串中包含的单声道代码、以及在从第二通信线路510-m输入的第二代码串中包含的扩展代码中的帧号与该单声道代码的帧号最接近的扩展代码输出到解码装置222-m,在上述的判断中平均值不小于限制时间Tmax的情况下,对于这以后的帧,将从第一通信线路410-m输入的第一代码串中包含的单声道代码输出到解码装置222-m。接收部221-m在上述的判断中平均值不小于限制时间Tmax的情况下,对于这以后的帧,不输出扩展代码。即,接收部221-m在上述的判断中平均值不小于限制时间Tmax的情况下,仅输出单声道代码即可。
即,接收部221-m在对于从第一通信线路410-m接收到的第一代码串、以及与该第一代码串对应的从第二通信线路510-m接收到的第二代码串的组的、该第一代码串和该第二代码串被接收到的时刻之差的对于多个组的平均值小于预先决定的限制时间Tmax的情况下,对于这以后的帧,在从第二通信线路510-m输入的第二代码串中包含的扩展代码中包含帧号与从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)的帧号相同的扩展代码的情况下,将该单声道代码、帧号与该单声道代码的帧号相同的扩展代码输出到解码装置222-m,在从第二通信线路510-m输入的第二代码串中包含的扩展代码中不包含帧号与从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)的帧号相同的扩展代码的情况下,将从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)、以及在从第二通信线路510-m输入的第二代码串中包含的扩展代码中帧号与该单声道代码的帧号最接近的扩展代码(即,在从第二通信线路510-m输入的第二代码串中包含的扩展代码中,虽然帧号与该单声道代码的帧号不相同,但是帧号与该单声道代码的帧号最接近的扩展代码)输出到解码装置222-m,在上述的平均值不小于限制时间Tmax的情况下,对于这以后的帧,仅将从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)输出到解码装置222-m。
另外,接收部221-m也可以在上述的判断结束之前,什么也不输出,也可以与第一实施方式同样地将单声道代码和扩展代码输出到解码装置222-m,也可以不输出扩展代码而将单声道代码输出到解码装置222-m,也可以与第五实施方式同样,单声道代码必定输出到解码装置222-m,仅在单声道代码与扩展代码的帧号之差小的情况下,扩展代码也输出到解码装置222-m。
[[解码装置222-m]]
在接收部221-m进行的上述的判断中平均值小于预先决定的限制时间Tmax的情况下,与第一实施方式的解码装置222-m同样,对于每个帧,在解码装置222-m中输入单声道代码和扩展代码。另一方面,在接收部221-m进行的上述的判断中平均值不小于预先决定的限制时间Tmax的情况下,对于每个帧,在解码装置222-m中输入接收部221-m输出的单声道代码,不输入扩展代码。
另外,在接收部221-m进行的上述的判断结束之前,在解码装置222-m中什么也不输入,或者不输入扩展代码而输入单声道代码,或者输入单声道代码和扩展代码。解码装置222-m对于每个帧,得到与输入的单声道代码和扩展代码,或者,与输入的单声道代码对应的2个声道的解码数字声音信号而输出到再生部223-m。
[[[扩展解码部2222-m]]]
扩展解码部2222-m在输入了单声道的解码数字声音信号和扩展代码的情况下,即,在上述的判断中平均值小于预先决定的限制时间Tmax的情况下,对于每个帧,由输入的单声道的解码数字声音信号和扩展代码,通过与第一实施方式的扩展解码部2222-m相同的动作,得到2个声道的解码数字声音信号而输出到再生部223-m。扩展解码部2222-m在输入了单声道的解码数字声音信号的情况下,即,在上述的判断中平均值不小于预先决定的限制时间Tmax的情况下,将输入的单声道的解码数字声音信号原样作为2个声道的解码数字声音信号而得到,输出到再生部223-m。
即,解码装置222-m在对于从第一通信线路410-m接收到的第一代码串和与该第一代码串对应的从第二通信线路510-m接收到的第二代码串的组的、该第一代码串和该第二代码串被接收到的时刻的差的对于多个组的平均值小于预先决定的限制时间Tmax的情况下,根据从第一通信线路410-m输入的第一代码串中包含的单声道代码、在从第二通信线路510-m输入的第二代码串中包含的扩展代码即帧号与该单声道代码最接近的扩展代码,得到并输出2个声道的解码数字声音信号,在上述的平均值不小于限制时间Tmax的情况下,将基于从第一通信线路410-m输入的第一代码串中包含的单声道代码的单声道的解码数字声音信号原样作为2个声道的解码数字声音信号输出。
更具体地说,解码装置222-m对于在从第一通信线路410-m接收到的第一代码串和与该第一代码串对应的从第二通信线路510-m接收到的第二代码串的组的、该第一代码串和该第二代码串被接收到的时刻之差的对于多个组的平均值小于预先决定的限制时间Tmax的情况下,对于在从第二通信线路510-m输入的第二代码串中包含的扩展代码中包含帧号与与从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)的帧号相同的扩展代码的帧,估计该单声道代码、帧号与该单声道代码的帧号相同的扩展代码,得到并输出2个声道的解码数字声音信号,对于在从第二通信线路510-m输入的第二代码串中包含的扩展代码中不包含帧号与从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)的帧号相同的扩展代码的帧,估计从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)、以及作为在从第二通信线路510-m输入的第二代码串中包含的扩展代码的且帧号与该单声道代码的帧号最接近的扩展代码(即,在从第二通信线路510-m输入的第二代码串中包含的扩展代码中,虽然帧号与该单声道代码的帧号不相同,但是帧号与该单声道代码的帧号最接近的扩展代码),得到并输出2个声道的解码数字声音信号,在上述的平均值不小于限制时间Tmax的情况下,将基于从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)的单声道的解码数字声音信号原样作为2个声道的解码数字声音信号输出。
另外,在接收部221-m进行的上述的判断结束之前,扩展解码部2222-m对于被输入了单声道的解码数字声音信号和扩展代码的帧,由输入的单声道的解码数字声音信号和扩展代码,通过与第一实施方式的扩展解码部2222-m相同的动作,得到2个声道的解码数字声音信号而输出到再生部223-m,或者,将输入的单声道的解码数字声音信号原样作为2个声道的解码数字声音信号得到,输出到再生部223-m,或者什么也不输出。
<第六实施方式的变形例>
以上说明的是基于第一实施方式的声音信号接收侧装置220-m的结构的第六实施方式的声音信号接收侧装置220-m及其动作,也可以构成基于第三实施方式至第五实施方式以及它们的变形例的任一个的声音信号接收侧装置220-m的第六实施方式的声音信号接收侧装置220-m而进行动作。另外,在上述的例子中,将从开始接收第一代码串起至接收预先决定的个数的第一代码串为止作为规定的时间范围使用,但是规定的时间范围将哪个时刻设定作为始点都可以,例如,也可以将开始接收第一代码串后的某个时刻起开始的区间作为规定的时间范围使用,也可以将开始接收第一代码串后的多个时刻的每一个起开始的区间分别设定作为规定的时间范围。
〔效果〕
如在第五实施方式中说明的那样,即使是时间的变动小的特征参数,若时刻大不相同则存在值较大地改变的可能性。因此,在判断为在第一通信线路和第二通信线路之间扩展代码表示的特征参数有很大程度不同的时间差的情况下,在反映了2个声道的差分的特征的2个声道的解码声音信号中,存在声道间的信号的分割上产生较大差错的可能性。按照本第六实施方式,在对于相同的帧的第一代码串从第一通信线路被接收的时刻和第二代码串从第二通信线路被接收的时刻之差较大的情况下,通过使2个声道的解码声音信号中不产生差值,可以抑制解码声音信号的声道间的信号的分割的较大的差错。
<第七实施方式>
声音信号接收侧装置220-m根据在规定的时间范围测量的、从第一通信线路410-m输入的第一代码串和与该第一代码串相同的帧号的从第二通信线路510-m输入的第二代码串的时间差的平均值,在该时间差的平均值在预先决定的限制时间内的情况下,也可以使用单声道代码、帧号与该单声道代码的帧号相同的扩展代码,设为2个声道的解码数字声音信号。将该方式作为第七实施方式进行说明。
第七实施方式与第一实施方式的不同之处在于,声音信号接收侧装置220-m的接收部221-m的动作。以下,对第七实施方式与第一实施方式的不同点进行说明。
[[接收部221-m]]
在接收部221-m中,通话对方端的声音信号发送侧装置210-m’输出的第一代码串从第一通信线路410-m被输入,通话对方端的声音信号发送侧装置210-m’输出的第二代码串从第二通信线路510-m2输入。第二通信线路是优先级低的通信网,所以通常通话对方端的声音信号发送侧装置210-m’输出的某帧的第二代码串在该帧的第一代码串从第一通信线路410-m被输入后,从第二通信线路510-m输入到接收部221-m中。
接收部221-m首先判断对于从第一通信线路410-m接收到的第一代码串和与该第一代码串对应的从第二通信线路510-m接收到的第二代码串的组的、该第一代码串和该第二代码串被接收到的时刻之差的对于多个组的平均值是否小于预先决定的限制时间Tmin。另外,限制时间Tmin例如是帧长的2倍的值。即,如帧长为20ms,则限制时间Tmin例如是40ms。
例如,接收部221-m进行以下的步骤S221-31至步骤S221-34。接收部221-m对于从开始接收第一代码串起预先决定的个数的第一代码串,读出帧号,测量接收到的时刻,将帧号与接收到第一代码串的时刻相关联地存储在接收部221-m内的未图示的存储部中(步骤S221-31)。另外,接收部221-m对于接收到的第二代码串,读出帧号,在读出的帧号与存储部中存储的帧号的任一个一致的情况下,测量接收到的时刻,对存储部中存储的帧号和接收到第一代码串的时刻,也关联接收到第二代码串的时刻存储在存储部中(步骤S221-32)。接收部221-m接着使用存储部中关联存储的帧号、接收到第一代码串的时刻和接收到第二代码串的时刻,得到对于每个帧号的从接收到第二代码串的时刻减去接收到第一代码串的时刻后的值的、对于上述的预先决定的个数的平均值(步骤S221-33)。接收部221-m接着判断在步骤S221-33中得到的平均值是否小于预先决定的限制时间Tmin(步骤S221-34)。
接收部221-m接着在上述的判断中平均值小于限制时间Tmin的情况下,对于这以后的帧,将从第一通信线路410-m输入的第一代码串中包含的单声道代码、在从第二通信线路510-m输入的第二代码串中包含的扩展代码中帧号与该单声道代码的帧号相同的扩展代码输出到解码装置222-m,在上述的判断中平均值不小于限制时间Tmin的情况下,对于这以后的帧,将从第一通信线路410-m输入的第一代码串中包含的单声道代码、在从第二通信线路510-m输入的第二代码串中包含的扩展代码中帧号与该单声道代码的帧号最接近的扩展代码输出到解码装置222-m。但是,从第一通信线路410-m接收第一代码串起,到从该帧的第二通信线路510-m接收第二代码串为止,设想若进行平均则需要在步骤S221-33中得到的平均值的时间,所以接收部221-m需要以从第一通信线路410-m接收第一代码串起直至对解码装置222-m输出为止的时间成为在步骤S221-33中得到的的平均值或者比其大的值的方式进行动作。
即,接收部221-m在对于从第一通信线路410-m接收到的第一代码串和与该第一代码串对应的从第二通信线路510-m接收到的第二代码串的组的、该第一代码串和该第二代码串被接收到的时刻之差的对于多个组的平均值小于预先决定的限制时间Tmin的情况下,对于这以后的帧,将从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)、在从第二通信线路510-m输入的第二代码串中包含的扩展代码中的帧号与该单声道代码的帧号相同的扩展代码输出到解码装置222-m,在上述的平均值小于限制时间Tmin的情况下,对于这以后的帧,在从第二通信线路510-m输入的第二代码串中包含的扩展代码中包含帧号与从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)的帧号相同的扩展代码的情况下,将该单声道代码和帧号与该单声道代码的帧号相同的扩展代码输出到解码装置222-m,在从第二通信线路510-m输入的第二代码串中包含的扩展代码中不包含帧号与从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)的帧号相同的扩展代码的情况下,将第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)、以及在从第二通信线路510-m输入的第二代码串中包含的扩展代码中帧号与该单声道代码的帧号最接近的扩展代码(即,在从第二通信线路510-m输入的第二代码串中包含的扩展代码中,虽然帧号与该单声道代码的帧号不相同,但是帧号与该单声道代码的帧号最接近的扩展代码)输出到解码装置222-m。
第七实施方式的声音信号接收侧装置220-m的解码装置222-m的动作与第一实施方式的声音信号接收侧装置220-m的解码装置222-m的动作相同,解码装置222-m根据接收部221-m输出的单声道代码和接收部221-m输出的扩展代码,得到并输出2个声道的解码数字声音信号。但是,第七实施方式的接收部221-m输出的扩展代码根据情况与第一实施方式的接收部221-m输出的扩展代码不同,所以解码装置222-m具体进行下述的动作。
即,解码装置222-m在对于从第一通信线路410-m接收到的第一代码串和与该第一代码串对应的从第二通信线路510-m接收到的第二代码串的组的、该第一代码串和该第二代码串被接收到的时刻之差的对于多个组的平均值小于预先决定的限制时间Tmin的情况下,根据从第一通信线路410-m输入的第一代码串中包含的单声道代码、以及作为在从第二通信线路510-m输入的第二代码串中包含的扩展代码的且帧号与该单声道代码的帧号相同的扩展代码,得到并输出2个声道的解码数字声音信号,在上述的平均值不小于限制时间Tmin的情况下,根据从第一通信线路410-m输入的第一代码串中包含的单声道代码、以及在从第二通信线路510-m输入的第二代码串中包含的扩展代码即帧号与该单声道代码的帧号最接近的扩展代码,得到并输出2个声道的解码数字声音信号。
更具体地说,解码装置222-m在对于从第一通信线路410-m接收到的第一代码串和与该第一代码串对应的从第二通信线路510-m接收到的第二代码串的组的、该第一代码串和该第二代码串被接收到的时刻之差的对于多个组的平均值小于预先决定的限制时间Tmin的情况下,根据从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)、以及在从第二通信线路510-m输入的第二代码串中包含的扩展代码即帧号与该单声道代码的帧号相同的扩展代码,得到并输出2个声道的解码数字声音信号,在上述的平均值不小于限制时间Tmin的情况下,对于在在从第二通信线路510-m输入的第二代码串中包含的扩展代码中包含帧号与从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)的帧号相同的扩展代码的帧,根据该单声道代码、以及帧号与该单声道代码的帧号相同的扩展代码,得到并输出2个声道的解码数字声音信号,在从第二通信线路510-m输入的第二代码串中包含的扩展代码中不包含帧号与从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)的帧号相同的扩展代码的帧,根据从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)、以及作为在从第二通信线路510-m输入的第二代码串中包含的扩展代码的帧号与该单声道代码的帧号最接近的扩展代码(即,在从第二通信线路510-m输入的第二代码串中包含的扩展代码中,虽然帧号与该单声道代码的帧号不相同,但是帧号与该单声道代码的帧号最接近的扩展代码),得到并输出2个声道的解码数字声音信号。
另外,在接收部221-m进行的上述的判断结束之前,例如,接收部221-m与第一实施方式同样地将单声道代码和扩展代码输出到解码装置222-m即可,解码装置222-m与第一实施方式同样,使用单声道代码和扩展代码,得到2个声道的解码数字声音信号而输出到再生部223-m即可。
<第七实施方式的变形例>
上面叙述的是基于第一实施方式的声音信号接收侧装置220-m的结构的第七实施方式的声音信号接收侧装置220-m及其动作,但是也可以构成基于从第三实施方式至第五实施方式以及它们的变形例的任一个的声音信号接收侧装置220-m的第七实施方式的声音信号接收侧装置220-m而动作。另外,在上述的例子中,将从开始接收第一代码串起至接收预先决定的个数的第一代码串为止作为规定的时间范围使用,但是规定的时间范围将哪个时刻设定作为始点都可以,例如,可以将开始接收第一代码串后的某个时刻起开始的区间作为规定的时间范围使用,也可以将开始接收第一代码串后的多个时刻的每一个起开始的区间分别设定作为规定的时间范围。
〔效果〕
即使是时间的变动小的特征参数,若时刻不同,则存在值稍有不同的可能性。因此,若能够仅通过稍微增加延迟就能够使用相同的帧的特征参数进行解码,则有可能得到高音质的解码声音信号。因此,在本第七实施方式中,对于关于相同的帧的第一代码串从第一通信线路被接收的时刻与第二代码串从第二通信线路被接收的时刻之差的规定的时间范围的平均值,设置作为预先决定的值的限制时间,在小于限制时间的情况下,通过敢于稍微增加了延迟后,使用单声道代码、与该单声道代码相同的帧的扩展代码来设为2个声道的解码数字声音信号,得到高音质的解码声音信号。
<第八实施方式>
声音信号接收侧装置220-m根据在规定的时间范围中测量的、从第一通信线路410-m输入的第一代码串、以及与该第一代码串相同帧号的从第二通信线路510-m输入的第二代码串的时间差的平均值,在该时间差的平均值小于第一的限制时间的情况下,使用单声道代码、帧号与该单声道代码的帧号相同的扩展代码而得到2个声道的解码数字声音信号,在该时间差的平均值为大于第一的限制时间的预先决定的第二的限制时间以上的情况下,将解码单声道代码而得到的解码数字声音信号设为2个声道的解码数字声音信号,在该时间差的平均值大于等于第一的限制时间且小于第二的限制时间的情况下,使用单声道代码、以及与该单声道代码帧号最接近的扩展代码而得到2个声道的解码数字声音信号。总而言之,可以使第六实施方式和第七实施方式结合来实施。将该方式作为第八实施方式进行说明。
第八实施方式与第一实施方式的不同之处在于,声音信号接收侧装置220-m的接收部221-m和解码装置222-m的动作。但是,声音信号接收侧装置220-m的解码装置222-m的动作与第六实施方式的解码装置222-m的动作相同。以下,对第八实施方式于第一实施方式、也与第六实施方式不同的接收部221-m的动作进行说明。
[[接收部221-m]]
在接收部221-m中,通话对方端的声音信号发送侧装置210-m’输出的第一代码串从第一通信线路410-m被输入,通话对方端的声音信号发送侧装置210-m’输出的第二代码串从第二通信线路510-m被输入。第二通信线路是优先级低的通信网,所以通常通话对方端的声音信号发送侧装置210-m’输出的某帧的第二代码串在该帧的第一代码串从第一通信线路410-m被输入后,从第二通信线路510-m输入到接收部221-m中。
接收部221-m首先判断:对于从第一通信线路410-m接收到的第一代码串和与该第一代码串对应的从第二通信线路510-m接收到的第二代码串的组的、该第一代码串和该第二代码串被接收到的时刻之差的对于多个组的平均值是小于预先决定的第一的限制时间Tmin,还是大于等于比第一的限制时间Tmin大的预先决定的第二的限制时间Tmax,还是大于等于第一的限制时间Tmin且小于第二的限制时间Tmax。另外,第一的限制时间Tmin例如为帧长的2倍的值。即,若帧长为20ms,则第一的限制时间Tmin例如为40ms。另外,第二的限制时间Tmax例如是400ms。
例如,接收部221-m进行以下的步骤S221-41至步骤S221-44。接收部221-m对于从开始接收第一代码串起预先决定的个数的第一代码串,读出帧号,测量接收到的时刻,将帧号与接收到第一代码串的时刻相关联地存储在接收部221-m内的未图示的存储部中(步骤S221-41)。另外,接收部221-m对于接收到的第二代码串,读出帧号,在读出的帧号与存储部中存储的帧号的任一个一致的情况下,测量接收到的时刻,对存储部中存储的帧号和接收到第一代码串的时刻,还关联接收到第二代码串的时刻存储在存储部中(步骤S221-42)。接着,接收部221-m使用存储部中关联存储的帧号、接收到第一代码串的时刻和接收到第二代码串的时刻,得到对于每个帧号的从接收到第二代码串的时刻减去接收到第一代码串的时刻后的值的、对于上述的预先决定的个数的平均值(步骤S221-43)。接着,接收部221-m判断在步骤S221-43中得到的平均值是小于预先决定的第一的限制时间Tmin,还是大于等于比第一的限制时间Tmin大的预先决定的第二的限制时间Tmax,还是大于等于第一的限制时间Tmin且小于第二的限制时间Tmax(步骤S221-44)。
接着,接收部221-m在上述的判断中平均值小于第一的限制时间Tmin的情况下,对于这以后的帧,将从第一通信线路410-m输入的第一代码串中包含的单声道代码、在从第二通信线路510-m输入的第二代码串中包含的扩展代码中帧号与该单声道代码的帧号相同的扩展代码输出到解码装置222-m,在上述的判断中平均值大于等于第一的限制时间Tmin且小于第二的限制时间Tmax的情况下,对于这以后的帧,将从第一通信线路410-m输入的第一代码串中包含的单声道代码、以及在从第二通信线路510-m输入的第二代码串中包含的扩展代码中帧号与该单声道代码的帧号最接近的扩展代码输出到解码装置222-m,在上述的判断中平均值小于了第二的限制时间Tmax的情况下,对于这以后的帧,将从第一通信线路410-m输入的第一代码串中包含的单声道代码输出到解码装置222-m。接收部221-m在上述的判断中平均值小于了第二的限制时间Tmax的情况下,对于这以后的帧,不输出扩展代码。即,接收部221-m在上述的判断中平均值小于了第二的限制时间Tmax的情况下,仅输出单声道代码即可。但是,从第一通信线路接收第一代码串起,至从该帧的第二通信线路接收第二代码串为止,设想若进行平均则需要在步骤S221-43中得到平均值的时间,所以接收部221-m需要以从第一通信线路接收第一代码串起至对解码装置222-m输出为止的时间成为在步骤S221-43中得到的平均值或者比它大的值的方式进行动作。
即,接收部221-m在对于从第一通信线路410-m接收到的第一代码串和与该第一代码串对应的从第二通信线路510-m接收到的第二代码串的组的、该第一代码串和该第二代码串被接收到的时刻之差的对于多个组的平均值小于预先决定的限制时间Tmin的情况下,对于这以后的帧,将从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)、以及在从第二通信线路510-m输入的第二代码串中包含的扩展代码中帧号与该单声道代码的帧号相同的扩展代码输出到解码装置222-m,在在上述的平均值大于等于第一的限制时间Tmin且小于第二的限制时间Tmax的情况下,对于这以后的帧,在从第二通信线路510-m输入的第二代码串中包含的扩展代码中包含帧号与从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)的帧号相同的扩展代码的情况下,将该单声道代码、以及帧号与该单声道代码的帧号相同的扩展代码输出到解码装置222-m,在从第二通信线路510-m输入的第二代码串中包含的扩展代码中不包含帧号与从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)的帧号相同的扩展代码的情况下,将从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)、以及在从第二通信线路510-m输入的第二代码串中包含的扩展代码中帧号与该单声道代码的帧号最接近的扩展代码(即,在从第二通信线路510-m输入的第二代码串中包含的扩展代码中,虽然帧号与该单声道代码的帧号不相同,但是帧号与该单声道代码的帧号最接近的扩展代码)输出到解码装置222-m,在上述的平均值不小于第二的限制时间Tmax的情况下,对于这以后的帧,仅将从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)输出到解码装置222-m。
另外,接收部221-m在上述的判断结束之前,可以什么也不输出,也可以与第一实施方式同样将单声道代码和扩展代码输出到解码装置222-m,也可以不输出扩展代码而将单声道代码输出到解码装置222-m,也可以与第五实施方式同样,单声道代码必定输出到解码装置222-m,仅在单声道代码和扩展代码的帧号之差较小的情况下扩展代码也输出到解码装置222-m。
第八实施方式的声音信号接收侧装置220-m的解码装置222-m的动作与第六实施方式的声音信号接收侧装置220-m的解码装置222-m的动作相同。但是,第八实施方式的接收部221-m输出的扩展代码按照情况,与第六实施方式的接收部221-m输出的扩展代码不同,所以解码装置222-m具体地说进行下述的动作。
即,解码装置222-m在上述的判断中平均值小于第一的限制时间Tmin的情况下、以及在上述的判断中平均值大于等于第一的限制时间Tmin且小于第二的限制时间Tmax的情况下,对于这以后的帧,根据接收部221-m输出的单声道代码和接收部221-m输出的扩展代码,得到并输出2个声道的解码数字声音信号,在上述的判断中平均值大于等于第二的限制时间Tmax的情况下,对于这以后的帧,将基于接收部221-m输出的单声道代码的单声道的解码数字声音信号原样作为2个声道的解码数字声音信号输出。
更具体地说,解码装置222-m在对于从第一通信线路410-m接收到的第一代码串和与该第一代码串对应的从第二通信线路510-m接收到的第二代码串的组的、该第一代码串和该第二代码串被接收到的时刻之差的对于多个组的平均值小于等于预先决定的第一的限制时间Tmin的情况下,根据从第一通信线路410-m输入的第一代码串中包含的单声道代码、以及作为在从第二通信线路510-m输入的第二代码串中包含的扩展代码且帧号与该单声道代码的帧号相同的扩展代码,得到并输出2个声道的解码数字声音信号,在上述的平均值大于等于比第一的限制时间Tmin大的预先决定的第二的限制时间Tmax的情况下,将基于从第一通信线路410-m输入的第一代码串中包含的单声道代码的单声道的解码数字声音信号原样作为2个声道的解码数字声音信号输出,在上述的平均值大于等于第一的限制时间Tmin且小于第二的限制时间Tmax的情况下,根据从第一通信线路410-m输入的第一代码串中包含的单声道代码、以及作为在从第二通信线路510-m输入的第二代码串中包含的扩展代码且帧号与该单声道代码的帧号最接近的扩展代码,得到并输出2个声道的解码数字声音信号。
更具体地说,解码装置222-m在对于从第一通信线路410-m接收到的第一代码串和与该第一代码串对应的从第二通信线路510-m接收到的第二代码串的组的、该第一代码串和该第二代码串被接收到的时刻之差的对于多个组的平均值小于预先决定的第一的限制时间Tmin的情况下,根据从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)、以及作为在从第二通信线路510-m输入的第二代码串中包含的扩展代码且帧号与该单声道代码的帧号相同的扩展代码,得到并输出2个声道的解码数字声音信号,在上述的平均值大于等于比第一的限制时间Tmin大的预先决定的第二的限制时间Tmax的情况下,将基于从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)的单声道的解码数字声音信号原样作为2个声道的解码数字声音信号输出,在上述的平均值大于等于第一的限制时间Tmin且小于第二的限制时间Tmax的情况下,对于在从第二通信线路510-m输入的第二代码串中包含的扩展代码中包含帧号与从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)的帧号相同的扩展代码的帧,根据该单声道代码、以及帧号与该单声道代码的帧号相同的扩展代码,得到并输出2个声道的解码数字声音信号,对于在从第二通信线路510-m输入的第二代码串中包含的扩展代码中不包含帧号与从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)的帧号相同的扩展代码的帧,根据从第一通信线路410-m输入的第一代码串中包含的单声道代码(即,帧号顺序的单声道代码)、以及在从第二通信线路510-m输入的第二代码串中包含的扩展代码即帧号与该单声道代码的帧号最接近的扩展代码(即,在从第二通信线路510-m输入的第二代码串中包含的扩展代码中,虽然帧号与该单声道代码的帧号不相同,但是帧号与该单声道代码的帧号最接近的扩展代码),得到并输出2个声道的解码数字声音信号。
另外,在接收部221-m进行的上述的判断结束之前,在解码装置222-m中,什么也不输入,或者不输入扩展代码而输入单声道代码,或者输入单声道代码和扩展代码。解码装置222-m,对于每个帧,得到与输入的单声道代码和扩展代码,或者,输入的单声道代码对应的2个声道的解码数字声音信号而输出到再生部223-m。
<第八实施方式的变形例>
以上叙述的是基于第一实施方式的声音信号接收侧装置220-m的结构的第八实施方式的声音信号接收侧装置220-m及其动作,但是也可以构成基于从第三实施方式至第五实施方式以及它们的变形例的任一个的声音信号接收侧装置220-m的第八实施方式的声音信号接收侧装置220-m而动作。另外,在上述的例子中,将从开始接收第一代码串起至接收预先决定的个数的第一代码串为止作为规定的时间范围使用,但是规定的时间范围在哪个时刻设定都可以,例如,可以将开始接收第一代码串后的某个时刻起开始的区间作为规定的时间范围使用,开始接收第一代码串后的多个时刻的每一个起开始的区间分别设定作为规定的时间范围。
〔效果〕
按照本第八实施方式,抑制对于相同的帧的第一代码串被从第一通信线路接收到的时刻和第二代码串被从第二通信线路接收到的时刻之差较大时的解码声音信号的声道间的信号的分割的较大的差错,并且,在上述的差较小时得到高音质的解码声音信号。
<第九实施方式>
用于在多地点进行电话会议的多地点控制装置(MCU,Multipoint Control Unit)中,可以将对应于不同的2地点的声音信号的每一个的数字声音信号作为2个声道的数字声音信号,进行与上述的各实施方式的声音信号发送侧装置210-m同样的动作。将该方式作为第九实施方式进行说明。
《多地点控制装置600》
如图7所示,多地点控制装置600包括:接收部610、单声道解码部620、地点选择部630、信号分析部640、单声道编码部650和发送部660。以下,以在多地点控制装置600上连接有P地点(P为3以上的整数)的终端装置,在多个线路对应终端装置200-m1上传递从地点m2至地点mP的P-1地点中的最大2地点的声音信号的例子进行说明。多地点控制装置600对作为例如20ms的规定的时间区间的每个帧,进行图8以及以下例示的步骤S610至步骤S660的处理。
[接收部610]
在接收部610中被输入多个线路对应终端装置200-melse(else为大于等于2小于等于P的各整数)经由第一通信线路输出的P-1个第一代码串。接收部610将输入的P-1个第一代码串的每一个中包含的单声道代码输出到单声道解码部620(步骤S610)。
[单声道解码部620]
单声道解码部620将从接收部610输入的P-1个单声道代码分别以规定的解码方式解码而得到作为单声道的解码数字声音信号的解码单声道信号,输出到地点选择部630(步骤S620)。关于规定的解码方式,如在第一实施方式中说明的那样。
[地点选择部630]
地点选择部630根据预先决定的选择基准,选择从单声道解码部620输入的P-1个解码单声道信号中的2个解码单声道信号,输出到信号分析部640(步骤S630)。作为预先决定的选择基准,预先决定可选择重要程度高的地点的解码单声道信号的基准,使得地点选择部630可执行选择即可。例如,若作为选择基准而使用声音信号的功率,则地点选择部630对于每个帧,将输入的P-1个解码单声道信号中的功率最大的解码单声道信号和功率第2大的解码单声道信号输出到信号分析部640。
[信号分析部640]
信号分析部640由输入的2个解码单声道信号,得到将输入的2个解码单声道信号混合后的信号的单声道信号而输出到单声道编码部650,得到表示特征参数的扩展代码而输出到发送部660,所述特征参数是表示输入的2个解码单声道信号的差分的特征的参数、并且是表示时间的变动小的参数(步骤S640)。信号分析部640只要进行与第一实施方式的多个线路对应终端装置200-m的声音信号发送侧装置210-m的编码装置212-m的信号分析部2121-m相同的动作即可。但是,在本第九实施方式的情况下,输入的2个解码单声道信号对应于在分别不同的地点发出的声音信号,所以作为特征参数,与信号分析部2121-m的第1例中示出的表示时间差的信息相比,使用在第2例中示出的表示每个频带的强度差的信息较好。另外,可以将表示输入的2个解码单声道信号的功率之比或之差的信息作为特征参数。
[单声道编码部650]
单声道编码部650将输入的单声道信号以规定的编码方式编码而得到单声道代码,输出到发送部660(步骤S650)。关于规定的编码方式,如在第一实施方式中说明的那样。
[发送部660]
发送部660对于每个帧,将作为包含从单声道编码部650输入的单声道代码的代码串的第一代码串经由第一通信线路对多个线路对应终端装置200-m1输出,并作为包含从将信号分析部640输入的扩展代码的代码串的第二代码串经由第二通信线路对多个线路对应终端装置200-m1输出(步骤S660)。
〔效果〕
通过使多地点控制装置600进行本第九实施方式的动作,可以在多个线路对应终端装置200-m1中将2地点的声音信号模拟地分为左和右进行再生,可以明确是在任一个地点的发话或是在不同的地点的发话。
<第九实施方式的变形例>
在第九实施方式的多地点控制装置600的地点选择部630中,使用功率来选择2个解码单声道信号,所以可以不在信号分析部640中而在地点选择部630中得到扩展代码。将该方式作为第九实施方式的变形例,对于第九实施方式的不同点进行说明。
《多地点控制装置600》
如图9所示,第九实施方式的变形例的多地点控制装置600包括信号混合部670而取代第九实施方式的多地点控制装置600包括的信号分析部640。多地点控制装置600对于每个帧进行图10中例示的步骤S610至步骤S630、步骤S670、步骤S650至步骤S660的处理。在这些中与第九实施方式实质上不同的是,地点选择部630进行的步骤S630和信号混合部670进行的步骤S670。发送部660进行的步骤S660除了扩展代码不是从信号分析部640输入而是从地点选择部630输入以外,与第九实施方式相同。
[地点选择部630]
地点选择部630选择从单声道解码部620输入的P-1个解码单声道信号中的功率最大的解码单声道信号和功率第2大的解码单声道信号,输出到信号分析部640,进而,得到选择出的2个解码单声道信号的功率之比或者之差作为特征参数,得到作为表示得到的特征参数的编码的扩展代码,输出到发送部660(步骤S630)。
[信号混合部670]
信号混合部670由输入的2个解码单声道信号,得到作为将输入的2个解码单声道信号混合后的信号的单声道信号,输出到单声道编码部650(步骤S670)。
另外,为了强调向多个线路对应终端装置200-m1中的2地点的声音信号的模拟的左和右的分配,地点选择部630也可以得到用于确定选择出的2个解码单声道信号中的功率较大一方的地点的信息作为特征参数,得到作为表示得到的特征参数的代码的扩展代码,输出到发送部660。在该情况下,只要在多个线路对应终端装置200-m1的声音信号接收侧装置220-m1的解码装置222-m1的扩展解码部2222-m1中,对于各地点,以声音信号定位在预先决定的左右位置的方式得到2个声道的解码数字声音信号即可。另外,在该情况下,信号混合部670也可以选择输入的2个解码单声道信号中的功率较大一方而输出到单声道编码部650,也可以原本不具有信号混合部670,地点选择部630仅选择并输出功率最大的一个解码单声道信号。
<第十实施方式>
在上述的各实施方式以及变形例中,为了简化说明,以处理多个线路对应终端装置200-m的2个声道的声音信号为例进行了说明。可是,声道数不限于此,也可以大于等于2。若将该声道数设为C(C为大于等于2的整数),则上述的各实施方式以及变形例可以将2个声道改读为C个(C为大于等于2的整数)的声道而进行实施。
例如,多个线路对应终端装置200-m的声音信号发送侧装置210-m的拾音部211-m包含C个麦克风和C个AD转换部即可,多个线路对应终端装置200-m的声音信号发送侧装置210-m的编码装置212-m只要从输入的C个声道的数字声音信号得到单声道代码和扩展代码即可。具体地说,编码装置212-m只要将混合了输入的C个声道的数字声音信号的信号以规定的第1编码方式进行编码而得到单声道代码,得到包含表示相当于输入的C个声道的数字声音信号中的信道间的差分的信息的代码的扩展代码即可。所谓相当于C个声道的数字声音信号中的信道间的差分的信息例如是,对设为基准的声道以外的C-1个声道的每一个的、相当于该声道的数字声音信号和设为基准的声道的数字声音信号的差分的信息。
另外,多个线路对应装置200-m的声音信号接收侧装置220-m的解码装置222-m根据输入的单声道代码和扩展代码得到并输出C个声道的解码数字声音信号即可。具体地说,解码装置222-m的单声道解码部2221-m将输入的单声道代码解码而得到单声道的解码数字声音信号,解码装置222-m的扩展解码部2222-m视为单声道的解码数字声音信号是混合了C个声道的解码数字声音信号的信号,视为根据输入的扩展代码得到的特征参数是表示C个声道的解码数字声音信号中的声道间的差分的特征的信息,得到并输出C个声道的解码数字声音信号即可。此外,在该情况下,多个线路终端装置200-m的声音信号接收侧装置220-m的再生部223-m也可以包含最大C个DA转换部和最大C个扬声器。
<其它的实施方式>
<<在电话系统中还包含电话线路专用终端装置的方式>>
在电话系统100中还包括电话线路专用终端装置300-n的情况下,电话线路专用终端装置300-n如以下那样进行公知的动作。
《电话线路专用终端装置300-n》
如图11所示,电话线路专用终端装置300-n例如是传统的便携电话或传统的智能手机,包括声音信号发送侧装置310-n和声音信号接收侧装置320-n。声音信号发送侧装置310-n包括拾音部311-n、编码装置312-n和发送部313-n。声音信号接收侧装置320-n包括接收部321-n、解码装置322-n和再生部323-n。电话线路专用终端装置300-n的声音信号发送侧装置310-n进行图12及以下例示的步骤S311至步骤S313的处理,电话线路专用终端装置300-n的声音信号接收侧装置320-n进行图13以及以下例示的步骤S321至步骤S323的处理。
[声音信号发送侧装置310-n]
声音信号发送侧装置310-n例如对于20ms的每个规定的时间区间,即对于每帧,得到作为包含与1个声道的数字声音信号对应的单声道代码的代码串的第一代码串,输出到第一通信线路420-n。
[[拾音部311-n]]
拾音部311-n包括1个麦克风和1个AD转换部。麦克风将在麦克风周边的空间区域发生的声音拾音而转换为模拟的电信号,输出到AD转换部。AD转换部将输入的模拟的电信号转换为例如采样频率为8kHz的PCM信号的数字声音信号后输出。即,拾音部311-n将与1个麦克风拾音的声音对应的1个声道的数字声音信号输出到编码装置312-n(步骤S311)。
[[编码装置312-n]]
编码装置312-n对于每个帧,将从拾音部311-n输入的1个声道的数字声音信号以上述的规定的编码方式编码而得到单声道代码,输出到发送部313-n(步骤S312)。
[[发送部313-n]]
发送部313-n对于每个帧,将作为包含从编码装置312-n输入的单声道代码的代码串的第一代码串输出到第一通信线路420-n(步骤S313)。
[声音信号接收侧装置320-n]
声音信号接收侧装置320-n例如对于20ms的每个规定的时间区间,即对于每个帧,输出基于从第一通信线路420-n输入的第一代码串中包含的单声道代码的声音。
[[接收部321-n]]
接收部321-n对于每个帧,将从第一通信线路420-n输入的第一代码串中包含的单声道代码输出到解码装置322-n(步骤S321)。
[[解码装置322-n]]
对于每个帧,接收部321-n输出的单声道代码被输入到解码装置322-n。解码装置322-n对于每个帧,将输入的单声道代码以上述的规定的解码方式解码而得到1个解码数字声音信号,输出到再生部323-n(步骤S322)。
[[再生部323-n]]
再生部323-n输出与输入的1个解码数字声音信号对应的声音(步骤S323)。
再生部323-n例如包括1个DA转换部和1个扬声器。DA转换部将输入的解码数字声音信号转换为模拟的电信号后输出。扬声器产生与从DA转换部输入的模拟的电信号对应的声音。扬声器也可以是在立体声头戴式耳机或立体声耳机中具备的扬声器。在使用立体声头戴式耳机或立体声耳机具有的扬声器,即使用2个扬声器的情况下,例如,再生部323-n将DA转换部输出的电信号输入到2个扬声器,从2个扬声器产生与1个解码数字声音信号对应的声音(解码声音信号)。
〔效果〕
即使在电话线路专用终端装置300-n中也使用与多个线路对应终端装置200-m相同的编码方式和解码方式,所以在电话线路专用终端装置300-n中,可以在确保了互换性以便得到最低限度的音质的解码声音信号的基础上,在多个线路对应终端装置200-m中,以与得到最低限度的音质的解码声音信号的情况大致相同的延迟时间,即以在双方向通话时不产生不适感的延迟时间,得到高音质的解码声音信号。
<<还有既不是单声道代码也不是扩展代码的代码方式>>
多个线路对应终端装置200-m的声音信号发送侧装置210-m也可以得到并输出既不是上述的单声道代码也不是上述的扩展代码的编码(追加代码)。具体地说,编码装置212-m还得到追加代码而输出到发送部213-m,发送部213-m也可以将从编码装置212-m输入的追加代码输出到第一通信线路410-m和第二通信线路510-m的任一个中。追加代码例如是表示将输入的C个(C是大于等于2的整数)的声道的数字声音信号混合后的信号的高频带成分的特征的代码。
同样,也可以在多个线路对应终端装置200-m的声音信号接收侧装置220-m中,输入既不是上述的单声道代码也不是上述的扩展代码的代码(追加代码),多个线路对应终端装置200-m的声音信号接收侧装置220-m使用追加代码得到并输出解码声音信号。具体地说,接收部221-m也可以将从第一通信线路410-m和第二通信线路510-m的任一个输入的追加代码输出到解码装置222-m,解码装置222-m也可以将使用从接收部221-m输入的追加代码得到解码声音信号。
<程序以及记录介质>
也可以通过计算机实现多个线路对应终端装置200-m的各部分的处理。换言之,也可以通过计算机执行多个线路对应终端装置200-m中的编码方法、多个线路对应终端装置200-m中的解码方法的每一个的各步骤的处理。在该情况下,各步骤的处理通过程序记述。然后,通过由计算机执行该程序,在计算机上实现各步骤的处理。图14是表示用于实现上述的处理的计算机的功能结构的一个例子的图。可以通过使用于使计算机具有作为上述的装置的功能的程序读入记录部2020中,使控制部2010、输入部2030、输出部2040等动作来实施该处理。
记述了这些处理内容的程序的每一个可以记录在计算机可读取的记录介质中。作为计算机可读取的记录介质,例如可以是磁记录装置、光盘、光磁记录介质、半导体存储器等任何介质。
另外,各部分的处理既可以通过在计算机上执行规定的程序来构成,也可以硬件性地实现这些处理的至少一部分。
此外,不言而喻,在不脱离本发明的宗旨范围中能够进行适当变更。
Claims (14)
1.一种声音信号接收解码方法,其是连接到第一通信线路、优先级比所述第一通信线路低的第二通信线路的终端装置进行的声音信号接收解码方法,包括:
接收步骤,对于多个帧中的预先决定的帧,输出从所述第一通信线路输入的第一代码串中包含的单声道代码、以及在从所述第二通信线路输入的第二代码串中包含的扩展代码中帧号的与该单声道代码的帧号最接近的扩展代码,对于所述预先决定的帧以外的帧,输出从所述第一通信线路输入的第一代码串中包含的单声道代码、以及已经输出的扩展代码中最新的扩展代码;以及
解码步骤,对于每个帧,根据在所述接收步骤中输出的所述单声道代码、在所述接收步骤中输出的所述扩展代码,得到并输出C个声道的解码数字声音信号,其中,C是大于等于2的整数。
2.如权利要求1所述的声音信号接收解码方法,其特征在于,
所述解码步骤包括:
单声道解码步骤,将在所述接收步骤中输出的所述单声道代码解码并得到单声道解码数字声音信号;以及
扩展解码步骤,视为所述单声道解码数字声音信号是混合了C个声道的所述解码数字声音信号的信号,视为根据在所述接收步骤中输出的所述扩展代码得到的特征参数是表示C个声道的所述解码数字声音信号中的声道间的差分的特征的信息,得到并输出C个声道的所述解码数字声音信号。
3.一种声音信号解码方法,其是连接到第一通信线路、优先级比所述第一通信线路低的第二通信线路的终端装置进行的声音信号解码方法,包括:
解码步骤,对于多个帧中的预先决定的帧,根据从所述第一通信线路输入的第一代码串中包含的单声道代码、以及从所述第二通信线路输入的第二代码串中包含的扩展代码即帧号与该单声道代码的帧号最接近的扩展代码,得到并输出C个声道的解码数字声音信号,其中,C是大于等于2的整数,
对于所述预先决定的帧以外的帧,根据从所述第一通信线路输入的第一代码串中包含的单声道代码、以及在所述预先决定的帧中使用的最新的扩展代码,得到并输出C个声道的解码数字声音信号。
4.一种声音信号解码方法,其是连接到第一通信线路、优先级比所述第一通信线路低的第二通信线路的终端装置进行的声音信号解码方法,包括:
单声道解码步骤,对于每个帧,将从所述第一通信线路输入的第一代码串中包含的单声道代码解码并得到单声道解码数字声音信号;以及
扩展解码步骤,对于多个帧中的预先决定的帧,视为所述单声道解码数字声音信号是混合了C个声道的解码数字声音信号的信号,其中,C是大于等于2的整数,视为根据扩展代码得到的特征参数是表示C个声道的所述解码数字声音信号中的声道间的差分的特征的信息,得到并输出C个声道的所述解码数字声音信号,其中,该扩展代码是从所述第二通信线路输入的第二代码串中包含的扩展代码、即帧号与从所述第一通信线路输入的第一代码串中包含的单声道代码的帧号最接近的扩展代码,
对于所述预先决定的帧以外的帧,视为所述单声道解码数字声音信号是混合了C个声道的解码数字声音信号的信号,视为在所述预先决定的帧中得到的最新的特征参数是表示C个声道的所述解码数字声音信号中的声道间的差分的特征的信息,得到并输出C个声道的所述解码数字声音信号。
5.如权利要求4所述的声音信号解码方法,其特征在于,
所述预先决定的帧中的所述特征参数是所述扩展代码表示的特征参数和过去的帧的特征参数的平均或者加权平均。
6.一种声音信号接收侧装置,其是连接到第一通信线路、优先级比所述第一通信线路低的第二通信线路的终端装置中包括的声音信号接收侧装置,包括:
接收部,对于多个帧中的预先决定的帧,输出从所述第一通信线路输入的第一代码串中包含的单声道代码、以及在从所述第二通信线路输入的第二代码串中包含的扩展代码中的帧号与该单声道代码的帧号最接近的扩展代码,对于所述预先决定的帧以外的帧,输出从所述第一通信线路输入的第一代码串中包含的单声道代码、以及已经输出的扩展代码中的最新的扩展代码;以及
解码装置,对于每个帧,根据所述接收部输出的所述单声道代码、以及所述接收部输出的所述扩展代码,得到并输出C个声道的解码数字声音信号,其中,C为大于等于2的整数。
7.如权利要求6所述的声音信号接收侧装置,其特征在于,
所述解码装置包括:
单声道解码部,将所述单声道代码解码并得到单声道解码数字声音信号;以及
扩展解码部,视为所述单声道解码数字声音信号是混合了C个声道的所述解码数字声音信号的信号,视为根据所述扩展代码得到的特征参数是表示C个声道的所述解码数字声音信号中的声道间的差分的特征的信息,得到并输出C个声道的所述解码数字声音信号。
8.一种解码装置,其是连接到第一通信线路、优先级比所述第一通信线路低的第二通信线路的终端装置中包括的解码装置,包括:
解码部,对于多个帧中的预先决定的帧,根据从所述第一通信线路输入的第一代码串中包含的单声道代码、以及从所述第二通信线路输入的第二代码串中包含的扩展代码即帧号与该单声道代码的帧号最接近的扩展代码,得到并输出C个声道的解码数字声音信号,其中,C是大于等于2的整数,对于所述预先决定的帧以外的帧,根据从所述第一通信线路输入的第一代码串中包含的单声道代码、以及在所述预先决定的帧中使用的最新的扩展代码,得到并输出C个声道的解码数字声音信号。
9.一种解码装置,其是连接到第一通信线路、优先级比所述第一通信线路低的第二通信线路的终端装置中包括的解码装置,包括:
单声道解码部,对于每个帧,将从所述第一通信线路输入的第一代码串中包含的单声道代码解码并得到单声道解码数字声音信号;以及
扩展解码部,对于多个帧中的预先决定的帧,视为所述单声道解码数字声音信号是混合了C个声道的解码数字声音信号的信号,其中,C是大于等于2的整数,视为根据扩展代码得到的特征参数是表示C个声道的所述解码数字声音信号中的声道间的差分的特征的信息,得到并输出C个声道的所述解码数字声音信号,其中,该扩展代码是从所述第二通信线路输入的第二代码串中包含的扩展代码、即帧号与从所述第一通信线路输入的第一代码串中包含的单声道代码的帧号最接近的扩展代码,
对于所述预先决定的帧以外的帧,视为所述单声道解码数字声音信号是混合了C个声道的解码数字声音信号的信号,视为在所述预先决定的帧中得到的最新的特征参数是表示C个声道的所述解码数字声音信号中的声道间的差分的特征的信息,得到并输出C个声道的所述解码数字声音信号。
10.如权利要求9所述的解码装置,其特征在于,
所述预先决定的帧中的所述特征参数是所述扩展代码表示的特征参数和过去的帧的特征参数的平均或者加权平均。
11.一种程序,用于使计算机执行权利要求1或者2所述的声音信号接收解码方法。
12.一种程序,用于使计算机执行权利要求3至5的任一项所述的声音信号解码方法。
13.一种计算机可读取的记录介质,记录了用于使计算机执行权利要求1或者2所述的声音信号接收解码方法的程序。
14.一种计算机可读取的记录介质,记录了用于使计算机执行权利要求3至5的任一项所述的声音信号解码方法的程序。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2019/023423 WO2020250369A1 (ja) | 2019-06-13 | 2019-06-13 | 音信号受信復号方法、音信号復号方法、音信号受信側装置、復号装置、プログラム及び記録媒体 |
JPPCT/JP2019/023423 | 2019-06-13 | ||
PCT/JP2019/051595 WO2020250470A1 (ja) | 2019-06-13 | 2019-12-27 | 音信号受信復号方法、音信号復号方法、音信号受信側装置、復号装置、プログラム及び記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113966531A true CN113966531A (zh) | 2022-01-21 |
Family
ID=73781708
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980097329.5A Pending CN113966531A (zh) | 2019-06-13 | 2019-12-27 | 声音信号接收解码方法、声音信号解码方法、声音信号接收侧装置、解码装置、程序以及记录介质 |
Country Status (5)
Country | Link |
---|---|
US (1) | US12131743B2 (zh) |
EP (1) | EP3985663B1 (zh) |
JP (1) | JP7192986B2 (zh) |
CN (1) | CN113966531A (zh) |
WO (2) | WO2020250369A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020250369A1 (ja) * | 2019-06-13 | 2020-12-17 | 日本電信電話株式会社 | 音信号受信復号方法、音信号復号方法、音信号受信側装置、復号装置、プログラム及び記録媒体 |
WO2020250371A1 (ja) * | 2019-06-13 | 2020-12-17 | 日本電信電話株式会社 | 音信号符号化送信方法、音信号符号化方法、音信号送信側装置、符号化装置、プログラム及び記録媒体 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4903301A (en) * | 1987-02-27 | 1990-02-20 | Hitachi, Ltd. | Method and system for transmitting variable rate speech signal |
TW224191B (zh) * | 1992-01-28 | 1994-05-21 | Qualcomm Inc | |
JPH11251917A (ja) * | 1998-02-26 | 1999-09-17 | Sony Corp | 符号化装置及び方法、復号化装置及び方法、並びに記録媒体 |
JP3960932B2 (ja) * | 2002-03-08 | 2007-08-15 | 日本電信電話株式会社 | ディジタル信号符号化方法、復号化方法、符号化装置、復号化装置及びディジタル信号符号化プログラム、復号化プログラム |
US7359979B2 (en) * | 2002-09-30 | 2008-04-15 | Avaya Technology Corp. | Packet prioritization and associated bandwidth and buffer management techniques for audio over IP |
JP4065827B2 (ja) * | 2003-10-03 | 2008-03-26 | 日本電信電話株式会社 | 音声信号パケット通信方法、音声信号パケット送信方法、受信方法、これらの装置、そのプログラムおよび記録媒体 |
US7945447B2 (en) * | 2004-12-27 | 2011-05-17 | Panasonic Corporation | Sound coding device and sound coding method |
WO2007052612A1 (ja) | 2005-10-31 | 2007-05-10 | Matsushita Electric Industrial Co., Ltd. | ステレオ符号化装置およびステレオ信号予測方法 |
US20100241434A1 (en) * | 2007-02-20 | 2010-09-23 | Kojiro Ono | Multi-channel decoding device, multi-channel decoding method, program, and semiconductor integrated circuit |
WO2009129822A1 (en) * | 2008-04-22 | 2009-10-29 | Nokia Corporation | Efficient encoding and decoding for multi-channel signals |
EP3742441B1 (en) * | 2018-01-17 | 2023-04-12 | Nippon Telegraph And Telephone Corporation | Encoding device, decoding device, fricative determination device, and method and program thereof |
US11430464B2 (en) * | 2018-01-17 | 2022-08-30 | Nippon Telegraph And Telephone Corporation | Decoding apparatus, encoding apparatus, and methods and programs therefor |
WO2020250369A1 (ja) * | 2019-06-13 | 2020-12-17 | 日本電信電話株式会社 | 音信号受信復号方法、音信号復号方法、音信号受信側装置、復号装置、プログラム及び記録媒体 |
WO2020250371A1 (ja) * | 2019-06-13 | 2020-12-17 | 日本電信電話株式会社 | 音信号符号化送信方法、音信号符号化方法、音信号送信側装置、符号化装置、プログラム及び記録媒体 |
-
2019
- 2019-06-13 WO PCT/JP2019/023423 patent/WO2020250369A1/ja active Application Filing
- 2019-12-27 JP JP2021525900A patent/JP7192986B2/ja active Active
- 2019-12-27 CN CN201980097329.5A patent/CN113966531A/zh active Pending
- 2019-12-27 WO PCT/JP2019/051595 patent/WO2020250470A1/ja active Application Filing
- 2019-12-27 EP EP19932976.4A patent/EP3985663B1/en active Active
- 2019-12-27 US US17/617,856 patent/US12131743B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US12131743B2 (en) | 2024-10-29 |
JPWO2020250470A1 (zh) | 2020-12-17 |
WO2020250470A1 (ja) | 2020-12-17 |
EP3985663B1 (en) | 2024-05-15 |
EP3985663A4 (en) | 2023-06-07 |
WO2020250369A1 (ja) | 2020-12-17 |
JP7192986B2 (ja) | 2022-12-20 |
EP3985663A1 (en) | 2022-04-20 |
US20220238123A1 (en) | 2022-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113966531A (zh) | 声音信号接收解码方法、声音信号解码方法、声音信号接收侧装置、解码装置、程序以及记录介质 | |
JP7205626B2 (ja) | 音信号受信復号方法、音信号符号化送信方法、音信号復号方法、音信号符号化方法、音信号受信側装置、音信号送信側装置、復号装置、符号化装置、プログラム及び記録媒体 | |
JP7192987B2 (ja) | 音信号受信復号方法、音信号復号方法、音信号受信側装置、復号装置、プログラム及び記録媒体 | |
CN113302687B (zh) | 多点控制方法、多点电话连接系统及记录介质 | |
CN113366568B (zh) | 多点控制方法、系统及记录介质 | |
CN113302686B (zh) | 多点控制方法、多点电话连接系统及记录介质 | |
CN113302685B (zh) | 编码解码方法及装置、解码方法及装置、计算机程序产品 | |
CN113330514B (zh) | 多点控制方法、多点电话连接系统及记录介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |