CN101802908A - 通信终端装置、通信系统和通信方法 - Google Patents
通信终端装置、通信系统和通信方法 Download PDFInfo
- Publication number
- CN101802908A CN101802908A CN200880107399A CN200880107399A CN101802908A CN 101802908 A CN101802908 A CN 101802908A CN 200880107399 A CN200880107399 A CN 200880107399A CN 200880107399 A CN200880107399 A CN 200880107399A CN 101802908 A CN101802908 A CN 101802908A
- Authority
- CN
- China
- Prior art keywords
- encoding
- decoding
- unit
- decoding speech
- speech software
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004891 communication Methods 0.000 title claims abstract description 170
- 238000000034 method Methods 0.000 title description 31
- 238000003860 storage Methods 0.000 claims abstract description 121
- 230000035945 sensitivity Effects 0.000 claims description 137
- 238000012360 testing method Methods 0.000 claims description 23
- 238000013500 data storage Methods 0.000 claims description 18
- 230000033228 biological regulation Effects 0.000 claims description 2
- 238000012937 correction Methods 0.000 abstract description 14
- 238000001514 detection method Methods 0.000 abstract description 11
- 238000012545 processing Methods 0.000 description 76
- 239000013598 vector Substances 0.000 description 37
- 230000005540 biological transmission Effects 0.000 description 35
- 230000009471 action Effects 0.000 description 30
- 238000013139 quantization Methods 0.000 description 21
- 230000003044 adaptive effect Effects 0.000 description 12
- 210000000352 storage cell Anatomy 0.000 description 12
- 230000006870 function Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 10
- 230000000694 effects Effects 0.000 description 9
- 241001269238 Data Species 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 239000012467 final product Substances 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 230000005284 excitation Effects 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 239000000654 additive Substances 0.000 description 3
- 230000000996 additive effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000014759 maintenance of location Effects 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 241000396377 Tranes Species 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 238000005086 pumping Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/60—Substation equipment, e.g. for use by subscribers including speech amplifiers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/72406—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality by software upgrading or downloading
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Computer Networks & Wireless Communication (AREA)
- Mobile Radio Communication Systems (AREA)
- Telephone Function (AREA)
Abstract
公开了直接使用现有的无线通信系统/基础结构、信道编解码、纠错/差错检测功能,并且使用下载下来的语音编解码进行语音编码的通信终端装置。在该通信终端装置中,在判定单元(103)判定为从基站装置(160)的播发用编解码存储单元(161)下载下来的语音编解码软件的比特数为终端固有的语音编解码软件的对应的编码参数的比特数以下时,编解码控制单元(104)使用从播发用编解码存储单元(161)下载下来的语音编解码软件对从话筒(105)输入的语音进行编码。
Description
技术领域
本发明涉及进行语音的编码/解码的通信终端装置、通信系统和通信方法。
背景技术
在移动通信中,为了有效利用传输频带,必须对语音或图像的数字信息进行压缩编码。其中,对于广泛利用于移动电话中的语音编解码(codec)(编码/解码)技术的期待较大,对于其音质优于压缩率较高的以往的高效率编码的编码技术的需求进一步增强。而且,为了让公众使用,必须进行标准化,世界各国的各家公司正在积极地进行研究开发。
随着以将语音的发声机构模型化并巧妙地应用了矢量量化的“CELP”(Code Excited Linear Prediction,码激励线性预测)为基础的语音编码算法被改进,提高了语音编解码的质量。作为国际标准方式,还采用了比特率更少且更高质量的编解码。并且,能够推测通过今后的技术开发,开发出更高性能的CELP。
另外,语音通信需要使用相互对应的编码器和解码器,用于第二代、第三代、PHS(Personal Handyphone System,个人手持电话系统)等移动电话的语音编解码已被标准化。
在这样的状况下,开始出现以下用例:发售最初未搭载语音通话功能的无线终端装置,而将语音编解码作为软电话(softphone)。在此之前,在因特网通话服务中也存在提供通过网络的语音通信服务的情况,也发售与之对应的无线终端装置。另外,近年来,由公共研究机关或通信运营商研究开发出下载通信所需的软件以构成无线设备的技术,即“软件无线”。通过该技术,也可以下载作为软件技术的语音编解码(语音的压缩编码/解码)。在专利文献1中,公开了下载语音编解码进行通信的例子。
专利文献1:特开第2003-51867号公报
发明内容
发明需要解决的问题
然而,一旦移动电话等通信终端装置中搭载并固定了编解码,则无法进一步提高语音编码/解码的性能。因此,在下一代移动电话系统/基础结构(infrastructure)建成之前,用户无法享受更高质量的通话。
而且,对现有的第二代、第三代、PHS等移动电话,通信系统、传输路径编码、语音编解码已被标准化,且规格已被确定,因此如果想要适用如上所述的软件无线技术,就需要将现有的无线通信系统/基础结构、信道编解码、语音编解码等全部替换。因此,为了在现有系统中适用下载型的语音编解码,只能在已搭载了语音编解码的通信终端装置中使用附属于能够利用广泛普及的网络连接进行语音通话的系统的语音编解码。
而且,在对语音编码数据进行的纠错/差错检测处理中,对相同编解码的各参数,根据各个比特差错灵敏度来进行比特附加等。这样的纠错/差错检测处理与语音编解码相关联,且被设计为利用有限的比特数获得最大限度的性能。因此,如果因为在现有系统中适用下载型的语音编解码而导致编解码发生改变,则有可能无法适用现有的纠错/差错检测处理。
本发明的目的在于,提供能够直接使用现有的通信系统/基础结构、信道编解码、纠错/差错检测功能,并且能够使用下载下来的语音编解码进行语音编码的通信终端装置、通信系统和通信方法。
解决问题的方案
本发明的通信终端装置所采用的结构,包括:判定单元,判定外部装置中存储的语音编解码软件是否适合于下载;以及编解码控制单元,在所述判定单元判定为所述语音编解码软件适合于下载时,使用从所述外部装置下载下来的语音编解码软件进行语音的编码和解码。
本发明的通信系统所采用的结构,包括通信终端装置和基站装置,所述基站装置包括:存储单元,存储语音编解码软件,所述通信终端装置包括:判定单元,判定所述语音编解码软件是否适合于下载;以及编解码控制单元,在所述判定单元判定为所述语音编解码软件适合于下载时,使用从所述存储单元下载下来的语音编解码软件进行语音的编码和解码。
本发明的通信方法包括以下的步骤:判定外部装置中存储的语音编解码软件是否适合于下载;以及在判定为所述语音编解码软件适合于下载时,使用从所述外部装置下载下来的语音编解码软件进行语音的编码和解码。
发明的效果
根据本发明,能够直接使用现有的通信系统/基础结构、信道编解码、纠错/差错检测功能,并且能够使用下载下来的语音编解码进行语音编码。
附图说明
图1是表示本发明实施方式1的无线通信系统的主要结构的方框图。
图2是用于说明基于CELP的G.729方式的编码信息的比特分配(bitallocation)的图。
图3是表示在本发明实施方式1的播发用编解码存储单元中保持语音编解码软件和比特分配信息的存储器的图。
图4是表示本发明实施方式1的另一个形态的无线通信系统的主要结构的方框图。
图5是表示本发明实施方式2的具备固有编解码存储单元的无线通信系统的主要结构的方框图。
图6是表示本发明实施方式3的无线通信系统的主要结构的方框图。
图7是表示本发明实施方式3的另一个形态的无线通信系统的主要结构的方框图。
图8是表示本发明实施方式4的无线通信系统的主要结构的方框图。
图9是表示本发明实施方式4的判定单元的内部结构的方框图。
图10是表示本发明实施方式4的一例失真计算单元的失真计算结果的图。
图11是表示本发明实施方式4的一例灵敏度数据对照单元中的、考虑了余量(margin)的参考灵敏度数据与灵敏度数据的对照状态的图。
图12是用于说明本发明实施方式4的灵敏度数据对照单元中的、利用了排序(sorting)的灵敏度数据的对照的图。
图13是举例表示本发明实施方式4的使编解码控制单元进行动作且使该编解码控制单元动作的编码器和解码器中的比特替换处理的图。
图14是表示本发明实施方式4的另一个形态的无线通信系统的主要结构的方框图。
图15是用于说明G.729方式的语音编解码中的LSP量化方法的图。
图16是用于说明本发明实施方式5的语音编解码软件中的LSP量化方法的图。
图17是表示G.729方式的语音编解码的固定码本的脉冲位置表的图。
图18是表示本发明实施方式5的语音编解码软件的固定码本的脉冲位置表的图。
图19是表示本发明实施方式6的判定单元的内部结构的方框图。
具体实施方式
以下,参照附图详细地说明本发明的实施方式。另外,在以下的实施方式中,作为通信系统/通信终端装置,举例说明无线通信系统/无线终端装置,但本发明并不限于此,也可以是有线通信系统/有线通信终端装置,还可以是有线和无线混合存在的通信系统/通信终端装置。因此,在以下的说明中,省略记载通常用于无线发送和接收而具备的无线相关部分(天线、无线控制单元等)。
(实施方式1)
图1是表示本发明实施方式1的无线通信系统100的主要结构的方框图。在图1中,无线通信系统100包括:呼叫侧的无线终端装置140、被叫侧的无线终端装置150、以及基站装置160。无线终端装置140包括:按键操作单元101、AV(Audio Visual,视听)控制/输出单元102、判定单元103、编解码控制单元104、话筒105、输入输出处理单元106、扬声器107以及传输路径编码/解码单元108。无线终端装置150包括:按键操作单元151、AV控制/输出单元152、判定单元153、编解码控制单元154、话筒155、输出输入处理单元156、扬声器157以及传输路径编码/解码单元158。基站装置160包括播发用编解码存储单元161。
通常,无线终端装置140的各个结构要素(例如判定单元103)与无线终端装置150的对应的各个结构要素(例如判定单元153)具有相同的结构,并且也具有同样的可能的动作。因此,在以下的说明中,使用无线终端装置140的各个结构要素说明呼叫侧所需的结构和动作,使用无线终端装置150的各个结构要素说明被叫侧所需的结构和动作。
呼叫侧的无线终端装置140中的按键操作单元101将由用户通过按键输入的通信对方(被叫侧)的无线终端装置150的电话号码、或者语音编解码软件的种类等转换为电信号,并输出到AV控制/输出单元102。
AV控制/输出单元102显示从按键操作单元101输入的电话号码、或语音编解码软件的种类等,并根据需要发送到基站装置160。另外,AV控制/输出单元102显示判定单元103的判定结果、或经由基站装置160发来的、通信对方的无线终端装置150的判定单元153的判定结果等。
被叫侧的无线终端装置150中的按键操作单元151在来自通信对方(呼叫侧)的无线终端装置140的呼叫状态等时,将用户的按键操作转换为电信号并输出到AV控制/输出单元152。
AV控制/输出单元152对来自无线终端装置140的呼叫或信息的接收,显示电话号码或接收信息,或者输出来电铃声(ring alert)。而且,AV控制/输出单元152在利用按键操作单元151进行来电确认的按键操作时,与此对应地显示所需信息,并且将通信开通等通知给基站装置160。
判定单元103和判定单元153基于被分别输入的比特分配信息,判定是否能够将与被分别输入的识别序号对应的语音编解码软件,分别存储到编解码控制单元104和编解码控制单元154中。然后,判定单元103和判定单元153将判定结果分别输出到AV控制/输出单元102和AV控制/输出单元152,并且也输出到基站装置160。如果判定结果为能够分别存储,则分别从播发用编解码存储单元161下载该语音编解码软件,并分别存储到编解码存储单元104和编解码存储单元154中。另外,判定单元103和判定单元153中的判定处理的细节后述。
呼叫侧的无线终端装置140的编解码控制单元104存储经由判定单元103从基站装置160下载下来的语音编解码软件。然后,编解码控制单元104对从输入输出处理单元106输入的数字语音信号,使用所存储的语音编解码软件进行编码处理,并将获得的语音编码数据输出到传输路径编码/解码单元108。而且,编解码控制单元104对从传输路径编码/解码单元108输入的语音编码数据,使用所存储的语音编解码软件进行解码处理,并将获得的语音解码信息输出到输入输出处理单元106。被叫侧的无线终端装置150的编解码控制单元154也在无线终端装置150中进行同样的动作。
话筒105和话筒155将由用户所输入的语音转换为电信号,并分别输入到输入输出处理单元106和输入输出处理单元156。
呼叫侧的无线终端装置140的输入输出处理单元106对从话筒105输入的语音信号进行滤波、A/D转换,并将获得的数字语音信号输出到编解码控制单元104。而且,输入输出处理单元106对从编解码控制单元104输入的语音解码信息进行D/A转换、滤波处理,并将获得的解码语音信号经由扬声器107而输出。被叫侧的无线终端装置150的输入输出处理单元156也在无线终端装置150中进行同样的动作。
扬声器107和扬声器157将分别从输入输出处理单元106和输入输出处理单元156输入的解码语音信号转换为语音,并输出到外部。
呼叫侧的无线终端装置140的传输路径编码/解码单元108对从编解码控制单元104输入的语音编码数据,进行包括纠错用比特附加、交织等的比特差错处理以及信道编码处理,并将获得的传输信息经由具有中继器功能的基站装置160发送到通信对方的无线终端装置150。而且,传输路径编码/解码单元108对经由基站装置160传输而来的传输信息,进行信道解码以及解交织、差错检测、纠错等比特差错处理,并将获得的语音编码数据输出到编解码控制单元104。这里,传输路径编码/解码单元108中的差错检测处理和纠错处理根据各个编码信息的比特灵敏度、信息的重要性、总比特数而预先设计。被叫侧的无线终端装置150的传输路径编码/解码单元158也在无线终端装置150中进行同样的动作。
以下,以无线终端装置140呼叫无线终端装置150的情况为例,说明在无线通信系统100中的直至建立通话线路为止的动作。
首先,在无线终端装置140中,按键操作单元101将由用户所输入的通信对方的无线终端装置150的电话号码转换为电信号,并输出到AV控制/输出单元102(S1)。
接着,AV控制/输出单元102显示从按键操作单元101输入的电话号码,再将其发送到基站装置160(S2)。
接着,基站装置160对无线终端装置150的AV控制/输出单元152通知无线终端装置140的电话号码(S3)。
接着,AV控制/输出单元152通过显示由基站装置160通知的电话号码,还输出来电铃声,提醒被叫的用户的注意。
接着,通过从AV控制/输出单元152输出的来电铃声或电话号码的显示而确认了来电的用户操作按键操作单元151,从而将通信的开通经由AV控制/输出单元152通知给基站装置160(S4)。
接着,基站装置160接收来自按键操作单元151的通信开通的通知,将与已存储在播发用编解码存储单元161中的多个语音编解码软件中的一个对应的比特分配信息,输出到无线终端装置140的判定单元103(S5)。这里,播发用编解码存储单元161也可以基于从无线终端装置140通过按键操作单元101指示的编解码的种类,选择所存储的语音编解码软件中的一个。另外,比特分配信息的细节后述。
接着,判定单元103基于从播发用编解码存储单元161输入的比特分配信息,判定是否能够将具有从播发用编解码存储单元161输入的比特分配的语音编解码软件存储到编解码控制单元104中。
判定单元103判定为无法将从播发用编解码存储单元161输入的语音编解码软件存储到编解码控制单元104中时,选择其他的语音编解码软件的种类,并将该软件的识别序号通知给基站装置160(S6)。基站装置160将与由判定单元103所通知的识别序号对应的语音编解码的比特分配信息,从播发用编解码存储单元161输出到判定单元103(S5)。或者,当再无其他选择项时,判定单元103将该意旨的消息输出到AV控制/输出单元102,并且也经由基站装置160输出到AV控制/输出单元152(S7)。此时,通信不成立,任务(task)结束。
另一方面,判定单元103判定为能够将从播发用编解码存储单元161输入的语音编解码软件存储到编解码控制单元104中时,对播发用编解码存储单元161,选择具有该比特分配的语音编解码软件的识别序号并输出(S8a)。而且,判定单元103从播发用编解码存储单元161下载与该识别序号对应的语音编解码软件,并存储到编解码控制单元104中(S9)。同时,判定单元103将所存储的语音编解码软件的比特分配信息和该软件的识别序号作为“可存储”的判定结果而经由基站装置160通知给判定单元153(S8b)。
判定单元153基于所通知的比特分配信息,判定是否能够将与所通知的识别序号对应的语音编解码软件存储到编解码控制单元154中。
判定单元153判定为“不可存储”时,判定单元153经由基站装置160将判定结果通知给判定单元103(S10)。从判定单元153接收到“不可存储”的判定结果的判定单元103选择其他的语音编解码,并将该软件的识别序号通知给基站装置160(S6)。以后进行与上述同样的动作。
另一方面,判定单元153判定为“可存储”时,无线终端装置150的判定单元153向播发用编解码存储单元161输出该软件的识别序号(S11a),从播发用编解码存储单元161下载与该识别序号对应的语音编解码软件,并经由判定单元153存储到编解码控制单元154中(S12)。与此同时,判定单元153将“通信成立”的判定结果输出到AV控制/输出单元152,并且经由基站装置160输出到AV控制/输出单元102(S11b)。
另外,在无线终端装置140中,将语音编解码软件下载到编解码控制单元104中的定时,也可以是在无线终端装置150的判定单元153判定为可存储之后的、例如AV控制/输出单元102接收“通信成立”的判定结果的时刻。
当通过以上的动作,编解码控制单元104和编解码控制单元154完成语音编解码软件的下载时,在无线终端装置140与无线终端装置150之间建立通话线路。以后,无线终端装置140与无线终端装置150通过话筒105、话筒155、扬声器107、扬声器157、编解码控制单元104、编解码控制单元154、传输路径编码/解码单元108、传输路径编码/解码单元158以及基站装置160的动作进行通话。
以下,说明语音编解码软件的比特分配信息的细节。
语音编解码软件的比特分配信息对应于语音编解码,这里,作为语音编解码,举例说明经ITU-T(International Telecommunication UnionTelecommunication Standardization Sector,国际电信联盟电信标准化部门)、ARIB(Association of Radio Industries and Businesses,日本无线工业及商贸联合会)或ETSI(European Telecommunications Standards Institute,欧洲电信标准协会)等标准化团体标准化后的语音编解码。具体而言,举例说明日本的移动电话或IP(Internet Protocol,因特网协议)电话中使用的ITU-T标准的G.729方式。ITU-T标准的G.729方式以CELP编码为基础。
CELP方式的语音编解码将语音信号划分为10~20ms左右的一定时间间隔的帧,进行线性预测分析,求线性预测系数(LPC:Linear PredictionCoefficient)和线性预测残差,并对线性预测系数和线性预测残差矢量分别单独地进行编码。在CELP方式的语音编解码中,线性预测残差使用存储有以前生成的驱动激励信号的自适应码本(adaptive codebook)以及存储有特定数的固定形状的矢量(固定码矢量)的固定码本(fixed codebook)进行编码/解码。其中,自适应码本是用于表达线性预测残差矢量所具有的周期性分量,固定码本是用于表达线性预测残差矢量中自适应码本无法表达的非周期性分量。
图2是用于说明基于CELP的G.729方式的编码信息的比特分配的图。在基于CELP的G.729方式中,与帧长度10ms(80样本)对应的编码信息由80比特构成(比特率:8kbit/sec)。其中,如图2所示,使用18比特编码LPC的代用参数即LSP(Line Spectrum Pair:线谱对)。利用将1帧分为两个所得的子帧来编码自适应码本、固定码本和增益各自的信息。例如,对自适应码本,在第一子帧中以9比特进行全搜索(full search),在第二子帧中以5比特对与第一子帧的延迟的差分(Δ延迟)进行编码。固定码本由代数激励构成,一个子帧的固定码本矢量用四个脉冲来表达。对增益,在两个子帧中各使用7比特进行编码。
图2所示的表示编码信息的比特分配的比特分配信息为{18,9,5,17,17,7,7}。播发用编解码存储单元161除了保持语音编解码软件主体以外,还保持这样的比特分配信息。
图3是表示在播发用编解码存储单元161中保持语音编解码软件(主体)和比特分配信息的存储器的图。
判定单元103和判定单元153在判定处理中不读入播发用编解码存储单元161的语音编解码软件主体,而是只基于数据量更少的比特分配信息,判定是否能够将语音编解码软件存储到编解码控制单元104和编解码控制单元154中。由此,节约存储器并降低处理量。
以下,说明判定单元103和判定单元153的判定处理的细节。
判定单元103和判定单元153使用下述的两个判定条件,判定是否能够将来自播发用编解码存储单元161的语音编解码软件存储到编解码控制单元104和编解码控制单元154中并使其发挥功能。
第一条件是:编码器输出的总比特数不超过无线通信系统100能够传输的信息比特数。第二条件是:能够直接使用无线通信系统100中的包括纠错用比特附加、交织等的比特差错处理。具体而言,第二条件是:播发用编解码存储单元161的编码器输出的每个参数的比特数,不超过与无线通信系统100中的比特差错处理对应的标准编解码输出的每个参数的比特数。判定单元103和判定单元153基于从播发用编解码存储单元161输入的比特分配信息,进行上述的两个条件的判定。
具体而言,判定单元103和判定单元153对编解码控制单元104和编解码控制单元154可存储的语音编解码软件的比特分配信息、以及从基站装置160的播发用编解码存储单元161输入的比特分配信息,进行每个参数的比较和参数的相加值的比较。这里,如图2所示,将编解码控制单元104和编解码控制单元154可存储的语音编解码软件的比特分配信息为B1={18,9,5,17,17,7,7},从基站装置160的播发用编解码存储单元161输入的比特分配信息为B2={18,9,5,16,16,7,7}的情况取为例子。此时,构成B2的各参数的相加值(78)在构成B 1的各参数的相加值(80)以下,因此判定单元103和判定单元153判定为满足第一条件。另外,例如,当与无线通信系统100中的比特差错处理对应的标准编解码的输出比特数也同样为B1={18,9,5,17,17,7,7}时,构成B2的各参数在构成B1的各参数以下,因此判定单元103和判定单元153判定为也满足第二条件。这样,判定单元103和判定单元153在同时满足第一条件和第二条件时,判定为能够将存储在播发用编解码存储单元161中的语音编解码软件存储到编解码控制单元104和编解码控制单元154中并使其发挥功能。
这样,根据本实施方式,无线终端装置并不使用固定的语音编解码,而从基站装置下载语音编解码软件来使用。因此,不重新购入搭载有经过下一代语音通信的标准化的语音编解码的无线终端装置,只要将基站装置中存储的语音编解码软件更新为性能更好的软件,无线终端装置就能够下载性能更好的语音编解码来使用,从而能够享受质量更高的语音通信。
另外,根据本实施方式,无线终端装置并不使用固定的语音编解码,而从基站装置下载语音编解码软件来使用。因此,不将无线通信系统/基础结构、信道编解码、语音编解码等的全部替换,只要将基站装置中存储的语音编解码软件更新为性能更好的软件,无线终端装置就能够下载性能更好的语音编解码来使用,从而能够享受质量更高的语音通信。
另外,根据本实施方式,无线终端装置可使用未经标准化的语音编解码,并从基站装置下载语音编解码软件来使用,因此只要基站装置中存储的语音编解码软件的变化(variation)足够,即使编码信息在中途被观察,也不容易被窃听,从而能够提高语音通信的安全性。
另外,根据本实施方式,通信运营商可以制造销售未搭载语音编解码的通信终端装置,用户能够廉价地购买通信终端装置,从而能够提高语音通信服务的利用自由度。
另外,在上述中,说明了以在呼叫侧的无线终端装置140的判定单元103进行判定处理之后,被叫侧的无线终端装置150的判定单元153进行判定处理的方式,在时间上串行地交替进行无线终端装置140的判定处理与无线终端装置150的判定处理的结构和动作,但也可以在时间上并行地进行无线终端装置140的判定处理和无线终端装置150的判定处理。以下,说明本实施方式中的另一形态的结构和动作的一例。
图4是表示能够在时间上并行地进行无线终端装置140的判定处理和无线终端装置150的判定处理的无线通信系统100A的主要结构的方框图。另外,无线通信系统100A具有与图1所示的无线通信系统100同样的基本结构,对相同结构要素附加相同标号,并省略其说明。
无线通信系统100A与无线通信系统100的不同之处在于,在基站装置160A内还具备判定单元162。因此,与无线通信系统100的基站装置160、播发用编解码存储单元161的结构和动作不同,为了对其进行区别,分别附加不同的标号。
首先,从在呼叫侧的无线终端装置140中,电信号通过用户的按键操作单元101被输出到AV控制/输出单元102(S1),直到在被叫侧的无线通信终端装置150中,通信的开通从按键操作单元151经由AV控制/输出单元152通知给基站装置160A(S4)为止的动作,与上述图1中的说明相同。
基站装置160A在接收到通信开通的通知时,将与已存储在播发用编解码存储单元161A中的多个语音编解码软件中的一个对应的比特分配信息,分别输出到判定单元103和判定单元153(S5、S13)。
接着,判定单元103和判定单元153各自进行判定处理。判定处理的细节与上述图1的说明相同,因此省略。接着,在各个判定单元中进行了判定的判定结果(S6、S7、S8a、S14、S15、S11a)被输入到基站装置160A内的判定单元162。另外,S14、S15在无线终端装置150中与无线终端装置140中的S6、S7分别对应。而且,S6和S14只要是单纯地显示“不可存储”的判定结果的信息即可。
基站装置160A的判定单元162对从判定单元103输入的判定结果和从判定单元153输入的判定结果进行比较,当至少一方的判定结果为“不可存储”时,选择其他的语音编解码软件,并将该软件的识别序号通知给播发用编解码存储单元161A(S16)。播发用编解码存储单元161A将与该识别序号对应的语音编解码软件的比特分配信息,分别输出到判定单元103和判定单元153(S5、S13)。以后,反复进行与上述同样的动作,直到双方的判定结果都为“可存储”为止。
基站装置160A的判定单元162在从判定单元103输入的判定结果以及从判定单元153输入的判定结果的双方都为“可存储”时(S8a、S11a),将该软件的识别序号通知给播发用编解码存储单元161A(S51)。播发用编解码存储单元161A将与该识别序号对应的语音编解码软件输出到判定单元103和判定单元153的双方(S9、S12),判定单元103和判定单元153将该软件分别输出到编解码控制单元104和编解码控制单元154(S9、S12)。而且,当双方的判定结果都为“可存储”时,判定单元162进一步将“通信成立”的判定结果通知给AV控制/输出单元102和AV控制/输出单元152双方(S18、S19)。
如上所述,也可以在时间上并行地进行呼叫侧的无线终端装置140的判定处理以及被叫侧的无线终端装置150的判定处理,其效果与在时间上串行地进行判定处理的情况相同。
(实施方式2)
在实施方式1中,说明了每当在无线终端装置之间进行语音通信时,从基站装置下载语音编解码软件来使用的情况,但本发明并不限定于此,呼叫侧的无线终端装置也可以将从基站装置下载下来的语音编解码软件保存到后述的固有编解码存储单元中,以用于本次之后的通话。以下说明其具体例。
图5是表示无线终端装置具备固有编解码存储单元的无线通信系统120的主要结构的方框图。在图5中,为了表示图1中的无线终端装置140、AV控制/输出单元102、判定单元103、编解码控制单元104、无线终端装置150、判定单元153和编解码控制单元154在结构上与无线终端装置240、AV控制/输出单元102A、判定单元103A、编解码控制单元104A、无线终端装置250、判定单元153A和编解码控制单元154A的不同,附加不同的标号。另外,无线通信系统120具有与图1所示的无线通信系统100同样的基本结构,对相同结构要素附加相同标号,并省略其说明。
呼叫侧的无线终端装置240还具备固有编解码存储单元201,在该固有编解码存储单元201中,存储有上次通话中使用的语音编解码软件(S20-1)。在被叫侧的无线终端装置250中,也同样地还具备存储有上次通话中使用的语音编解码(S20-2)的固有编解码存储单元251。
在这样的无线通信系统120中,呼叫侧的无线终端装置240的判定单元103A将上次通话中使用的语音编解码软件比其他种类的语音编解码软件优先通知给基站装置160,基站装置160能够使被叫的无线终端装置250下载相同种类的语音编解码。以下说明其结构和动作。
首先,从在呼叫侧的无线终端装置240中,电信号通过用户的按键操作单元101被输出到AV控制/输出单元102A(S1),直到在被叫侧的无线通信终端装置250中,通信的开通从按键操作单元151经由AV控制/输出单元152通知给基站装置160(S4)为止的动作,与图1中的说明相同。
基站装置160在接收到通信开通的通知时,将与已存储在播发用编解码存储单元161中的多个语音编解码软件中的一个对应的比特分配信息分别输出到判定单元103A(S5)。
判定单元103A在从播发用编解码存储单元161接收到比特分配信息时,对固有编解码存储单元201输出用于取得所存储的语音编解码软件的指示(S21a),与此相应地,固有编解码存储单元201将所存储的语音编解码软件经由判定单元103A存储到编解码控制单元104A中(S22)。与此同时,判定单元103A将固有编解码存储单元201中存储的语音编解码软件的识别序号以及与此对应的软件的比特分配信息,经由基站装置160通知给判定单元153A(S21b),作为固有编解码信息。
当被叫侧的无线终端装置250具有固有编解码存储单元251时,判定单元153A基于所通知的固有编解码信息中包含的比特分配信息,判定是否能够将与所通知的固有编解码信息中包含的识别序号对应的语音编解码软件存储到编解码控制单元154A中。
判定方法与实施方式1中记载的方法相同。当判定为能够将指定的语音编解码软件存储到编解码控制单元154A中时,判定单元153A将用于确认是否已将指定的语音编解码软件存储到固有编解码存储单元251中的信号发送到固有编解码存储单元251(S23),并从固有编解码存储单元251接收与此相应的响应信号(S24)。当响应信号的内容包含指定的软件时,判定单元153A对固有编解码存储单元251输出取得所存储的语音编解码软件的指示(S25a),与此相应地,固有编解码存储单元251将所存储的语音编解码软件经由判定单元153A存储到编解码控制单元154A中(S26)。与此同时,判定单元153将“通信成立”的判定结果输出到AV控制/输出单元153A,并且经由基站装置160输出到AV控制/输出单元102A(S25b)。也就是说,当固有编解码存储单元201和固有编解码存储单元251中存储有相同种类的语音编解码时,任何无线终端装置都无需下载语音编解码。
另一方面,当来自固有编解码存储单元251的响应信号(S24)的内容不包含指定软件时,判定单元153A向播发用编解码存储单元161发送指定软件的识别序号(S27)。当播发用编解码存储单元161中存在与该识别序号对应的语音编解码软件时,判定单元153A从播发用编解码存储单元161下载该语音编解码软件,并经由判定单元153A存储到编解码控制单元154A中。以后的处理与上述相同。另一方面,如果在播发用编解码存储单元161中不存在与该识别序号对应的软件时,则基站装置160将该识别序号转发到判定单元103A(S27),判定单元103A在接收到该识别序号时,从固有编解码存储单元201取出语音编解码软件(S22),并经由基站装置160发送到判定单元153A(S22:虚线)。判定单元153A将接收到的软件存储到编解码控制单元154A中。以后的处理与上述相同。
另外,当判定单元153A的判定结果为“不可存储”时,则不可使用固有编解码存储单元201中存储的语音编解码软件,判定单元153A将“不可存储”的判定结果经由基站装置160通知给判定单元103A,以后与实施方式1的动作相同。
另外,在上述中,说明了被叫侧的无线终端装置具有固有编解码存储单元的情况,但即使在被叫侧的无线终端装置不具有固有编解码存储单元的情况下,如果在判定单元中判定为能够将语音编解码软件存储到编解码控制单元中,则也能够从基站装置160的播发用编解码存储单元161或者呼叫侧的无线终端装置240的固有编解码存储单元201下载必要的语音编解码软件并存储到编解码控制单元中来使用。
根据该无线通信系统,无线终端装置例如可以只在需要进一步提高通话质量的情况下,从基站装置等下载性能更好的语音编解码来使用。由此,能够降低每次通话所需的处理量。
另外,本实施方式中的无线终端装置,还可以由用户经由按键操作单元101来编辑固有编解码存储单元201中存储的语音编解码软件的内容。例如,由用户经由按键操作单元101指示AV控制/输出单元102A编辑开始(S30),AV控制/输出单元102A取出固有编解码存储单元201中存储的语音编解码软件(S31、S32),通过用户的按键操作来编辑软件(S30),并将编辑后的语音编解码软件适当地存储到固有编解码存储单元201中(S33)。这样,在某一个无线终端装置中被编辑好的语音编解码软件在编辑好的时刻基本上不存在于其他终端或基站中,因此在使用时需要首先发送到通信对方的无线终端装置。在通信对方的无线终端装置中,判定是否能够存储被发送来的编辑后的语音编解码软件,如果获得“可存储”的判定结果,则能够使用。
如果这样构成,则可以对语音编解码软件根据需要进行提高质量的改进来使用。
(实施方式3)
图6是表示本发明实施方式3的无线通信系统200的主要结构的方框图。另外,无线通信系统200具有与实施方式1所示的无线通信系统100(参照图1)同样的基本结构,对相同结构要素附加相同标号,并省略其说明。
无线通信系统200与无线通信系统100的不同之处在于,还具备编解码播发中心170。另外,无线通信系统200的基站装置260与无线通信系统100的基站装置160的不同之处在于,不具备播发用编解码存储单元161,为了显示该不同,附加不同的标号。
编解码播发中心170具备播发用编解码存储单元171。播发用编解码存储单元171存储多个附加有比特分配信息的语音编解码软件。编解码播发中心170经由基站装置260接收来自按键操作单元151的与通信开通有关的通知(S41),并将与播发用编解码存储单元171中存储的多个语音编解码软件中的一个对应的比特分配信息输出到判定单元103(S5′)。这里,播发用编解码存储单元171也可以基于从无线终端装置140通过按键操作单元101指示的编解码的种类,选择所存储的多个语音编解码软件中的一个。以后的处理与实施方式1相同。
这样,根据本实施方式,能够获得与实施方式1同样的效果。
另外,在上述中,说明了以在呼叫侧的无线终端装置140的判定单元103进行判定处理之后,被叫侧的无线终端装置150的判定单元153进行判定处理的方式,在时间上串行地交替进行无线终端装置140的判定处理和无线终端装置150的判定处理的结构和动作,但也可以在时间上并行地进行无线终端装置140的判定处理和无线终端装置150的判定处理。以下,说明本实施方式中的另一形态的结构和动作的一例。
图7是表示能够在时间上并行地进行无线终端装置140的判定处理和无线终端装置150的判定处理的无线通信系统200A的主要结构的方框图。另外,无线通信系统200A具有与图6所示的无线通信系统200同样的基本结构,对相同结构要素附加相同标号,并省略其说明。
无线通信系统200A与无线通信系统200的不同之处在于,在基站装置260A内具备判定单元172。因此,与无线通信系统200的基站装置260的结构和动作不同,为了区别这些不同,附加不同的标号。
首先,从在呼叫侧的无线终端装置140中,电信号通过用户的按键操作单元101被输出到AV控制/输出单元102(S1),直到在被叫侧的无线通信终端装置150中,通信的开通从按键操作单元151经由AV控制/输出单元152通知给基站装置260A(S4)为止的动作,与图1中的说明相同。
基站装置260A在接收到通信开通的通知时,指示编解码播发中心170将与播发用编解码存储单元171中存储的多个语音编解码软件中的一个对应的比特分配信息,分别输出到判定单元103和判定单元153(S41)。收到指示的播发用编解码存储单元171将指定的软件的比特分配信息分别输出到判定单元103和判定单元153(S5′、S13′)。
接着,判定单元103和判定单元153各自进行判定处理。判定处理的细节与图1的说明相同,因此省略。接着,在各个判定单元中进行了判定的判定结果(S6、S7、S8a、S14、S15、S11a)被输入到基站装置260A内的判定单元172。另外,S14、S15在无线终端装置150中与无线终端装置140中的S6、S7分别对应。而且,S6与S14只要是单纯地显示“不可存储”的判定结果的信息即可。
基站装置260A的判定单元172对从判定单元103输入的判定结果和从判定单元153输入的判定结果进行比较,当至少一方的判定结果为“不可存储”时,选择其他的语音编解码软件,并将该软件的识别序号通知给播发用编解码存储单元171(S42)。播发用编解码存储单元171将与该识别序号对应的语音编解码软件的比特分配信息分别输出到判定单元103和判定单元153(S5′、S13′)。以后,反复进行与上述同样的动作,直到双方的判定结果都为“可存储”为止。
基站装置260A的判定单元172在从判定单元103输入的判定结果以及从判定单元153输入的判定结果的双方都为“可存储”时(S8a、S11a),将该软件的识别序号通知给播发用编解码存储单元171(S43)。播发用编解码存储单元171将与该识别序号对应的语音编解码软件输出到判定单元103和判定单元153的双方(S9′、S12′),判定单元103和判定单元153将该软件分别输出到编解码控制单元104和编解码控制单元154中(S9′、S12′)。而且,当双方的判定结果都为“可存储”时,判定单元172进一步将“通信成立”的判定结果通知给AV控制/输出单元102和AV控制/输出单元152双方(S18、S19)。
如上所述,也可以在时间上并行地进行呼叫侧的无线终端装置140的判定处理以及被叫侧的无线终端装置150的判定处理,其效果与在时间上串行地进行判定处理的情况相同。
另外,在本实施方式中,举例说明了从编解码播发中心下载语音编解码软件的情况,但本发明并不限定于此,也可以从因特网或外部装置下载语音编解码软件。
(实施方式4)
图8是表示本发明实施方式4的无线通信系统400的主要结构的方框图。另外,无线通信系统400具有与实施方式1所示的无线通信系统100(参照图1)同样的基本结构。无线通信系统400的判定单元403、判定单元453、编解码控制单元404、编解码控制单元454、基站装置160B和播发用编解码存储单元161B在结构和动作上与无线通信系统100的判定单元103、判定单元153、编解码控制单元104、编解码控制单元154、基站装置160和播发用编解码存储单元161不同,因此附加不同的标号。
在上述的实施方式1的图4中,说明了播发用编解码存储单元161A预先存储与语音编解码软件对应的比特分配信息,判定单元103和判定单元153基于从播发用编解码存储单元161A输入的比特分配信息进行判定处理的情况。在本发明的实施方式4中,说明播发用编解码存储单元161B不存储语音编解码软件的比特分配信息,判定单元403和判定单元453不输入比特分配信息而进行判定处理的情况。
作为不输入比特分配信息而进行判定处理的方法,各个判定单元试着启动编码器,并对所输出的编码数据的比特分配的明细进行分析,再基于分析出的比特分配的明细和编码数据的总比特数进行判定处理。在本实施方式中,作为比特分配的明细的分析方法,举例说明对照比特灵敏度并估计编码数据的比特分配的明细的方法。
判定单元403和判定单元453对预先准备的灵敏度测量用数据进行编码,并使所输出的编码数据中任意1比特反转。然后,判定单元403对任意1比特被反转的多个编码数据进行解码,由此求比特差错灵敏度的统计,并将所求得的统计的灵敏度与规定的参考用灵敏度数据进行对照。
图9是表示在判定单元403的内部结构中比特灵敏度的计算和对照所涉及的要素的方框图。另外,在判定单元453的内部结构中比特灵敏度的计算和对照所涉及的要素与判定单元403相同,因此省略说明。
在图9中,判定单元403具备语音编解码软件存储单元431、灵敏度测量用数据存储单元432、比特灵敏度测量单元433、参考灵敏度数据存储单元441、以及灵敏度数据对照单元442。其中,比特灵敏度测量单元433具备编码单元434、总数测量单元435、总数判定单元436、比特反转单元437、解码单元438、失真计算单元439、以及灵敏度数据计算单元440。
语音编解码软件存储单元431存储从播发用编解码存储单元161B输入的语音编解码软件(S9)。
灵敏度测量用数据存储单元432预先存储有灵敏度测量用的多个数据样本。
在比特灵敏度测量单元433中,编码单元434使用语音编解码软件存储单元431中存储的语音编解码软件,对灵敏度测量用数据存储单元432的数据样本进行编码,并将所获得的编码数据输出到总数测量单元435、比特反转单元437和解码单元438。
总数测量单元435对从编码单元434输入的编码数据的比特总数进行测量,并将测量结果作为总数信息输出到总数判定单元436。
总数判定单元436判定从总数测量单元435输入的总数信息是否在无线通信系统400可传输的信息量以下。当总数信息大于可传输的信息量时,总数判定单元436判定为不可将该语音编解码软件存储到编解码控制单元404中并使其发挥功能,输出判定结果(S6),判定单元403的处理结束。另一方面,当总数信息在可传输的信息量以下时,总数判定单元436将判定结果输出到比特反转单元437,判定单元403的处理继续。
比特反转单元437在从总数判定单元436输入判定结果时,使从编码单元434输入的编码数据的任意1比特反转,将包含比特差错的编码数据以相当于总数信息表示的数来生成。例如,当通过总数测量单元435的测量所得的总数信息为80时,比特反转单元437中获得的包含比特差错的编码数据为80种。
解码单元438对从编码单元434和比特反转单元437输入的所有编码数据(上述例中为81种)进行解码,并将所获得的所有解码数据输出到失真计算单元439。这里,将从编码单元434输入的、还未进行比特反转的编码数据称为参考编码数据,将参考编码数据的解码数据称为参考解码数据。
失真计算单元439计算从解码单元438输入的参考解码数据与参考解码数据以外的各个解码数据之间的失真,并输出到灵敏度数据计算单元440。失真计算单元439将根据下式(1)求出的SNR(Signal to Noise Ratio,信噪比)作为参考解码数据以外的各个解码数据的失真。
在式(1)中,Em表示使参考编码数据的第m比特反转时的解码数据与参考解码数据之间的失真,Ri表示参考解码数据,rm,i表示使参考编码数据的第m比特反转时的解码数据。
图10是表示一例失真计算单元439的失真计算结果的图。
在图10中,横轴表示参考编码数据的被反转了的比特的序号。纵轴表示根据式(1)求出的SNR、也就是使参考编码数据的各个比特反转时的解码数据与参考解码数据之间的失真。如图10所示,各个解码数据与参考解码数据之间的失真因参考编码数据的被反转的比特的序号而不同。将其称为比特灵敏度。比特灵敏度为对每个比特决定保护程度的参照,即为纠错、差错检测处理的设计的参照。
再次返回图9,在判定单元403中,编码单元434、总数测量单元435、总数判定单元436、比特反转单元437、解码单元438、失真计算单元439和灵敏度数据计算单元440分别以相当于灵敏度测量用数据存储单元432中存储的灵敏度测量用数据的数,反复进行处理。
灵敏度数据计算单元440使用从失真计算单元439输入的失真,对灵敏度测量用数据存储单元432中存储的所有数据样本,每个比特计算失真的积和,再除以所有数据样本数。灵敏度数据计算单元440将每个比特的除法结果作为每个比特的平均比特灵敏度而输出到灵敏度数据对照单元442。这样,求语音编解码软件存储单元431中存储的编解码的平均失真(以下,称为“灵敏度数据”)。
参考灵敏度数据存储单元441预先存储参考灵敏度数据。参考灵敏度数据存储单元441中存储的参考灵敏度数据,是使用传输路径编码解码的算法设计时设想的、可存储到编解码控制单元404中的编解码、例如G.729方式的标准编解码,使比特灵敏度测量单元433预先起作用而在灵敏度数据计算单元440中求出的灵敏度数据。
灵敏度数据对照单元442从参考灵敏度数据存储单元441读出参考灵敏度数据,对该参考灵敏度数据和从灵敏度数据计算单元440输入的灵敏度数据进行比较,判定是否能够将语音编解码软件存储单元431中已存储的语音编解码存储到编解码控制单元404中。首先,灵敏度数据对照单元442在从灵敏度数据计算单元440输入的灵敏度数据的SNR大于参考灵敏度数据的SNR时、即灵敏度数据的比特灵敏度小于参考灵敏度数据的比特灵敏度(良好)时,判断为能够将语音编解码软件存储单元431中已存储的语音编解码存储到编解码控制单元404中。也就是说,灵敏度数据对照单元442在满足下式(2)时,判定为能够将语音编解码软件存储单元431中已存储的语音编解码软件存储到编解码控制单元404中,并将语音编解码软件输出到编解码控制单元404。
在式(2)中,si表示从灵敏度数据计算单元440输入的灵敏度数据,si r表示参考灵敏度数据,i表示参考编码数据的被反转过的比特的序号,γi表示余量。
图11是表示一例灵敏度数据对照单元442中的、考虑了余量的参考灵敏度数据与灵敏度数据之间的对照状态的图。
由于存在以下的可能性,即,即使从灵敏度数据计算单元440输入的每个比特的灵敏度数据稍差,也能够获得在综合性能上语音质量良好的编解码,因此在灵敏度数据对照单元442中,在灵敏度数据的对照中使用余量。在图11中,横轴表示参考编码数据的被反转了的比特的序号,纵轴表示SNR所示的灵敏度数据。另外,较细的图形(graph)表示从灵敏度数据计算单元440输入的灵敏度数据,较粗的图形表示考虑了余量的参考灵敏度数据(即从参考灵敏度数据的SNR减去相当于余量的SNR而求得的图形)。灵敏度数据对照单元442既可使用作为常数的余量,也可以使用如式(2)所示的、对参考编码数据的各个比特不同的余量。图11所示的状态是由于灵敏度数据大于考虑了余量的参考灵敏度数据,因此比特灵敏度良好的状态,灵敏度数据对照单元442可以判断为能够将语音编解码软件存储单元431中存储的语音编解码存储到编解码控制单元404中。
使用式(2)的灵敏度数据对照,对比特分配相似的编解码有效。但是,并不限于灵敏度数据相同的信息总是为相同的比特序号,存在比特分配自身也不同的情况。此时,如果使用式(2)进行比特灵敏度的对照,则有可能因以图形表示时的峰与谷的失配,而获得错误的对照结果。为了对应该情况,灵敏度数据对照单元442优选对从灵敏度数据计算单元440输入的灵敏度数据和参考灵敏度数据,进行利用了排序的对照。
以下,说明灵敏度数据对照单元442中进行的、利用了排序的灵敏度数据的对照。首先,灵敏度数据对照单元442对从参考灵敏度数据存储单元441读出的参考灵敏度数据,以比特为单位进行大小的排序。另外,灵敏度数据对照单元442预先存储排序前的参考灵敏度数据的比特序号(以下,称为“参考序号数据”)。此外,灵敏度数据对照单元442对从灵敏度数据计算单元440输入的灵敏度数据,以比特为单位进行大小的排序,并预先存储排序前的灵敏度数据的比特序号(以下,称为“序号数据”)。然后,当满足下式(3)时,灵敏度数据对照单元442判断为能够将语音编解码软件存储单元431中已存储的语音编解码存储到编解码控制单元404中。
在式(3)中,Sj表示通过排序所得的灵敏度数据,Sj γ表示通过排序所得的参考灵敏度数据,j表示参考编码数据的被反转了的比特的序号,δj表示余量。
图12是用于说明灵敏度数据对照单元442中的、使用了排序的灵敏度数据的对照的图。
在图12中,横轴表示参考序号数据和序号数据,纵轴表示SNR所示的灵敏度数据。另外,较细的图形表示通过排序所得的灵敏度数据,较粗的图形表示通过排序所得的参考灵敏度数据(已考虑余量)。图12所示的状态,是由于在排序后灵敏度数据大于已考虑余量的参考灵敏度数据,因此比特灵敏度良好的状态,灵敏度数据对照单元442可以判断为能够将语音编解码软件存储单元431中已存储的语音编解码存储到编解码控制单元404中。
灵敏度数据对照单元442在判断为能够将语音编解码软件存储单元431中已存储的语音编解码存储到编解码控制单元404中时,将判定结果(S8a)输出到基站装置160B和语音编解码软件存储单元431,并合并参考序号数据和序号数据(S9a),与语音编解码软件存储单元431中已存储的语音编解码软件(S9)一起输出到编解码控制单元404。
编解码控制单元404和编解码控制单元454对从输入输出处理单元106和输入输出处理单元156输入的数字语音信号进行编码,并对获得的语音编码数据,使用从灵敏度数据对照单元442输入的序号数据和参考序号数据进行比特的替换。另外,编解码控制单元404和编解码控制单元454对从传输路径编码/解码单元108和传输路径编码/解码单元158输入的语音编码数据,使用从灵敏度数据对照单元442输入的序号数据和参考序号数据进行比特的替换之后,进行解码处理。
图13是例示使编解码控制单元404和编解码控制单元454进行存储且使该编解码控制单元404和编解码控制单元454动作的编码器和解码器中的比特替换处理的图。
图13的(a)和图13的(b)表示编解码控制单元404和编解码控制单元454对通过编码处理获得的语音编码数据进行比特替换的例子。图13的(c)和图13的(d)表示编解码控制单元404和编解码控制单元454对从传输路径编码/解码单元108和传输路径编码/解码单元158输入的语音编码数据进行比特替换的例子。另外,在图13中,举例表示两个比特的替换。
这样,根据本实施方式,即使在播发用编解码存储单元161B中存储的编解码软件中未附加比特分配信息时,也能够计算播发用编解码存储单元161B中存储的编解码软件的灵敏度数据,并通过与参考灵敏度数据进行对照,判定是否能够将该编解码软件存储到编解码控制单元中。
另外,在本实施方式中,举例说明了灵敏度数据对照单元442从参考灵敏度数据存储单元441读入参考灵敏度数据并进行排序,求排序过的参考灵敏度数据和参考序号数据的情况,但本发明并不限定于此,参考灵敏度数据存储单元441除了存储参考灵敏度数据以外,还可以存储预先排序过的参考灵敏度数据和参考序号数据。
另外,在上述中,说明了以在呼叫侧的无线终端装置140的判定单元403进行判定处理之后,被叫侧的无线终端装置150的判定单元453进行判定处理的方式,在时间上串行地交替进行无线终端装置140的判定处理与无线终端装置150的判定处理的结构和动作,但也可以在时间上并行地进行无线终端装置140的判定处理和无线终端装置150的判定处理。以下,说明本实施方式中的另一形态的结构和动作的一例。
图14是表示能够在时间上并行地进行无线终端装置140的判定处理和无线终端装置150的判定处理的无线通信系统400A的主要结构的方框图。另外,无线通信系统400A具有与图8所示的无线通信系统400同样的基本结构,对相同结构要素附加相同标号,并省略其说明。
无线通信系统400A与无线通信系统400的不同之处在于,在基站装置160C内还具备判定单元162C。因此,与无线通信系统400的基站装置160B、播发用编解码存储单元161B的结构和动作不同,为了对其进行区别,分别附加不同的标号。
首先,从在呼叫侧的无线终端装置140中,电信号通过用户的按键操作单元101被输出到AV控制/输出单元102(S1),直到在被叫侧的无线通信终端装置150中,通信的开通从按键操作单元151经由AV控制/输出单元152通知给基站装置160C(S4)为止的动作,与图1中的说明相同。
基站装置160C在接收到通信开通的通知时,将播发用编解码存储单元161C中存储的多个语音编解码软件中的一个分别输出到判定单元403和判定单元453(S9、S12)。
接着,判定单元403和判定单元453各自进行判定处理。判定处理的细节与上述图8至图13的说明相同,因此省略。接着,各个判定单元中进行过判定的判定结果(S6、S7、S8a、S14、S15、S11a)被输入到基站装置160C内的判定单元162C。另外,无线终端装置150中的S14、S15与无线终端装置140中的S6、S7分别对应。而且,S6与S14只要是单纯地显示“不可存储”的判定结果的信息即可。
基站装置160C的判定单元162C对从判定单元403输入的判定结果和从判定单元453输入的判定结果进行比较,当至少一方的判定结果为“不可存储”时,选择其他的语音编解码软件,并将该软件的识别序号通知给播发用编解码存储单元161C(S16)。播发用编解码存储单元161C将与该识别序号对应的语音编解码软件分别输出到判定单元403和判定单元453(S9、S12)。以后,反复进行与上述同样的动作,直到双方的判定结果都为“可存储”为止。
基站装置160C的判定单元162C在从判定单元403输入的判定结果以及从判定单元453输入的判定结果的双方都为“可存储”时(S8a、S11a),将“通信成立”的判定结果通知给AV控制/输出单元102和AV控制/输出单元152双方(S18、S19)。
如上所述,也可以在时间上并行地进行呼叫侧的无线终端装置140的判定处理以及被叫侧的无线终端装置150的判定处理,其效果与在时间上串行地进行判定处理的情况相同。
(实施方式5)
在本实施方式中,详细地说明播发用编解码存储单元161中存储的语音编解码软件的一个变化。另外,本实施方式的语音编解码软件是ITU-T标准G.729方式的语音编解码的变形,其比特分配与ITU-T标准G.729方式的语音编解码的比特分配相同。
以下,对本实施方式的语音编解码软件的各个编码对象参数,与ITU-T标准G.729方式的语音编解码进行对比,同时进行说明。
(1)LSP量化器
图15是用于说明G.729方式的语音编解码中的LSP量化方法的图。如图15所示,在G.729方式的语音编解码中,分为两段(以1比特表示段序号),总共进行10次LSP量化。在第一段中,进行7比特的矢量量化(VQ:VectorQuantization),在第二段中,对第一段的量化误差矢量进行5比特×2的分离(split)矢量量化。
图16是用于说明本实施方式的语音编解码软件中的LSP量化方法的图。如图16所示,在本实施方式的语音编解码软件中,分为三段,并对10次量化对象矢量进行量化。在第一段中,以7比特对整个量化矢量对象进行矢量量化,在第二段中,以5比特对第一段的量化误差矢量进行矢量量化,在第三段中,各以5比特对第二段的量化误差矢量的前半部分和后半部分分别进行矢量量化。
图15所示的G.729方式的语音编解码的LSP量化方法与图16所示的本实施方式的语音编解码软件的LSP量化方法相比,预测系数的次数相同,第一段的量化处理相同。另外,G.729方式的语音编解码在第二段中进行5比特×2的分离矢量量化,与此相对,本实施方式的语音编解码在第二段和第三段中对前段的量化误差矢量分别进行5比特的矢量量化。本实施方式的语音编解码软件的LSP量化方法与G.729方式的语音编解码的LSP量化方法相比,虽然计算量有些增加,但LSP量化精度提高。其原因在于,分离矢量量化是对矢量进行分割,因此无法利用通过分割获得的两个分割矢量之间的互相关。与此相对,根据多段结构的LPS量化,由于能够充分利用矢量整体的统计性偏差,因此量化精度提高。根据本实施方式的三段的LSP矢量量化的结构,能够以与G.729方式同样的比特数获得更好的性能。而且,段数比G.729方式的LSP量化方法的两段多的三段结构与G.729方式同样地维持比特灵敏度,因此能够直接使用与G.729方式的语音编解码对应的传输路径编码。
(2)自适应码本
在G.729方式的语音编解码中,对自适应码本,以9比特对第一子帧进行量化,以5比特对第二子帧的Δ延迟(与第一子帧的延迟的差分)进行量化。
但是,在G.729方式中存在下述问题:对第一子帧的延迟量化,9比特过剩,与此同时,与第二子帧的5比特对应的项目数(32项目)过少。此外,在第一子帧中产生的传输差错会传递到第二子帧。因此,在本实施方式的语音编解码软件中,不使用Δ延迟,而利用7比特+7比特的全搜索进行编码。本实施方式的语音编解码软件与G.729方式相比,第一子帧的项目数减少,但整体上对传输差错的容错性变强,而且能够提高在变动剧烈的辅音(consonant)区间等的音质。作为传输路径编码,如果将第二子帧的7比特的低位2比特连结于第一子帧的低位而作为9比特进行处理,则能够直接使用与G.729方式的语音编解码对应的传输路径编码。
(3)固定码本
在G.729方式的语音编解码中,固定码本使用由四个脉冲构成的代数激励,以4比特表示各个脉冲的极性,以13比特(3+3+3+4)表示各个脉冲的位置。
图17是表示构成用作G.729方式的语音编解码的固定码本的代数激励的四个脉冲的位置的表(以下,称为“脉冲位置表”)的图。
在本实施方式的语音编解码中,使用隐匿性能比由四个脉冲构成的代数激励好的其他结构的代数激励作为固定码本。具体而言,重新排列G.729方式的脉冲位置表的要素,获得本实施方式的脉冲位置表。
图18是表示一例重新排列G.729方式的脉冲位置表的要素所得的本实施方式的脉冲位置表的图。
图17所示的脉冲位置表和图18所示的脉冲位置表是编码性能完全不变的不同的表。另外,也可以完全不改变编码性能地替换脉冲0至2的信道。也就是说,如果使用图18所示的脉冲位置表进行编码,则与使用图17所示的脉冲位置表进行编码的情况相比,编码性能完全相同,所获得的编码信息(脉冲的位置的序号)完全不同。如果使如上所述的重新排列的方法为语音通信的固有的方法,则隐匿性大幅提高。例如,如果能够通过按键操作单元101的按键操作来自由编辑存储在图5的固有编解码存储单元201中的语音编解码的脉冲位置表,则能够在每次通话时使用不同的语音编解码。具体而言,从按键操作单元101只输入随机数的种子(seed),根据产生的随机数重新排列脉冲位置表。这样的随机数种子的输入和脉冲位置表的重新排列既可以在从播发用编解码存储单元161下载语音编解码软件时进行,也可以在即将开始语音通话之前进行。判定单元103基于来自按键操作单元101的种子,对从基站装置160或图6的编解码播发中心170播发的语音编解码软件进行脉冲位置表的重新排列。另外,为了实现编码器与解码器的对应,需要将重新排列脉冲位置表后的语音编解码软件转发到被叫的无线终端装置150(或无线终端装置250)。
另外,如果使用图18所示的脉冲位置表进行编码,则与使用图17所示的脉冲位置表进行编码的情况相比,比特灵敏度完全不变,而能够适用相同的传输路径编码方法。
(4)增益编码
在G.729方式的语音编解码中,对增益进行分为两段的7比特的矢量量化(3比特+4比特)。与此相对,可知使用了128种代码矢量的一段结构的7比特矢量量化与两段结构的7比特矢量量化相比,代码矢量的自由度大,编码性能好。因此,在本实施方式的语音编解码软件中,对增益进行一段结构的7比特矢量量化。
但是,虽然能够提高7比特的编码性能,但较好的是,7比特各自的比特灵敏度符合G.729方式的特性(前段3比特的比特灵敏度较高,后段4比特的比特灵敏度较低)。其原因在于,由于128种代码矢量原本是被随机附加序号,因此7比特的比特灵敏度变得相同,如果直接使用与G.729方式的特性相应的纠错/差错检测算法(保护前段3比特,不大保护后段4比特),则在性能方面有可能出现问题。
为了符合该G.729方式的特性,例如,将本实施方式的语音编解码软件的128种代码矢量按该矢量空间内的距离分为八组(一组包含16个代码矢量),以组号(0至7)和组内号(0至15)表示各个代码矢量即可。也就是说,对128个形心(centroid),利用LBG算法等聚类(clustering)算法求八个新组和作为其中心的新形心,参照该新形心与128种形心的距离,对各自的新形心求距离变小的16组员(member)。然后,以3比特表示新形心的序号,以4比特表示新组内号,对128个形心附加新的序号即可。例如,如果新组号为“5”,新组内号为“7”,由于“5×16+7=87”,序号为第87。
通过该方法,能够使比特灵敏度符合G.729方式的特性,同时能够提高编码性能,从而能够直接使用与G.729方式的语音编解码对应的传输路径编码(包含纠错/差错检测算法)。
在使用本实施方式的语音编解码软件时,作为判定单元103和判定单元153的判定处理的判定基准,编码器所输出的每个参数的输出比特数不超过通信系统的标准编解码的输出比特数,是指上述(1)至(4)的各个参数的输出比特数不超过通信系统的标准编解码的输出比特数。
这样,根据本实施方式,由于以与G.729方式的语音编解码同样的比特分配和比特灵敏度构成不同的语音编解码,因此不仅能够提高语音编解码软件的编码精度和隐匿性,并且能够直接使用与G.729方式的语音编解码对应的传输路径编码。
另外,作为存储在播发用编解码存储单元161中的语音编解码软件的一个变化,说明了本实施方式的语音编解码软件,但本发明并不限定于此,也可以与标准编解码同样地使用本实施方式的编解码软件。此时,只要在通信终端之间实现编码器与解码器的匹配,就能够与G.729相比进一步提高音质和隐匿性,且能够升级(update),从而能够进行更高性能的语音通信。
(实施方式6)
在本实施方式中,说明对实施方式1中说明的判定单元追加功能的情况。另外,在本实施方式中的无线终端装置的结构是在图1所示的结构中,对判定单元103/153和编解码控制单元104/154追加了图19所示的结构的结构。另外,由于呼叫侧和被叫侧的双方的无线终端装置具有同样的功能,所以在以下的说明中,代表性地说明被叫侧的无线终端装置的功能。假设在图19中的编解码控制单元154A包含在图1的编解码控制单元154中,在图19中的判定单元153A包含在图1的判定单元153中。
在本实施方式中,两个判定单元103和153还具有下述功能:在无法将语音编解码软件下载到无线终端装置中时,判定是否能够利用存储在编解码控制单元104和154中的编解码进行通信。使用图19说明该功能。图19是本实施方式的主要表示判定单元153A的内部结构的方框图。如图19所示,判定单元153A具有:测试数据存储单元501、语音编解码软件存储单元502、解码单元503、编码单元504、解码单元505以及误差评价/判定单元506。另外,在图19中,为了简化说明,省略了介于编解码控制单元154A与无线终端装置140之间的传输路径上的传输路径编码/解码单元和基站装置。
判定单元153A进行上述判定,并将该判定结果输出到编解码控制单元154A、AV控制/输出单元152和基站装置160。具体而言,如下那样。
首先,假设判定单元153A判定为能够使用编解码控制单元154A中存储的语音编解码软件进行通信,并将该判定结果输出到编解码控制单元154A、AV控制/输出单元152和基站装置160。此时,编解码控制单元154A接收该判定结果,由此收到使用已存储的语音编解码软件进行编解码的指示。AV控制/输出单元152接收该判定结果后,为了将能够通信的情况传达给用户,进行基于语音输出或画面显示等的AV输出。另外,判定结果也经由基站装置160发送到对方的无线终端装置140的AV控制/输出单元102(S11b)和判定单元103。无线终端装置140的判定单元103在接收到该判定结果时,将该判定结果发送到编解码控制单元104。在编解码控制单元104接收到该判定结果时,无线终端装置140和150间的通信成立,成为可通话状态。
此外,相反地,在判定单元153A判定为无法使用编解码控制单元154A中存储的语音编解码软件进行通信,并输出了该判定结果时,AV控制/输出单元152接收该判定结果后,为了将无法通信的情况传达给用户,进行AV输出。另外,此时,判定结果未被输出到编解码控制单元154A,或者即使该判定结果被发送到编解码控制单元154A,编解码控制单元154A也只接收而不特别进行任何动作。另外,判定结果也经由基站装置160而被发送到对方的无线终端装置140的AV控制/输出单元102和判定单元103(S10)。在无线终端装置140的判定单元103接收到该判定结果时,双方的无线终端装置140和150不使通信成立而使任务结束。
在本实施方式中,判定单元153A进行的处理被分为两个处理。第一个处理是:为了判定是否能够直接使用在对方的无线终端装置140的编解码控制单元104中存储的语音编解码,而将码传输到对方的无线终端装置140。第二个处理是:利用已从对方的无线终端装置140传输的码,判定是否能够直接使用在无线终端装置150的编解码控制单元154A中存储的语音编解码。
首先,说明第一个处理。另外,作为前提,在判定单元153A内的测试数据存储单元501中存储测试用的语音数据。
首先,测试数据存储单元501将测试用的语音数据输出到编解码控制单元154A。接着,编解码控制单元154A使用已存储在内部的语音编解码对测试用的语音数据进行编码,并将获得的码传输到无线终端装置140。
无线终端装置140基于该码进行判定。另外,使用测试用的语音数据,是为了判定是否可在开始通信之后立即迅速开始语音通信,测试数据存储单元501中存储相当于短时间的判定容易的数据(元音列或正弦波等容易编码的语音数据)。
接着,说明第二个处理。另外,作为前提,在语音编解码软件存储单元502中,存储与编解码控制单元154A中存储的语音编解码相同的软件。
首先,编解码控制单元154A接受被进行与上述处理同样的编码处理而传输来的码,将其输出到判定单元153A的解码单元503。
接着,解码单元503使用已存储在语音编解码软件存储单元502中的语音编解码,对从编解码控制单元154输出的语音编码数据(码)进行解码而求第一合成音。进而,编码单元504使用已存储在语音编解码软件存储单元502中的语音编解码,对从解码单元503输出的第一合成音进行编码而求合成音编码数据。进而,解码单元505使用已存储在语音编解码软件存储单元502中的语音编解码,对从编码单元504输出的合成音编码数据进行解码而求第二合成音。接着,误差评价/判定单元506对第一合成音与第二合成音的误差进行评价,判定是否可以直接使用已存储在编解码控制单元154A中的语音编解码开始语音通信,并输出判定结果。
接着,详细地说明误差评价/判定单元506的功能。误差评价/判定单元506只使用传输到的语音编码数据,并基于以下倾向,判定是否能够利用无线终端装置150的解码器对经过对方的无线终端装置140的编码器编码的语音编码数据进行解码。
如果在对方的无线终端装置140中不管以哪个语音编解码进行编码,自身的无线终端装置150中存在的解码器都能够与该语音编解码取得对应,则第一合成音近似于测试数据。而且,如果测试数据具备作为容易编码的语音数据的特征,则所获得的第一合成音也应该容易编码。因此,通过利用无线终端装置150中所具备的语音编解码对第一合成音进行编码/解码而获得的第二合成音,近似于第一合成音。
另一方面,在无线终端装置150中存在的解码器无法与对方的无线终端装置140的编解码取得对应时,第一合成音偏离测试数据,因此几乎没有容易编码的可能性。因此,通过利用无线终端装置150中所具备的编解码对第一合成音进行编码/解码而获得的第二合成音,偏离第一合成音。
如果基于该倾向,误差评价/判定单元506评价第一合成音与第二合成音的误差,则能够判定是否可以直接使用已存储在编解码控制单元154A中的语音编解码来开始语音通信。
基于上述倾向,误差评价/判定单元506进行下式(4)所示的判定。这里,对方的无线终端装置140也有可能使用相同的测试数据,所以首先对存储在测试数据存储单元501中的测试用的语音数据和第一合成音进行比较。另外,在对方的无线终端装置140使用与无线终端装置150相同的测试数据时,误差评价/判定单元506能够进行更准确的判定。
如果 则flg=1(可使用)
另外{
如果 则flg=1(可使用)
另外flg=0(不可使用)
}
…(4)
Thta:第一基准值(常数)
Thab:第二基准值(常数)
flg:判定结果(1:可使用、0:不可使用)
ti:测试数据
ai:第一合成音
bi:第二合成音
PowT:测试数据的功率
PowA:第一合成音的功率
PowB:第二合成音的功率
CovTA:测试数据与第一合成音的相关值
CovAB:第一合成音与第二合成音的相关值
如上式(4)所示,误差评价/判定单元506通过评价以各自的功率值对相关值进行归一化所得的值来进行判定。在测试数据与第一合成音之间的相关值高于预定的第一基准值时,误差评价/判定单元506判定为可使用已存储的语音编解码。
另一方面,如果相关值为第一基准值以下,则表示测试数据不同的情况或者无法使用语音编解码的情况中的任一种,误差评价/判定单元506接着对第一合成音与第二合成音的相关性进行评价。
接着,在第一合成音与第二合成音之间的相关值高于第二基准值时,误差评价/判定单元506判定为可使用已存储的语音编解码,如果相关值为第二基准值以下,则判定为无法使用已存储的语音编解码。
另外,各个判定结果通过标记“0”(不可使用)、“1”(可使用)来表示。另外,虽然也取决于编解码的性能,但如果将第一基准值设定为0.9至0.95左右的常数,将第二基准值设定为0.87至0.92左右的常数,则可获得规定的性能。另外,准备多个基准值,并根据用户的请求来适当选择基准值也有效。此时,如下式(5)那样地进行判定即可。
如果 则flg=1(可在第一水平下使用)
另外如果 则flg=2(可在第二水平下使用)
另外{
如果 则flg=1(可在第一水平下使用)
另外如果 则flg=2(可在第二水平下使用)
另外flg=0(不可使用)
}
…(5)
Thta:第一水平的第一基准值(常数)
Thab:第一水平的第二基准值(常数)
Th2ta:第二水平的第一基准值(常数)
Th2ab:第二水平的第二基准值(常数)
如上述式(5)所示,在非“可足够使用(第一水平)”时,进行“可勉强进行通话(第二水平)”的判定。将第二水平的基准值设定为稍低于第一水平的基准值。另外,以“2”(可在第二水平下使用)来表示判定为在第二水平下可使用时的标记。由此,能够根据无线终端装置的设计或用户的请求来设定在各自的哪些水平下开始通话。
如上所述,通过对图1所示的无线终端装置的结构追加图19所示的结构,在无法下载语音编解码软件时,可以判定是否能够使用编解码控制单元中存储的语音编解码软件进行通信。然后,该判定结果被输出到本终端的编解码控制单元和AV控制/输出单元,并且也经由基站装置160被输出到对方的无线终端装置。在判定结果为“可使用”(标记:1或2)时,使用编解码控制单元中存储的语音编解码软件开始通信,在判定结果为“不可使用”(标记:0)时,通信不成立,任务结束。
另外,在本实施方式中,说明了进行是否能够直接使用已存储的语音编解码的判定的情况,但本发明并不限于此,如果判定单元153存储了必要的软件,则也可以判定是否能够使用任意下载下来的语音编解码软件。
而且,在本实施方式中,以在无线终端装置间相互交换码为前提进行了说明,但当然也可以只是其中一方。此时,通话质量被保障的只是上行和下行中的一方,但在只要一方的通信中的通话质量被保障就足够的情况下是有效的。
另外,在本实施方式中,在传送来的码相当于多帧时,既可以利用将多个合成音连结而成的合成音来评价相关性,也可以在逐帧求相关值之后评价该相关值之和。如果采用后者的步骤,则能够获得节约RAM(Random AccessMemory,随机存取存储器)容量的效果。
以上,说明了本发明的各个实施方式。
另外,在各个实施方式中,举例说明了通信终端装置彼此使用相同的语音编解码软件的情况,但也可以在一个通信终端装置的通信的上行和下行中使用不同的语音编解码。例如,可列举下述方法:两个通信终端装置使用完全不同的编码器,在通信开通时仅相互更换解码器而开始通信。由于上行与下行完全独立,因此通过不同的编解码来进行编码/解码时不存在任何问题,还能够获得隐匿性更加提高的效果。另外,通话者也可以选择并使用最适合于包括环境噪声、电波的灵敏度(比特差错的多少)、所允许的比特率等的通话状况的编解码。这样的编解码的选择,可以在通信终端装置、基站装置、编解码播发中心中的任一个中进行。
另外,在各个实施方式中,举例说明了在开始通信时进行语音编解码的转发、存储的情况,但本发明并不限定于此,也可以在通信的中途进行语音编解码的转发、存储。此时,如果呼叫侧改变编码器,则只要将与此对应的解码器和编码信息一同传输即可。该编解码的转发,可以在通信终端装置、基站装置、编解码播发中心中的任一个中进行。
另外,在各个实施方式中,举例说明了使各个编码要素的比特率完全相同的情况,但明确的是,各个编码要素的比特率只要为各个编码要素的比特数以下即可。这是因为,只要各个编码要素的比特数为现有系统的标准编解码的比特数以下,就可以直接使用现有的传输路径编码。当然,如果编码信息比特剩余,则也可以相应地设法提高音质或容错性,例如增加纠正比特、设为多模式等。
另外,在各个实施方式中,举例说明了使用代数方式的码本作为固定码本的情况,但本发明并不限定于此,也可以使用多脉冲码本或固定波形已被写入在ROM(Read Only Memory,只读存储器)中的固定码本。在上述各个实施方式中,使用各个信道表示脉冲的位置,但只要各个信道序号对应于固定波形的矢量,就能够获得与本发明相同的效果。
另外,在各个实施方式中,作为标准编解码,举例说明了G.729方式的CELP编解码,但本发明并不限定于此,也可以将用于第三代移动电话的AMR(Adaptive Multi-Rate,自适应多速率)或AMR-WB(WideBand,宽带)(G.722.2)、EVRC(Enhanced Variable Rate Codec,增强型可变速率编解码)、SMV(Selectable Mode Vocoder,可选模式声码器)、VMR-WB(Variable-RateMulti-Mode Wideband,可变速率多模式宽带)、或用于PHS(PersonalHandyphone System,个人手持电话系统)的G.726(ADPCM:AdaptiveDifferential Pulse Code Modulation;自适应差分脉码调制)等用作标准编解码。
而且,在各个实施方式中,举例说明了替换与现有的无线通信系统的标准编解码不同的语音编解码的情况,但本发明并不限定于此,也可以在现有的无线通信系统中不具备标准的语音编解码。此时,使语音编解码的规格完全自由,将传输路径编码/解码作为软件而与语音编解码软件一同传输即可。或者,也可以预先决定传输路径编码/解码与语音编解码的编码信息中作为规定比特灵敏度的信息的比例,只传输语音编解码。例如,将比特灵敏度分为3等级(level),将合计80比特的编码信息中具有3等级的比特灵敏度的信息的比特数分别决定为5比特、15比特、60比特。
另外,在各个实施方式中,说明了下载并使用语音编解码软件的情况,但本发明也可适用于图像编解码。近年来,还出现了能够接收一塞格广播(One-segment broadcasting)的移动电话等,容易地预想不久将可以一边看着对方的脸一边进行通话。此时,图像编解码中也会产生与语音编解码完全相同的问题,本发明将会有效解决该问题。如果将话筒替换为照相机,将扬声器替换为显示器,则本发明能够完全直接适用于图像编解码。特别地,在图像编解码中,只有解码器的规格被预先确定,而编码器是由厂商各自开发独自的编码器,在性能上进行竞争。本发明在图像编解码中的应用,由于在系统运营后仍能够将性能更好的编码器提供给用户,因此其效果非常大。
另外,在各个实施方式中,举例说明了经由基站的无线通信系统,但本发明也可以适用于IP电话、因特网通信。只要是具备中继功能的通信系统,即使不存在基站也能够适用本发明。
而且,本发明的通信终端装置、通信系统以及通信方法并不限于上述各个实施方式,可以进行各种变更后实施。例如,也可以适当地组合各个实施方式而实施。
另外,在上述各个实施方式中,为了确定通信对方的通信终端装置而使用了电话号码,但也可以使用能够确定通信对方的固有序号。
另外,自适应码本有时也被称为自适应激励码本。另外,固定码本有时也被称为固定激励码本,有时也被称为噪声码本、概率码本(stochasticcodebook)或随机数码本(random codebook)。
另外,LSP有时也被称为LSF(Line Spectral Frequency,线谱频率),且也可以将LSP换称为LSF。
另外,用于各个实施方式的说明中的各功能块通常作为集成电路即LSI来实现。这些块既可以单独地集成为一个芯片,也可以包含一部分或全部地集成为一个芯片。
另外,虽然此处称为LSI,但根据集成程度,也可以称为IC、系统LSI、超大LSI(Super LSI)、特大LSI(Ultra LSI)等。
另外,实现集成电路化的方法不仅限于LSI,也可使用专用电路或通用处理器来实现。也可以使用可在LSI制造后编程的FPGA(Field ProgrammableGate Array:现场可编程门阵列),或者可重构LSI内部的电路单元的连接和设定的可重构处理器(Reconfigurable Processor)。
再者,随着半导体的技术进步或随之派生的其它技术的出现,如果能够出现替代LSI的集成电路化的新技术,当然可利用该新技术进行功能块的集成化。还存在着适用生物技术等的可能性。
2007年9月21日提交的特愿第2007-246269号以及2008年4月25日提交的特愿第2008-115665号的日本专利申请所包含的说明书、附图和说明书摘要的公开内容,全都引用于本申请。
工业实用性
本发明的通信终端装置、通信系统以及通信方法能够适用于移动通信系统等的用途。
Claims (16)
1.通信终端装置,包括:
判定单元,判定外部装置中存储的语音编解码软件是否适合于下载;以及
编解码控制单元,在所述判定单元判定为所述语音编解码软件适合于下载时,使用从所述外部装置下载下来的语音编解码软件进行语音的编码和解码。
2.如权利要求1所述的通信终端装置,
所述判定单元基于从所述外部装置输入的语音编解码软件的比特分配,在所述语音编解码软件的各个编码参数的比特数为各自的阈值以下时,判定为所述语音编解码软件适合于下载,而在所述语音编解码软件的任一编码参数的比特数大于所述阈值时,判定为所述语音编解码软件不适合于下载。
3.如权利要求1所述的通信终端装置,
所述判定单元包括:
编码单元,使用所述语音编解码软件,对规定的语音进行编码,获得编码数据;以及
第一判定单元,当所述编码数据的比特总数大于规定值时,判定为所述语音编解码软件不适合于下载。
4.如权利要求3所述的通信终端装置,
所述判定单元还包括:
反转单元,在所述第一判定单元判定为所述编码数据的比特总数为规定值以下时,将所述编码数据的各个比特的极性反转而获得相当于所述比特总数的差错编码数据;
解码单元,使用所述语音编解码软件,分别对所述编码数据和相当于所述比特总数的差错编码数据进行解码,获得解码数据和相当于比特总数的差错解码数据;
计算单元,计算相当于所述比特总数的各个解码数据与所述解码数据之间的失真,作为所述编码数据的各个比特的比特灵敏度;以及
第二判定单元,在所述各个比特的比特灵敏度为各自的阈值以下时,判定为所述语音编解码软件适合于下载,而在所述各个比特中的任意的比特灵敏度大于所述阈值时,判定为所述语音编解码软件不适合于下载。
5.如权利要求4所述的通信终端装置,
编码单元、所述反转单元以及所述解码单元对多个语音进行处理,
所述计算单元对所述多个语音平均地计算所述各个比特的比特灵敏度。
6.如权利要求4所述的通信终端装置,
所述第二判定单元对所述各个比特的比特灵敏度进行排序后再进行判定。
7.如权利要求1所述的通信终端装置,还包括:
本地语音编解码存储单元,存储上次通话中下载下来的语音编解码软件,
所述判定单元对所述本地语音编解码存储单元中存储的语音编解码软件,比所述外部装置中存储的语音编解码软件优先进行判定。
8.如权利要求7所述的通信终端装置,还包括:
按键操作单元,将来自外部的输入转换为电信号,
所述本地语音编解码存储单元中存储的语音编解码软件的内容通过所述按键操作单元的操作被操作。
9.如权利要求1所述的通信终端装置,还包括:
按键操作单元,将来自外部的输入转换为电信号,
根据所述按键操作单元的操作而选择作为所述判定单元的判定对象的语音编解码软件。
10.如权利要求1所述的通信终端装置,
所述判定单元使用对从所述编解码控制单元输出的语音编码数据进行解码所得的第一合成音,判定是否能够使用所述编解码控制单元中存储的语音编解码软件进行通信。
11.如权利要求10所述的通信终端装置,
所述判定单元包括:
测试数据存储单元,存储测试数据;
语音编解码软件存储单元,存储与所述编解码控制单元中存储的语音编解码软件相同的软件;
第一解码单元,使用已存储在所述语音编解码软件存储单元中的语音编解码软件,对从所述编解码控制单元输出的语音编码数据进行解码而求第一合成音;以及
误差评价/判定单元,在所述测试数据与所述第一合成音之间的相关值高于预定的第一基准值时,判定为能够使用所述编解码控制单元中存储的语音编解码软件进行通信。
12.如权利要求11所述的通信终端装置,
所述判定单元包括:
编码单元,使用已存储在所述语音编解码软件存储单元中的语音编解码软件,对所述第一合成音进行编码而求合成音编码数据;以及
第二解码单元,使用已存储在所述语音编解码软件存储单元中的语音编解码软件,对所述合成音编码数据进行解码而求第二合成音,
所述误差评价/判定单元在所述第一合成音与所述第二合成音之间的相关值高于预定的第二基准值时,判定为能够使用所述编解码控制单元中存储的语音编解码软件进行通信。
13.如权利要求1所述的通信终端装置,
所述外部装置是基站装置。
14.如权利要求1所述的通信终端装置,
所述外部装置是基站装置以外的编解码播发中心。
15.通信系统,包括通信终端装置和基站装置,
所述基站装置包括:
存储单元,存储语音编解码软件,
所述通信终端装置包括:
判定单元,判定所述语音编解码软件是否适合于下载;以及
编解码控制单元,在所述判定单元判定为所述语音编解码软件适合于下载时,使用从所述存储单元下载下来的语音编解码软件进行语音的编码和解码。
16.通信方法,包括以下的步骤:
判定外部装置中存储的语音编解码软件是否适合于下载;以及
在判定为所述语音编解码软件适合于下载时,使用从所述外部装置下载下来的语音编解码软件进行语音的编码和解码。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007-246269 | 2007-09-21 | ||
JP2007246269 | 2007-09-21 | ||
JP2008115665 | 2008-04-25 | ||
JP2008-115665 | 2008-04-25 | ||
PCT/JP2008/002593 WO2009037852A1 (ja) | 2007-09-21 | 2008-09-19 | 通信端末装置、通信システムおよび通信方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101802908A true CN101802908A (zh) | 2010-08-11 |
Family
ID=40467678
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200880107399A Pending CN101802908A (zh) | 2007-09-21 | 2008-09-19 | 通信终端装置、通信系统和通信方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20100228553A1 (zh) |
EP (1) | EP2192578A1 (zh) |
JP (1) | JPWO2009037852A1 (zh) |
CN (1) | CN101802908A (zh) |
WO (1) | WO2009037852A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9014342B2 (en) * | 2013-09-09 | 2015-04-21 | Nvidia Corporation | Mobile communication device, an apparatus and a method for improving call setup failure rate and quality for hearing impaired calls |
USRE49284E1 (en) * | 2013-10-17 | 2022-11-08 | Panasonic Intellectual Property Corporation Of America | Method for controlling cordless telephone device, handset of cordless telephone device, and cordless telephone device |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5483237A (en) * | 1994-01-31 | 1996-01-09 | At&T Corp. | Method and apparatus for testing a CODEC |
US6349204B1 (en) * | 1996-02-12 | 2002-02-19 | British Telecommunications Public Limited Company | Provision of telecommunications control program data pursuant to preliminary data exchange between system elements |
US6073092A (en) * | 1997-06-26 | 2000-06-06 | Telogy Networks, Inc. | Method for speech coding based on a code excited linear prediction (CELP) model |
CN1256000A (zh) * | 1998-01-26 | 2000-06-07 | 松下电器产业株式会社 | 增强音调的方法和装置 |
KR100391527B1 (ko) * | 1999-08-23 | 2003-07-12 | 마츠시타 덴끼 산교 가부시키가이샤 | 음성 부호화 장치, 기록 매체, 음성 복호화 장치, 신호 처리용 프로세서, 음성 부호화 복호화 시스템, 통신용 기지국, 통신용 단말 및 무선 통신 시스템 |
JP3669619B2 (ja) * | 1999-09-06 | 2005-07-13 | 富士通株式会社 | 無線端末装置のソフトウェア更新方法及びその装置 |
US7080009B2 (en) * | 2000-05-01 | 2006-07-18 | Motorola, Inc. | Method and apparatus for reducing rate determination errors and their artifacts |
JP2001345731A (ja) * | 2000-06-06 | 2001-12-14 | Matsushita Electric Ind Co Ltd | マルチモード携帯電話端末 |
JP3879006B2 (ja) * | 2001-08-08 | 2007-02-07 | 富士通株式会社 | 携帯端末装置 |
FI20021936A (fi) * | 2002-10-31 | 2004-05-01 | Nokia Corp | Vaihtuvanopeuksinen puhekoodekki |
US20040141572A1 (en) * | 2003-01-21 | 2004-07-22 | Johnson Phillip Marc | Multi-pass inband bit and channel decoding for a multi-rate receiver |
JP4100182B2 (ja) * | 2003-01-30 | 2008-06-11 | 松下電器産業株式会社 | 通信端末装置及びその制御方法 |
US7478040B2 (en) * | 2003-10-24 | 2009-01-13 | Broadcom Corporation | Method for adaptive filtering |
JP4079899B2 (ja) * | 2004-03-05 | 2008-04-23 | 埼玉日本電気株式会社 | 携帯無線通信端末のソフトウェア変更方法およびシステム |
JP2006031261A (ja) * | 2004-07-14 | 2006-02-02 | Matsushita Electric Ind Co Ltd | マルチメディア処理システム |
DE102004036991A1 (de) * | 2004-07-30 | 2006-02-16 | Siemens Ag | Verfahren zum Konfigurieren eines Mobilterminals, konfigurierbares Mobilterminal bzw. Mobilfunknetz dafür |
ATE534990T1 (de) * | 2004-09-17 | 2011-12-15 | Panasonic Corp | Skalierbare sprachcodierungsvorrichtung, skalierbare sprachdecodierungsvorrichtung, skalierbares sprachcodierungsverfahren, skalierbares sprachdecodierungsverfahren, kommunikationsendgerät und basisstationsgerät |
JP5043350B2 (ja) | 2006-03-20 | 2012-10-10 | 株式会社タダノ | クレーン |
JP4338724B2 (ja) * | 2006-09-28 | 2009-10-07 | 沖電気工業株式会社 | 電話端末、電話通信システム及び電話端末構成用プログラム |
JP4901427B2 (ja) | 2006-11-08 | 2012-03-21 | 好和 安達 | 設備機器位置決めシート、該設備機器位置決めシートを用いた設備機器の施工方法及び、該設備機器位置決めシートを用いたシステム水廻り設備 |
JP2008131601A (ja) * | 2006-11-24 | 2008-06-05 | Matsushita Electric Ind Co Ltd | 通信端末装置、通信システム、通信方法及びプログラム |
-
2008
- 2008-09-19 EP EP08832555A patent/EP2192578A1/en not_active Withdrawn
- 2008-09-19 JP JP2009533059A patent/JPWO2009037852A1/ja not_active Withdrawn
- 2008-09-19 CN CN200880107399A patent/CN101802908A/zh active Pending
- 2008-09-19 US US12/679,119 patent/US20100228553A1/en not_active Abandoned
- 2008-09-19 WO PCT/JP2008/002593 patent/WO2009037852A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
JPWO2009037852A1 (ja) | 2011-01-06 |
US20100228553A1 (en) | 2010-09-09 |
EP2192578A1 (en) | 2010-06-02 |
WO2009037852A1 (ja) | 2009-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101080767B (zh) | 用于低比特率语音编码的方法和装置 | |
EP1330818B1 (en) | Method and system for speech frame error concealment in speech decoding | |
RU2509379C2 (ru) | Устройство и способ квантования и обратного квантования lpc-фильтров в суперкадре | |
JP3354138B2 (ja) | 音声符号化 | |
US20020016161A1 (en) | Method and apparatus for compression of speech encoded parameters | |
US20110184733A1 (en) | System and method for encoding and decoding pulse indices | |
CN101513030A (zh) | 语音混合方法、多点会议服务器和利用该方法的程序 | |
CA2673745C (en) | Audio quantization | |
EP1617417A1 (en) | Voice coding/decoding method and apparatus | |
EP1020848A2 (en) | Method for transmitting auxiliary information in a vocoder stream | |
CN101802908A (zh) | 通信终端装置、通信系统和通信方法 | |
KR100819623B1 (ko) | 음성 데이터의 처리 장치 및 처리 방법 | |
US20060080090A1 (en) | Reusing codebooks in parameter quantization | |
CN100354926C (zh) | 音调周期搜索装置 | |
CA2373479C (en) | Device, method and program for encoding/decoding of speech with function of encoding silent period | |
Choudhary et al. | Study and performance of amr codecs for gsm | |
CN1873777B (zh) | 具有语音解码功能的移动通信终端及其动作方法 | |
Drygajilo | Speech Coding Techniques and Standards | |
Noll | Speech coding for communications. | |
Watkins | New techniques in signal coding | |
JP2000244614A (ja) | 移動無線端末装置 | |
JPH04312000A (ja) | ベクトル量子化方法 | |
JPH09134197A (ja) | 音声符号化・復号化装置 | |
CA2254620A1 (en) | Vocoder with efficient, fault tolerant excitation vector encoding | |
AU1127699A (en) | Vocoder with efficient, fault tolerant excitation vector encoding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20100811 |