JP2002215193A - 音声符号切換方法並びに音声符号切換手段及び音声通信端末 - Google Patents

音声符号切換方法並びに音声符号切換手段及び音声通信端末

Info

Publication number
JP2002215193A
JP2002215193A JP2001010250A JP2001010250A JP2002215193A JP 2002215193 A JP2002215193 A JP 2002215193A JP 2001010250 A JP2001010250 A JP 2001010250A JP 2001010250 A JP2001010250 A JP 2001010250A JP 2002215193 A JP2002215193 A JP 2002215193A
Authority
JP
Japan
Prior art keywords
code
speech
voice
input
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001010250A
Other languages
English (en)
Inventor
Tadashi Yamaura
正 山浦
Hirohisa Tazaki
裕久 田崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2001010250A priority Critical patent/JP2002215193A/ja
Priority to TW090116447A priority patent/TW515191B/zh
Priority to CNB011407468A priority patent/CN1331340C/zh
Publication of JP2002215193A publication Critical patent/JP2002215193A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 高能率音声符号化方式は、該フレーム内の情
報と過去のフレームの符号化、復号化結果も用いて符号
化、復号化しているので、端末で受けて復号化する符号
系列において、中途で音声符号が切り換わった場合、過
去の復号化結果との連続性が断たれ、出力音声が不連続
になる。 【解決手段】 話者Aによる入力音声を符号化した音声
符号Aと、話者Bによる入力音声を符号化した音声符号
Bとを入力して、所定時間のフレーム毎に音声符号Aと
音声符号Bの一方を選択して出力する音声符号切換方法
において、出力フレームの選択制御は過去の選択結果に
基づいて行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、複数の端末間で
2つの回線を共有して、2つの端末間の通話を他の端末
でも傍受することが可能な音声通信システムや、多地点
間の会議通話を実現する音声配信システム等に適用可能
な音声符号切換方法及び音声符号切換手段並びに音声符
号切換方法を適用した音声通信端末に関するものであ
り、特に高能率な音声符号化方式を用いるディジタル音
声通信システムやディジタル音声配信システムとそれに
適用する音声符号切換方法に関する。
【0002】
【従来の技術】業務通信などにおいては、2話者間の業
務連絡通話を、関連する他のメンバーがモニターするこ
とができる音声通信システムが利用されている。このよ
うな従来の音声通信システムとしては、アナログ音声信
号上で2つの音声を重畳して、この重畳した信号を一方
の回線にて送信するものがある。例えば、話者Aと話者
Bの間で通話を行う際に、話者A側の端末Aの所で、受
信した話者Bの音声信号を話者Aの音声信号に重畳し、
重畳した音声信号を話者B側の端末Bと、他の端末へ送
信する方法を用いたものがある。
【0003】図22は、従来の音声通信システムの全体
構成を示すものである。図において、1は話者Aが使用
する端末A、2は話者Bが使用する端末B、3は関連す
る他のメンバーがモニターする場合などに用いられる端
末Cである。
【0004】端末Aには端末Bからの変調信号Bを復調
し出力音声Aとするアナログ復調手段4、話者Aが発声
した入力音声Aと上記出力音声Aを重畳して重畳音声を
生成する音声重畳手段5、重畳音声を変調するアナログ
変調手段6が設けられている。
【0005】端末Bには話者Bが発声した入力音声Bを
変調するアナログ変調手段7、端末Aからの変調信号A
を復調するアナログ復調手段8が設けられている。さら
に、端末Cには端末Aからの変調信号Aを復調するアナ
ログ復調手段9が設けられている。
【0006】なお、10は端末Aからの変調信号Aを伝
送する回線A、11は端末Bからの変調信号Bを伝送す
る回線Bである。以下、図に基づいて、この従来の音声
通信システムの動作について説明する。端末Aには、話
者Aが発声した音声が入力音声Aとして入力される。ま
た、回線Bを介して後述する端末Bから変調信号Bが入
力される。アナログ復調手段4は、前記変調信号Bを復
調して、得られた音声信号を出力音声Aとして出力す
る。音声重畳手段5では、前記入力音声Aと出力音声A
を重畳した重畳音声を生成し、これをアナログ変調手段
6に入力する。アナログ変調手段6は、入力された重畳
音声を変調して、得られた変調信号を変調信号Aとし
て、回線Aに出力する。
【0007】端末Bには、話者Bが発声した音声が入力
音声Bとしてアナログ変調手段7に入力される。また、
回線Aを介して、端末Aから変調信号Aがアナログ復調
手段8に入力される。アナログ変調手段7は、前記入力
音声Bを変調して、得られた変調信号を変調信号Bとし
て、回線Bに出力する。アナログ復調手段8は、前記変
調信号Aを復調して、得られた音声信号を出力音声Bと
して出力する。端末Cには、回線Aを介して、端末Aか
ら変調信号Aが入力される。アナログ復調手段9は、前
記変調信号Aを復調して、得られた音声信号を出力音声
Cとして出力する。
【0008】上記の通り構成することによって、話者A
と話者Bが各々端末Aと端末Bを用いて通話を行ってい
る時に、端末Cにおいて話者Aと話者Bの通話を傍受す
ることが可能となっている。
【0009】図23は、上記従来の音声通信システムに
おいて、データ通信の導入など回線利用効率の改善、誤
り訂正符号との組み合わせによる無線通信における電波
の弱い地域での品質改善、暗号との組み合わせによる秘
匿性の確保などのために、システムのディジタル化を図
った別な構成を示す図である。図において、1は話者A
が使用する端末A、2は話者Bが使用する端末B、3は
関連する他のメンバーがモニターする場合などに用いら
れる端末Cである。
【0010】端末Aには端末Bからの変調信号Bを復調
する復調手段12、復調手段12で得られた音声符号B
を復号化する音声復号化手段13、音声復号化手段13
の出力をディジタル・アナログ変換(D−A変換)しア
ナログ信号である出力音声Aを出力するD−A変換手段
14、話者Aが発声した入力音声Aと前記D−A変換手
段14の出力音声Aを重畳する音声重畳手段15、重畳
音声をアナログ・ディジタル変換(A−D変換)するA
−D変換手段16、A−D変換手段16の出力を符号化
する音声符号化手段17、音声符号化手段17の出力を
ディジタル変調し、回線A10に出力する変調手段18
を備えている。
【0011】端末Bには回線Aからの変調信号Aを復調
する復調手段20、復調手段20の出力を復号化する音
声復号化手段21、音声復号化手段21の出力をディジ
タル・アナログ変換(D−A変換)しアナログ信号であ
る出力音声Bを出力するD−A変換手段22を備えてい
る。
【0012】さらに、端末Bは話者Bが発声した入力音
声Bをアナログ・ディジタル変換(A−D変換)するA
−D変換手段23、A−D変換手段23の出力を符号化
する音声符号化手段24、音声符号化手段24の出力を
ディジタル変調し、回線B11に出力する変調手段25
を備えている。
【0013】端末Cには回線Aからの変調信号Aを復調
する復調手段26、復調手段26の出力を復号化する音
声復号化手段27、音声復号化手段27の出力をディジ
タル・アナログ変換(D−A変換)しアナログ信号であ
る出力音声Bを出力するD−A変換手段28を備えてい
る。
【0014】次に、この従来の別な音声通信システムの
動作について説明する。端末Aには、話者Aが発声した
音声が入力音声Aとして入力され、また、回線Bを介し
て後述する端末Bから変調信号Bが入力される。復調手
段12は、前記変調信号Bを復調して、得られた音声符
号Bを音声復号化手段13に出力する。音声復号化手段
13は、前記音声符号Bを復号化し、得られたディジタ
ル出力音声AをD−A変換手段14に出力する。D−A
変換手段14は、前記ディジタル出力音声Aに対してデ
ィジタル・アナログ変換(D−A変換)を行ってアナロ
グ信号である出力音声Aを出力する。
【0015】また、端末A内では、前記入力音声Aと出
力音声Aを重畳した重畳音声を音声重畳手段15で生成
し、これをA−D変換手段16に入力する。A−D変換
手段16は、入力された重畳音声に対してアナログ・デ
ィジタル変換(A−D変換)を行ってディジタル信号で
あるディジタル入力音声Aを得る。音声符号化手段17
は、前記ディジタル入力音声Aを符号化して、得られた
音声符号Aを変調手段18に出力する。変調手段18
は、入力された音声符号Aをディジタル変調して、得ら
れた変調信号を変調信号Aとして、回線Aに出力する。
【0016】端末Bには、話者Bが発声した音声が入力
音声Bとして入力される。また、回線Aを介して、端末
Aから変調信号Aが入力される。A−D変換手段23
は、前記入力音声Bに対してアナログ・ディジタル変換
(A−D変換)を行ってディジタル信号であるディジタ
ル入力音声Bを得る。音声符号化手段24は、前記ディ
ジタル入力音声Bを符号化して、得られた音声符号Bを
変調手段25に出力する。変調手段25は、入力された
音声符号Bをディジタル変調して、得られた変調信号を
変調信号Bとして、回線Bに出力する。
【0017】端末B内の復調手段20は、前記変調信号
Aを復調して、得られた音声符号Aを音声復号化手段2
1に出力する。音声復号化手段21は、前記音声符号A
を復号化し、得られたディジタル出力音声BをD−A変
換手段22に出力する。D−A変換手段22は、前記デ
ィジタル出力音声Bに対してディジタル・アナログ変換
(D−A変換)を行ってアナログ信号である出力音声B
を出力する。
【0018】端末Cには、回線Aを介して、端末Aから
変調信号Aが入力される。復調手段26は、前記変調信
号Aを復調して、得られた音声符号Aを音声復号化手段
27に出力する。音声復号化手段27は、前記音声符号
Aを復号化し、得られたディジタル出力音声CをD−A
変換手段28に出力する。D−A変換手段28は、前記
ディジタル出力音声Cに対してディジタル・アナログ変
換(D−A変換)を行ってアナログ信号である出力音声
Cを出力する。
【0019】上記の通り構成することによって、ディジ
タル通信システムにおいても、従来のアナログ通信シス
テムと全く同様に、話者Aと話者Bが各々端末Aと端末
Bを用いて通話を行っている時に、端末Cにおいて話者
Aと話者Bの通話を傍受することが可能となる。
【0020】特開昭57−41064には、3者相互の
同時通話を可能にするディジタル台トランクが開示され
ている。このディジタル台トランクは、各話者に対し
て、他2話者の音声PCM符号を比較して、レベルの高
い方の音声PCM符号をサンプル毎に選択出力するもの
である。このように構成することにより、他2話者の音
声PCM符号を一度復号化して加算し、再びPCM符号
にもどす必要がなく、ハード規模を小さくすることが可
能となる。
【0021】
【発明が解決しようとする課題】近年広く利用されてい
るCELP方式に代表される高能率な音声符号化方式に
は、入力音声を一度符復号化して得られる出力音声を再
度符号化したり、同時に発声された複数話者の音声を符
号化すると、符号化品質が大きく劣化するという特徴が
あるので、この高能率音声符号化方式を用いて図23に
示すディジタル通信システムを実現すると、音声符号化
手段17における符号化品質が劣化し、回線Aを通して
端末B、端末Cに送出される通話音声の品質が劣化する
という課題がある。
【0022】この問題を回避する方法として、特開昭5
7−41064を参考に、端末Aにおいて音声符号Aと
音声符号Bのどちらか一方を選択して送出するように、
音声符号を切り換えて出力する構成が考えられる。この
様に構成することによって、複数回の符号化および複数
話者の音声の符号化は回避できるが、以下に述べる様々
な課題があり、容易に実現することができなかった。な
お、特開昭57−41064は複数の音声符号から一つ
を選択して出力することを実現しているが、サンプル毎
に切換が可能な音声PCM符号に限定したものであり、
以下に述べる課題は起こっていなかった。
【0023】高能率音声符号化方式では、10〜50m
s程度を1フレームとして、該フレームを構成する複数
サンプルを一括して符号化しているので、音声符号切換
により端末B、端末Cで受けて復号化する符号系列にお
いて、音声符号Aと音声符号Bが話者Aまたは話者Bの
発声中に頻繁に切り換わったり、符号が切り換わること
により発声内容の重要部分が欠落した場合には、その欠
落長は数十msに及ぶので、通話内容の把握に支障をき
たす。
【0024】該フレームにおける音声レベルの大小のみ
で符号を切り換えた場合、符号切換が頻繁に発生するの
で、これを復号化して得られる出力音声は数十ms毎に
話者Aと話者Bの発声が切り換わるものとなり、どちら
の発声内容も正確に理解できないという課題が有る。
【0025】また、該フレームにおける音声レベルの大
小のみでは、通話を主導していて重要度が高い話者の音
声符号を的確に選択することはできないので、発声内容
の重要部分が欠落し、通話内容の把握に支障をきたすと
いう課題が有る。
【0026】また、選択されない側の音声符号は破棄さ
れるので、破棄された側の話者の発声内容が欠落すると
いう課題が有る。
【0027】また、高能率音声符号化方式は、該フレー
ム内の情報のみを用いて符号化、復号化するのではな
く、過去のフレームの符号化結果、復号化結果も用いて
符号化、復号化しているので、音声符号切換により端末
B、端末Cで受けて復号化する符号系列において、中途
で音声符号Aと音声符号Bの符号が切り換わった場合、
過去の復号化結果との連続性が断たれるため、復号化し
て得られる出力音声が不連続になる。
【0028】音声切換によって音声符号Aと音声符号B
のみからなる符号系列を出力した場合、この符号系列を
復号化する際に符号切換が発生した時点を特定すること
はできないので、復号化して得られる出力音声が不連続
になるか否かを判定できず、不連続を解消する対策をと
ることができないという課題が有る。
【0029】また、業務通信における音声通信システム
などでは、2話者間の業務連絡通話の際、優先的にどち
らか一方の話者の指示や連絡などを、モニターしている
他のメンバーに伝達する必要がある場合がある。
【0030】音声符号Aと音声符号Bを音声レベルの大
小関係のみで切り換えた場合、優先的に送出が必要な話
者が選択されない場合が起こり、指示や連絡などの発声
内容が欠落するという課題が有る。
【0031】また、入力音声Bの符号は複数回伝送され
るので、伝送誤りが蓄積し、復号音声の品質が劣化する
という課題が有る。
【0032】この発明は、かかる課題を解決するために
なされたものであり、高能率な音声符号化方式を用いる
利点を生かしつつ、高品質な通話、モニターや会議通話
などを実現することが可能な音声符号切換方法を提供す
ることを目的としている。
【0033】
【課題を解決するための手段】
【0034】この発明に係る音声符号切換方法は、話者
Aによる入力音声を符号化した音声符号Aと、話者Bに
よる入力音声を符号化した音声符号Bとを入力とし、所
定時間のフレーム毎に音声符号Aと音声符号Bの一方を
選択して出力する音声符号切換方法であって、出力する
フレームの選択は過去の選択結果に基づいて行うように
した。
【0035】また、この発明に係る音声符号切換方法
は、話者Aによる入力音声を符号化した音声符号Aと、
話者Bによる入力音声を符号化した音声符号Bとを入力
とし、所定時間のフレーム毎に音声符号Aと音声符号B
の一方を選択して出力する音声符号切換方法であって、
音声符号Aと音声符号BをNフレーム分格納し、この格
納してあるNフレーム分の音声符号Aと音声符号Bに基
づいて、Nフレーム前の音声符号Aまたは音声符号Bの
一方を選択して出力するようにした。
【0036】また、この発明に係る音声符号切換方法
は、話者Aによる入力音声を符号化した音声符号Aと、
話者Bによる入力音声を符号化した音声符号Bとを入力
とし、所定時間のフレーム毎に音声符号Aと音声符号B
の一方を選択して出力する音声符号切換方法であって、
音声符号Aと音声符号Bの一方を選択判定時に両方の出
力が必要と判定したとき、前フレームでの非選択音声符
号を順次格納し、前フレームで選択した音声符号の出力
が不必要となったフレーム以降に、出力不要となった時
点まで格納していた音声符号系列を時間順に順次出力す
るようにした。
【0037】また、この発明に係る音声符号切換方法
は、前記格納しておいた音声符号系列を時間順に順次出
力する際に、現フレームの音声符号をその音声符号系列
の末尾に配置していき、格納してある音声符号系列の全
部もしくは一部が非音声区間であると判定されたとき
に、その区間の音声符号の末尾への配置を中止するか廃
棄するようにした。
【0038】また、この発明に係る音声符号切換方法
は、話者Aによる入力音声を符号化した音声符号Aと、
話者Bによる入力音声を符号化した音声符号Bとを入力
とし、所定時間のフレーム毎に音声符号Aと音声符号B
の一方を選択して出力する音声符号切換方法であって、
外部から何れか一方の音声符号を選択指示する所定入力
を受けつけたときに、その所定入力に従って一方の音声
符号を優先的に選択するようにした。
【0039】また、この発明に係る音声符号切換方法
は、話者Aによる入力音声を符号化した音声符号Aと、
話者Bによる入力音声を符号化した音声符号Bとを入力
とし、所定時間のフレーム毎に音声符号Aと音声符号B
の一方を選択して出力する音声符号切換方法であって、
音声符号Aが所定条件を満足するとき、音声符号Aを優
先的に選択するようにした。
【0040】また、この発明に係る音声符号切換方法
は、話者Aによる入力音声を符号化した音声符号Aと、
話者Bによる入力音声を符号化して変調し、さらに復調
した音声符号Bとを入力とし、所定時間のフレーム毎に
音声符号Aと音声符号Bの一方を選択して出力する音声
符号切換方法であって、前記各音声符号が、音声情報を
表す情報符号と、その誤り訂正符号によって構成され、
音声符号Bに対しては誤り訂正復号化および誤り訂正符
号化を行った後選択判定されて出力される。
【0041】また、この発明に係る音声符号切換方法
は、話者Aによる入力音声を符号化した音声符号Aと、
話者Bによる入力音声を符号化した音声符号Bとを入力
とし、所定時間のフレーム毎に音声符号Aと音声符号B
の一方を選択して出力する音声符号切換方法であって、
前記音声符号Aと音声符号Bが、その一部のみを用いて
も音声を復号できるスケーラブルな符号構成であり、音
声符号Aの一部である音声符号A’と音声符号Bの一部
である音声符号B’を組み合わせた符号を、選択して出
力する候補の一つとする。
【0042】また、この発明に係る音声符号切換方法
は、選択出力される音声符号が切り変わった時点のフレ
ームは、そのフレームの出力に先立ち 選択音声符号を
識別可能な情報を出力し、この情報の出力の後に、選択
された音声符号の順次出力を行う。
【0043】この発明に係る音声符号切換手段は、話者
Aによる入力音声を符号化した音声符号Aと、話者Bに
よる入力音声を符号化した音声符号Bとを入力し、所定
時間のフレーム毎に音声符号Aと音声符号Bの一方を選
択して出力する制御手段を備える音声符号切換手段であ
って、制御手段は出力するフレームの選択を過去の選択
結果に基づいて行う構成された。
【0044】この発明に係る音声通信端末は、話者Aに
よる入力音声を符号化した音声符号Aと、話者Bによる
入力音声を符号化した音声符号Bとが、その一部のみを
用いても音声を復号できるスケーラブルな符号構成であ
り、音声符号Aの一部である音声符号A’と音声符号B
の一部である音声符号B’とを組み合わせた符号を入力
して復調する復調手段と、復調された音声符号A’と音
声符号B’とを分離する分離手段と、分離された音声符
号A’と音声符号B’とを夫々別個に復号し、出力音声
Aと出力音声Bとを出力する夫々の音声復号化手段と、
復号化された出力音声Aと出力音声Bとを加算する加算
手段と、加算手段の出力をD−A変換するD−A変換手
段とを備えた。
【0045】
【発明の実施の形態】以下図面を参照しながら、この発
明の実施の形態について説明する。
【0046】実施の形態1.図1は、この発明による音
声符号切換方法を用いる端末Aの構成を示す。なお、こ
の端末Aを図23の端末Aとして用いたものが、この発
明の実施の形態1による音声符号切換方法を適用した音
声通信システムの構成となる。図において、16はA−
D変換手段、17は音声符号化手段、30は切換手段、
18は変調手段、12は復調手段、13は音声復号化手
段、14はD−A変換手段である。31は切換手段30
を構成する制御手段、32は同じく切換手段30を構成
する選択手段である。
【0047】以下、図に基づいて動作を説明する。端末
Aには、話者Aが発声した音声が入力音声Aとして入力
される。また、回線Bを介して端末Bから変調信号Bが
入力される。復調手段12は、所定時間のフレーム毎に
前記変調信号Bを復調して、得られた音声符号Bを音声
復号化手段13と切換手段30内の制御手段31および
選択手段32に出力する。音声復号化手段13は、前記
音声符号Bを復号化し、得られたディジタル出力音声A
をD−A変換手段14に出力する。D−A変換手段14
は、前記ディジタル出力音声Aに対してディジタル・ア
ナログ変換(D−A変換)を行ってアナログ信号である
出力音声Aを出力する。
【0048】A−D変換手段16は、前記入力音声Aに
対してアナログ・ディジタル変換(A−D変換)を行っ
てディジタル信号であるディジタル入力音声Aを得る。
音声符号化手段17は、前記ディジタル入力音声Aを所
定時間のフレーム毎に符号化して、得られた音声符号A
を切換手段30内の制御手段31および選択手段32に
出力する。
【0049】切換手段30内の制御手段31は、入力さ
れた音声符号Aと音声符号Bおよび過去に制御手段31
において決定した音声符号の選択結果とから、所定の選
択基準に従って音声符号Aと音声符号Bの内の一方を選
択し、どちらを選択したかに関する情報を選択手段32
に出力する。
【0050】選択基準の一例としては、音声符号Aと音
声符号Bを実際に復号して、得られた2つの復号音声の
振幅Aと振幅Bおよび過去(m−1時点)の選択結果で
ある選択m−1に基づいて、図2に示すフローに従って
選択する方法がある。
【0051】図2は、2つの復号音声の振幅差がしきい
値thよりも大きい場合は振幅の大きい方を選択し、差
がしきい値thよりも小さい場合は過去の選択結果m−
1と同じものを選択する、として現在(m時点)の選択
結果である選択mを決定するものである。
【0052】このように構成することにより、話者Aと
話者Bの通話を傍受している端末Cにおいては、話者A
と話者Bが同時に発声した場合でも、その時点で会話を
主導していると考えれる、より声が大きい話者の発声が
出力音声Cとして得られるので、通話内容の把握に支障
をきたさない。
【0053】また、話者Aと話者Bの声の大きさの差が
十分に大きくない場合には選択結果の連続性を保つよう
にしているので、端末Cにおいて発声内容の把握に支障
をきたすほど短時間の間に話者Aと話者Bの発声が頻繁
に切り換わる、ということを回避することができる。
【0054】なお、図2において、振幅差のしきい値t
hは固定的な値であってもよいし、あるいは、音声符号
や復号音声の振幅、過去の選択結果や振幅のしきい値の
値などに応じて適応的に可変な値であってもよい。
【0055】選択手段32は、前記制御手段31から入
力された情報に従いスイッチを切り換えて、選択された
音声符号を音声符号A’として変調手段18に出力す
る。そして、変調手段18は、切換手段30から入力さ
れた音声符号A’をディジタル変調して、得られた変調
信号を変調信号Aとして、回線A10に出力する。
【0056】なお、上記実施の形態では、切換手段30
内の制御手段31における音声符号の選択基準として図
2に示す方法を用いているが、例えば図3や図4に示す
フローに従うとするなど、別の選択基準を用いる構成も
当然可能である。さらに、これらの複数の選択基準を適
応的に、あるいは外部からの指示により切り換えて用い
る構成も当然可能である。
【0057】図3は、過去(m−1時点)の選択結果で
ある選択m−1で選択されている話者の復号音声の振幅
が、しきい値thよりも小さく、かつ、選択m−1で選
択されていないもう一方の話者の振幅よりも小さい場合
には、選択m−1で選択されていない話者を選択し、そ
れ以外の場合は過去の選択結果m−1と同じものを選択
する、として現在(m時点)の選択結果を決定するもの
である。
【0058】また、図4は、過去(m−1時点)の選択
結果である選択m−1で選択されていない話者の復号音
声の振幅が、しきい値thよりも大きい場合には、選択
m−1で選択されていない話者を選択し、それ以外の場
合は過去の選択結果m−1と同じものを選択する、とし
て現在(m時点)の選択結果を決定するものである。
【0059】また、上記実施の形態では、現フレームに
おける音声符号を選択する際に、過去の選択結果として
直前のフレームのものだけを用いているが、それ以前の
フレームにおける選択結果を用いる構成も当然可能であ
る。
【0060】また、システムの構成が異なる場合でも、
この切換手段3の構成はそのままで、端末内の他の手段
の構成を変えて用いることも当然可能である。
【0061】この実施の形態1によれば、話者Aによる
入力音声を符号化した音声符号Aと、話者Bによる入力
音声を符号化した音声符号Bとを入力とし、所定時間の
フレーム毎に音声符号Aと音声符号Bの一方を選択して
出力する音声符号切換方法において、過去の選択結果に
基づいて、現フレームの選択を制御するようにしたの
で、選択結果の連続性を保つことができる効果がある。
【0062】この実施の形態1による音声符号切換方法
を、複数の端末間で2つの回線を共有して、2つの端末
間の通話を他の端末でも傍受することが可能なディジタ
ル化した音声通信システムに適用した場合に、通話ある
いは傍受の妨げになるほど頻繁に符号切換が発生するこ
とを抑制しつつ、2回の符号化およびダブルトーク音声
の符号化による大きな品質劣化を回避できる効果があ
る。
【0063】実施の形態2.図5は、この発明による実
施の形態2の音声符号切換方法を用いる端末Aの構成を
示す。なお、この端末Aを図23の端末Aとして用いた
ものが、この実施の形態2による音声符号切換方法を適
用した音声通信システムの構成となる。図において、3
0は切換手段、33、35は格納手段、34、36は遅
延手段、31は制御手段、32は選択手段である。この
実施の形態2は図1に示す実施の形態1と切換手段30
が異なり、他は同様であるので、同一符号を付し説明を
省略する。
【0064】以下、図に基づいて動作を説明する。端末
Aには、話者Aが発声した音声が入力音声Aとして入力
される。また、回線Bを介して端末Bから変調信号Bが
入力される。復調手段12は、前記変調信号Bを所定時
間のフレーム毎に復調して、得られた音声符号Bを音声
復号化手段13と切換手段30内の格納手段35および
遅延手段36に出力する。音声復号化手段13は、前記
音声符号Bを復号化し、得られたディジタル出力音声A
をD−A変換手段14に出力する。D−A変換手段14
は、前記ディジタル出力音声Aに対してディジタル・ア
ナログ変換(D−A変換)を行ってアナログ信号である
出力音声Aを出力する。
【0065】一方、A−D変換手段16は、前記話者A
の入力音声Aに対してアナログ・ディジタル変換(A−
D変換)を行ってディジタル信号であるディジタル入力
音声Aを得て、このディジタル入力音声Aを音声符号化
手段17に出力する。音声符号化手段17は、前記ディ
ジタル入力音声Aを所定時間のフレーム毎に符号化し
て、得られた音声符号Aを切換手段30内の格納手段3
3および遅延手段34に出力する。
【0066】切換手段30内の格納手段33は、入力さ
れた音声符号Aを過去Nフレーム分格納し、このNフレ
ーム分の音声符号を制御手段31に出力する。また、格
納手段35は、入力された音声符号Bを過去Nフレーム
分格納し、このNフレーム分の音声符号を制御手段31
に出力する。制御手段31は、入力されたNフレーム分
の音声符号AとNフレーム分の音声符号Bに基づいて、
Nフレーム前の音声符号AとNフレーム前の音声符号B
の内の一方を所定の選択基準に従って選択し、どちらを
選択したかに関する情報を選択手段32に出力する。
【0067】選択基準の一例としては、音声符号Aと音
声符号Bを実際に復号し、得られた復号音声を分析して
各フレーム毎に音声か非音声かを判定し、この判定結果
に基づいて、図6に示すフローに従って選択する方法が
ある。図6では、まずNフレーム前の音声符号Aの復号
音声の音声/非音声判定結果を状態Aとし、Nフレーム
前の音声符号Bの復号音声の音声/非音声判定結果を状
態Bとする。
【0068】また、Nフレーム前からの音声符号Aの復
号音声における音声区間または非音声区間が連続するフ
レーム数を継続長Aとし、Nフレーム前からの音声符号
Bの復号音声における音声区間または非音声区間が連続
するフレーム数を継続長Bとする。そして、状態Aと状
態Bのどちらか一方が音声で他方が非音声である場合
は、音声である方の音声符号を選択し、また、状態Aと
状態Bが両方とも音声である場合は、継続長Aと継続長
Bを比較して、その音声区間の継続長が長い方の音声符
号を選択し、さらに、両方とも非音声である場合は、継
続長Aと継続長Bを比較して非音声区間の継続長が短い
方の音声符号を選択する。
【0069】このように構成することにより、話者Aと
話者Bの通話を傍受している端末Cにおいては、話者A
と話者Bが同時に発声した場合でも、その時点で会話を
主導していると考えれる、より発声時間長が長い話者の
発声が出力音声Cとして得られるので、通話内容の把握
に支障をきたさない。
【0070】また、話者Aと話者Bの発声時間長が長い
話者の発声を選択するということは、選択結果の連続性
を保つことに継るので、端末Cにおいて発声内容の把握
に支障をきたすほど短時間の間に話者Aと話者Bの発声
が頻繁に切り換わる、ということを回避することができ
る。
【0071】遅延手段34は、前記音声符号化手段17
から入力された音声符号AをNフレーム分遅延させ、N
フレーム前の音声符号Aを選択手段32に出力する。ま
た、遅延手段36は、前記復調手段12から入力された
音声符号BをNフレーム分遅延させ、Nフレーム前の音
声符号Bを選択手段32に出力する。選択手段32は、
前記制御手段31から入力された情報に従いスイッチを
切り換えて、選択された音声符号を音声符号A’として
変調手段18に出力する。そして、変調手段18は、切
換手段30から入力された音声符号A’をディジタル変
調して、得られた変調信号を変調信号Aとして、回線A
に出力する。
【0072】なお、上記実施の形態では、切換手段30
内の制御手段31において復号音声を分析して音声/非
音声判定をしているが、音声符号に含まれるパラメータ
から直接音声/非音声を決定する構成も当然可能であ
る。
【0073】また、上記実施の形態では、音声/非音声
判定結果のみを符号切換の選択基準に用いているが、復
号音声の振幅や、過去の選択結果など、他の情報を選択
基準に用いる構成も当然可能である。
【0074】また、選択手段32、遅延手段34、36
を無くして、制御手段31がNフレーム前の一方の音声
符号を選択し、この音声符号を出力するようにして、遅
延のためのメモリを省く構成も可能である。
【0075】この実施の形態2によれば、話者Aによる
入力音声を符号化した音声符号Aと、話者Bによる入力
音声を符号化した音声符号Bとを入力とし、所定時間の
フレーム毎に音声符号Aと音声符号Bの一方を選択して
出力する音声符号切換方法において、音声符号Aと音声
符号BをNフレーム分格納しておき、この格納してある
Nフレーム分の音声符号Aと音声符号Bに基づいて、N
フレーム前の音声符号Aと音声符号Bの一方を選択して
出力するようにしたので、通話を主導している話者の符
号を的確に選択でき、また、選択結果の連続性を保つこ
とができる効果がある。
【0076】この実施の形態2による音声符号切換方法
を、複数の端末間で2つの回線を共有して、2つの端末
間の通話を他の端末でも傍受することが可能なディジタ
ル化した音声通信システムに適用した場合に、通話を主
導する話者の発声内容が欠落すること無く、また、符号
切換の頻繁な発生を抑制しつつ、2回の符号化およびダ
ブルトーク音声の符号化による大きな品質劣化を回避で
きる効果がある。
【0077】実施の形態3.図7は、この発明による実
施の形態3の音声符号切換方法を用いる端末Aの構成を
示す。なお、この端末Aを図23の端末Aとして用いた
ものが、本発明による音声符号切換方法を適用した音声
通信システムの構成となる。図において、30は切換手
段、31は制御手段、32は選択手段、40は格納手
段、41は第2選択手段である。この実施の形態3は図
1に示す実施の形態1と切換手段30が異なり、他は同
様であるので、同一符号を付し説明を省略する。
【0078】以下、図に基づいて動作を説明する。端末
Aには、話者Aが発声した音声が入力音声Aとして入力
される。また、回線Bを介して端末Bから変調信号Bが
入力される。復調手段12は、所定時間のフレーム毎に
前記変調信号Bを復調して、得られた音声符号Bを音声
復号化手段13と切換手段30内の制御手段31と第2
の選択手段41および選択手段32に出力する。音声復
号化手段13は、前記音声符号Bを復号化し、得られた
ディジタル出力音声AをD−A変換手段14に出力す
る。D−A変換手段14は、前記ディジタル出力音声A
に対してディジタル・アナログ変換(D−A変換)を行
ってアナログ信号である出力音声Aを出力する。
【0079】一方、A−D変換手段16は、前記入力音
声Aに対してアナログ・ディジタル変換(A−D変換)
を行ってディジタル信号であるディジタル入力音声Aを
得て、このディジタル入力音声Aを音声符号化手段17
に出力する。音声符号化手段17は、前記ディジタル入
力音声Aを所定時間のフレーム毎に符号化して、得られ
た音声符号Aを切換手段30内の制御手段31と選択手
段32および第2選択手段41に出力する。
【0080】切換手段30内の制御手段31は、例えば
入力された音声符号A、音声符号B、および過去に決定
した第2選択手段41への選択結果から把握できる格納
手段40の格納状況から所定の選択基準に従って、格納
手段40に格納する符号に関する選択情報を第2選択手
段41に及び、変調手段18へ出力する符号に関する選
択情報を選択手段32に出力する。
【0081】選択基準の一例としては、音声符号Aと音
声符号Bを実際に復号し、得られた復号音声を分析して
各フレーム毎に音声か非音声かを判定し、この判定結果
と格納手段40における音声符号の格納状況および過去
の選択結果に基づいて、図8の表に従って選択する方法
がある。
【0082】図8では、まず音声符号Aの復号音声の音
声/非音声判定結果を状態Aとし、音声符号Bの復号音
声の音声/非音声判定結果を状態Bとする。また、格納
手段40における音声符号の格納状況を状況Mとする。
さらに、過去(m−1時点)の選択手段32における選
択結果を選択32m−1、現在(m時点)の選択手段3
2における選択結果を選択32m、第2選択手段41に
おける選択結果を選択41mとする。
【0083】そして、状態A、状態B、および状況Mの
うち、どれか一つが音声あるいは符号有りの場合にはそ
の音声符号を選択し出力する。また、二つ以上が音声あ
るいは符号有りの場合には現在出力している音声符号を
優先して選択して出力し、音声符号A、音声符号Bのう
ちの出力しない方の音声符号を格納手段40に格納す
る。
【0084】このように構成することにより、話者Aと
話者Bが同時に発声した場合でも、一方の話者の発声が
終了するまで他方の話者の発声を格納しておき、一方の
話者の発声が終了するのを待って格納しておいた他方の
話者の発声を出力することができるので、話者Aと話者
Bの通話を傍受している端末Cにおいては両者の通話内
容が欠落することが無く、通話内容の把握に支障をきた
さない。
【0085】第2選択手段41は、前記制御手段31か
ら入力された情報に従いスイッチを切り換えて、選択さ
れた音声符号を格納手段40に出力する。格納手段40
は、例えばFIFO型の記憶バッファであり、前記第2
選択手段41から入力された音声符号系列を格納し、こ
の音声符号系列を時間順に順次選択手段32へ出力す
る。
【0086】また、選択手段32は、前記制御手段31
から入力された情報に従いスイッチを切り換えて、選択
された音声符号を音声符号A’として変調手段18に出
力する。そして、変調手段18は、切換手段30から入
力された音声符号A’をディジタル変調して、得られた
変調信号を変調信号Aとして、回線Aに出力する。
【0087】なお、上記実施の形態では、切換手段30
内の制御手段31において復号音声を分析して音声/非
音声判定をしているが、音声符号に含まれるパラメータ
から直接音声/非音声を決定する構成も当然可能であ
る。
【0088】また、上記実施の形態では、音声/非音声
判定結果を符号切換の選択基準に用いているが、復号音
声の振幅など、他の情報を選択基準に用いる構成も当然
可能である。
【0089】また、上記実施の形態では、切換手段30
内の制御手段31における符号の選択基準として図8の
表に示す方法を用いているが、別の選択基準を用いる構
成も当然可能である。さらに、複数の選択基準を適応的
に、あるいは外部からの指示により切り換えて用いる構
成も当然可能である。
【0090】この実施の形態3によれば、話者Aによる
入力音声を符号化した音声符号Aと、話者Bによる入力
音声を符号化した音声符号Bとを入力とし、所定時間の
フレーム毎に音声符号Aと音声符号Bの一方を選択して
出力する音声符号切換方法において、音声符号Aと音声
符号Bの両方の選択出力が必要と判定したときに、前フ
レームで選択していなかった方の音声符号を順次格納し
ていき、前フレームで選択していた音声符号の選択出力
が不必要となったフレーム以降に、それまで格納してお
いた音声符号系列を時間順に順次出力するようにしたの
で、必要な音声符号が欠落することがないという効果が
ある。
【0091】この実施の形態3による音声符号切換方法
を、複数の端末間で2つの回線を共有して、2つの端末
間の通話を他の端末でも傍受することが可能なディジタ
ル化した音声通信システムに適用した場合に、通話内容
が欠落することなく、2回の符号化およびダブルトーク
音声の符号化による大きな品質劣化を回避できる効果が
ある。
【0092】さらに、格納しておいた音声符号系列を時
間順に順次出力する際に、現フレームの音声符号をその
音声符号系列の末尾に格納していき、格納する音声符号
系列が非音声区間であると判定されたときに、その区間
の音声符号の格納を中止するようにしたので、通話内容
に無関係な非音声区間を記憶する必要が無く、符号の格
納に必要な記憶容量を小さくすることができるので、装
置化規模を小さくできる効果がある。
【0093】実施の形態4.図9は、この発明による実
施の形態4の音声符号切換方法を用いる端末Aの構成を
示す。なお、この端末Aを図23の端末Aとして用いた
ものが、本発明による音声符号切換方法を適用した音声
通信システムの構成となる。図において、30は切換手
段、31は制御手段、32は選択手段、40は格納手
段、42は第2格納手段である。この実施の形態4は図
1に示す実施の形態1と切換手段30が異なり、他は同
様であるので、同一符号を付し説明を省略する。
【0094】以下、図に基づいて動作を説明する。端末
Aには、話者Aが発声した音声が入力音声Aとして入力
される。また、回線Bを介して端末Bから変調信号Bが
入力される。復調手段12は、所定時間のフレーム毎に
前記変調信号Bを復調して、得られた音声符号Bを音声
復号化手段13と切換手段30内の制御手段31と格納
手段42および選択手段32に出力する。音声復号化手
段13は、前記音声符号Bを復号化し、得られたディジ
タル出力音声AをD−A変換手段14に出力する。D−
A変換手段14は、前記ディジタル出力音声Aに対して
ディジタル・アナログ変換(D−A変換)を行ってアナ
ログ信号である出力音声Aを出力する。
【0095】A−D変換手段16は、前記入力音声Aに
対してアナログ・ディジタル変換(A−D変換)を行っ
てディジタル信号であるディジタル入力音声Aを得て、
このディジタル入力音声Aを音声符号化手段17に出力
する。音声符号化手段17は、前記ディジタル入力音声
Aを所定時間のフレーム毎に符号化して、得られた音声
符号Aを切換手段30内の制御手段31と格納手段40
および選択手段32に出力する。
【0096】切換手段30内の制御手段31は、例えば
入力された音声符号Aと音声符号Bおよび格納手段40
と格納手段42における過去に決定した音声符号の格納
状況から、所定の選択基準に従って、音声符号Aを格納
するかどうかの情報を格納手段40に、音声符号Bを格
納するかどうかの情報を格納手段42に、変調手段18
へ出力する符号に関する選択情報を選択手段32に出力
する。
【0097】選択基準の一例としては、音声符号Aと音
声符号Bを実際に復号し、得られた復号音声を分析して
各フレーム毎に音声か非音声かを判定し、この判定結果
と格納手段40、格納手段42における音声符号の格納
状況および過去の選択結果に基づいて、図10にその一
部を示す表に従って選択する方法がある。図10では、
まず音声符号Aの復号音声の音声/非音声判定結果を状
態Aとし、音声符号Bの復号音声の音声/非音声判定結
果を状態Bとする。また、格納手段40における格納状
況を状況MAとし、格納手段42における格納状況を状
況MBとする。さらに、過去(m−1時点)の選択手段
32における選択結果を選択m−1、現在(m時点)の
選択手段32における選択結果を選択mとする。
【0098】そして、状態A、状態B、状況MAおよび
状況MBのうち、どれか一つが音声あるいは符号有りの
場合にはその音声符号を選択し出力する。また、二つ以
上が音声あるいは符号有りの場合には現在出力している
符号を優先して選択して出力し、音声符号A、音声符号
Bのうちの出力しない方の音声符号を格納手段40また
は格納手段42に格納する。このように構成することに
より、話者Aと話者Bが同時に発声した場合でも、一方
の話者の発声が終了するまで他方の話者の発声を格納し
ておき、一方の話者の発声が終了するのを待って格納し
ておいた他方の話者の発声を出力することができ、
【0099】また、1つの格納手段に音声符号Aと音声
符号Bを切り換えて格納するのではなく、音声符号A用
と音声符号B用の2つの格納手段を備えることにより、
格納しておいた話者の発声を出力している最中に、また
話者Aと話者Bが同時に発声した場合でも両話者の音声
符号を同時に格納し記憶できるので、話者Aと話者Bの
通話を傍受している端末Cにおいては両者の通話内容が
欠落することが無く、通話内容の把握に支障をきたさな
い。
【0100】格納手段40は、例えばFIFO型の記憶
バッファであり、前記制御手段31から入力された音声
符号Aを格納するかどうかの情報に従い、音声符号化手
段17から入力された音声符号系列を格納し、この音声
符号系列を時間順に順次選択手段32へ出力する。ま
た、格納手段42は、例えばFIFO型の記憶バッファ
であり、前記制御手段31から入力された音声符号Bを
格納するかどうかの情報に従い、復調手段12から入力
された音声符号系列を格納し、この音声符号系列を時間
順に順次選択手段32へ出力する。
【0101】選択手段32は、前記制御手段31から入
力された情報に従いスイッチを切り換えて、選択された
音声符号AまたはBを音声符号A’として変調手段18
に出力する。そして、変調手段18は、切換手段30か
ら入力された音声符号A’をディジタル変調して、得ら
れた変調信号を変調信号Aとして、回線Aに出力する。
【0102】なお、上記実施の形態では、切換手段30
内の制御手段31において復号音声を分析して音声/非
音声判定をしているが、音声符号に含まれるパラメータ
から直接音声/非音声を決定する構成も当然可能であ
る。
【0103】また、上記実施の形態では、音声/非音声
判定結果を符号切換の選択基準に用いているが、復号音
声の振幅など、他の情報を選択基準に用いる構成も当然
可能である。
【0104】また、上記実施の形態では、切換手段30
内の制御手段31における符号の選択基準として図10
にその一部を示す表に従う方法を用いているが、別の選
択基準を用いる構成も当然可能である。さらに、複数の
選択基準を適応的に、あるいは外部からの指示により切
り換えて用いる構成も当然可能である。
【0105】この実施の形態4によれば、話者Aによる
入力音声を符号化した音声符号Aと、話者Bによる入力
音声を符号化した音声符号Bとを入力とし、所定時間の
フレーム毎に音声符号Aと音声符号Bの一方を選択して
出力する音声符号切換方法において、音声符号Aと音声
符号Bの両方の選択出力が必要と判定したときに、前フ
レームで選択していなかった方の音声符号を順次格納し
ていき、前フレームで選択していた音声符号の選択出力
が不必要となったフレーム以降に、それまで格納してお
いた音声符号系列を時間順に順次出力するようにしたの
で、必要な音声符号が欠落することがないという効果が
ある。
【0106】さらに、音声符号Aと音声符号Bをそれぞ
れ個別に格納する手段を備えたので、この実施の形態4
による音声符号切換方法を、複数の端末間で2つの回線
を共有して、2つの端末間の通話を他の端末でも傍受す
ることが可能なディジタル化した音声通信システムに適
用した場合に、格納しておいた音声符号系列を出力中に
話者A、話者Bが同時に発声しても通話内容が欠落する
ことなく、2回の符号化およびダブルトーク音声の符号
化による大きな品質劣化を回避できる効果がある。
【0107】実施の形態5.図11は、この発明による
実施の形態5の音声符号切換方法を用いる端末Aの構成
を示す。なお、この端末Aを図23の端末Aとして用い
たものが、本発明による音声符号切換方法を適用した音
声通信システムの構成となる。図において、30は切換
手段、31は制御手段、32は選択手段、40は格納手
段、42は第2格納手段、43は変更符号生成手段であ
る。この実施の形態5は図1に示す実施の形態1と切換
手段30が異なり、他は同様であるので、同一符号を付
し説明を省略する。
【0108】以下、図に基づいて動作を説明する。端末
Aには、話者Aが発声した音声が入力音声Aとして入力
される。また、回線Bを介して端末Bから変調信号Bが
入力される。復調手段12は、所定時間のフレーム毎に
前記変調信号Bを復調して、得られた音声符号Bを音声
復号化手段13と切換手段30内の制御手段31と格納
手段42および選択手段32に出力する。音声復号化手
段13は、前記音声符号Bを復号化し、得られたディジ
タル出力音声AをD−A変換手段14に出力する。D−
A変換手段14は、前記ディジタル出力音声Aに対して
ディジタル・アナログ変換(D−A変換)を行ってアナ
ログ信号である出力音声Aを出力する。
【0109】A−D変換手段16は、前記入力音声Aに
対してアナログ・ディジタル変換(A−D変換)を行っ
てディジタル信号であるディジタル入力音声Aを得て、
このディジタル入力音声Aを音声符号化手段17に出力
する。音声符号化手段17は、前記ディジタル入力音声
Aを所定時間のフレーム毎に符号化して、得られた音声
符号Aを切換手段30内の制御手段31と格納手段40
および選択手段32に出力する。
【0110】切換手段30内の制御手段31は、例えば
入力された音声符号Aと音声符号Bおよび格納手段40
と格納手段42における過去に決定した音声符号の格納
状況から、所定の選択基準に従って、音声符号Aを格納
するかどうかの情報を格納手段40に、音声符号Bを格
納するかどうかの情報を格納手段42に、変調手段18
へ出力する符号に関する選択情報を選択手段32に出力
する。
【0111】選択基準の一例としては、音声符号Aと音
声符号Bを実際に復号し、得られた復号音声を分析して
各フレーム毎に音声か非音声かを判定し、この判定結果
と格納手段40、格納手段42における音声符号の格納
状況および過去の選択結果に基づいて、図12にその一
部を示す表に従って選択する方法がある。
【0112】図12では、まず音声符号Aの復号音声の
音声/非音声判定結果を状態Aとし、音声符号Bの復号
音声の音声/非音声判定結果を状態Bとする。また、格
納手段40における格納状況を状況MAとし、格納手段
42における格納状況を状況MBとする。さらに、過去
(m−2時点)の選択手段32における選択結果を選択
m−2、過去(m−1時点)の選択手段32における選
択結果を選択m−1、現在(m時点)の選択手段32に
おける選択結果を選択mとする。
【0113】そして、音声符号A’として出力する符号
が、音声符号Aまたは格納手段40に格納されている符
号から音声符号Bまたは格納手段42に格納されている
符号に変更される場合、あるいはその逆で音声符号Bま
たは格納手段42に格納されている符号から音声符号A
または格納手段40に格納されている符号に変更される
場合には、変更符号生成手段43から出力されるその変
更を示す符号を選択し、出力する。
【0114】このように構成することにより、話者Aと
話者Bの通話を傍受している端末Cにおいては、符号切
換時点を認識できるので、この符号切換時点に発生する
可能性がある出力音声Cの不連続性を予め察知し、緩和
するなどの特別な処理を行うことができ、通話品質を向
上することができる。
【0115】格納手段40は、例えばFIFO型の記憶
バッファであり、前記制御手段31から入力された音声
符号Aを格納するかどうかの情報に従い、音声符号化手
段17から入力された音声符号系列を格納し、この音声
符号系列を時間順に順次選択手段32へ出力する。
【0116】また、格納手段42は、例えばFIFO型
の記憶バッファであり、前記制御手段31から入力され
た音声符号Bを格納するかどうかの情報に従い、復調手
段12から入力された音声符号系列を格納し、この音声
符号系列を時間順に順次選択手段32へ出力する。
【0117】また、変更符号生成手段43は、音声符号
の切り換わりを示す特別な符号Cを生成し、選択手段3
2に出力する。選択手段32は、前記制御手段31から
入力された情報に従いスイッチを切り換えて、選択され
た音声符号を音声符号A’として変調手段18に出力す
る。そして、変調手段18は、切換手段30から入力さ
れた音声符号A’をディジタル変調して、得られた変調
信号を変調信号Aとして、回線Aに出力する。
【0118】なお、上記実施の形態では、切換手段30
内の制御手段31において復号音声を分析して音声/非
音声判定をしているが、音声符号に含まれるパラメータ
から直接音声/非音声を決定する構成も当然可能であ
る。
【0119】また、上記実施の形態では、音声/非音声
判定結果を符号切換の選択基準に用いているが、復号音
声の振幅など、他の情報を選択基準に用いる構成も当然
可能である。
【0120】また、上記実施の形態では、切換手段30
内の制御手段31における符号の選択基準として図12
にその一部を示す表に従う方法を用いているが、別の選
択基準を用いる構成も当然可能である。さらに、複数の
選択基準を適応的に、あるいは外部からの指示により切
り換えて用いる構成も当然可能である。
【0121】また、上記実施の形態で、変更符号生成手
段43から出力される符号は単一でもよいし、音声符号
Aから音声符号Bへの変更を示す符号と、音声符号Bか
ら音声符号Aへの変更を示す符号とを異なるものにする
など、複数の符号を用いる構成も当然可能である。
【0122】この実施の形態5によれば、話者Aによる
入力音声を符号化した音声符号Aと、話者Bによる入力
音声を符号化した音声符号Bとを入力とし、所定時間の
フレーム毎に音声符号Aと音声符号Bの一方を選択して
出力する音声符号切換方法において、音声符号Aと音声
符号Bの選択が変わるフレームにおいて、選択が変わる
ことを示す情報をそのフレームの音声符号として出力
し、その選択が変わることを示す情報の出力の後に、格
納しておいた音声符号系列の順次出力を行うようにした
ので、出力された音声符号系列から音声符号Aと音声符
号Bの切り換わる時点を正確に認識できるという効果が
ある。
【0123】この実施の形態5による音声符号切換方法
を、複数の端末間で2つの回線を共有して、2つの端末
間の通話を他の端末でも傍受することが可能なディジタ
ル化した音声通信システムに適用した場合に、出力音声
の不連続が発生する可能性がある符号切換時点を認識で
きるので、この不連続を解消する特別な処理を行うなど
の対処が可能となり、通話品質を向上することができる
効果がある。
【0124】実施の形態6.図13は、この発明による
音声符号切換方法を用いる端末Aの構成を示す。なお、
この端末Aを図23の端末Aとして用いたものが、本発
明による音声符号切換方法を適用した音声通信システム
の構成となる。図において、30は切換手段、31は制
御手段、32は選択手段である。この実施の形態6は図
1に示す実施の形態1と切換手段30内の制御手段31
の構成、即ち、制御手段31に音声符号の優先的な選択
に関する指示である外部入力Eが入力される点が異な
り、他は同様であるので、同一符号を付し説明を省略す
る。
【0125】以下、図に基づいて動作を説明する。端末
Aには、話者Aが発声した音声が入力音声Aとして入力
される。また、回線Bを介して端末Bから変調信号Bが
入力される。さらに、前記のように音声符号の優先的な
選択に関する指示である外部入力Eが入力される。復調
手段12は、所定時間のフレーム毎に前記変調信号Bを
復調して、得られた音声符号Bを音声復号化手段13と
切換手段30内の制御手段31および選択手段32に出
力する。音声復号化手段13は、前記音声符号Bを復号
化し、得られたディジタル出力音声AをD−A変換手段
14に出力する。D−A変換手段14は、前記ディジタ
ル出力音声Aに対してディジタル・アナログ変換(D−
A変換)を行ってアナログ信号である出力音声Aを出力
する。
【0126】A−D変換手段16は、前記入力音声Aに
対してアナログ・ディジタル変換(A−D変換)を行っ
てディジタル信号であるディジタル入力音声Aを得る。
音声符号化手段17は、前記ディジタル入力音声Aを所
定時間のフレーム毎に符号化して、得られた音声符号A
を切換手段30内の制御手段31および選択手段32に
出力する。制御手段31は、入力された音声符号Aと音
声符号Bの内の一方を、前記外部入力Eおよび所定の選
択基準に従って選択し、どちらを選択したかに関する情
報を選択手段32に出力する。
【0127】選択基準の一例としては、外部入力Eから
の指示と、音声符号Aと音声符号Bを実際に復号して、
得られた2つの復号音声の振幅Aと振幅B、および過去
(m−1時点)の選択結果である選択m−1に基づい
て、図14に示すフローに従って選択する方法がある。
図14は、外部入力Eから指示がある場合は、指示され
た音声符号を選択し、外部入力Eからの指示がない場合
は、2つの復号音声の振幅差がしきい値thよりも大き
い場合は振幅の大きい方を選択し、差がしきい値thよ
りも小さい場合は過去の選択結果m−1と同じものを選
択する、として現在(m時点)の選択結果である選択m
を決定するものである。
【0128】このように構成することにより、話者Aと
話者Bの通話を傍受している端末Cに対して、話者Aと
話者Bが同時に発声した場合でも優先的に通知したい内
容を送出できるので、指示や連絡などを確実に行うこと
ができる。
【0129】選択手段32は、前記制御手段31から入
力された情報に従いスイッチを切り換えて、選択された
音声符号を音声符号A’として変調手段18に出力す
る。そして、変調手段18は、切換手段30から入力さ
れた音声符号A’をディジタル変調して、得られた変調
信号を変調信号Aとして、回線Aに出力する。
【0130】なお、上記実施の形態では、切換手段30
内の制御手段31における符号の選択基準として図14
に示す方法を用いているが、別の選択基準を用いる構成
も当然可能である。さらに、複数の選択基準を適応的
に、あるいは外部からの指示により切り換えて用いる構
成も当然可能である。
【0131】また、上記実施の形態では、実施の形態1
を基に外部から所定入力を受けつけ、その所定入力に従
って一方の音声符号を優先的に選択するようにしている
が、別の実施の形態を基にする構成も当然可能である。
【0132】この実施の形態6によれば、話者Aによる
入力音声を符号化した音声符号Aと、話者Bによる入力
音声を符号化した音声符号Bとを入力とし、所定時間の
フレーム毎に音声符号Aと音声符号Bの一方を選択して
出力する音声符号切換方法において、外部からの所定入
力を受けつけたときに、その所定入力に従って一方の音
声符号を優先的に選択するようにしたので、所望の音声
符号を確実に送出できる効果がある。
【0133】この実施の形態6による音声符号切換方法
を、複数の端末間で2つの回線を共有して、2つの端末
間の通話を他の端末でも傍受することが可能なディジタ
ル化した音声通信システムに適用した場合に、優先的に
通知したい内容を送出でき、指示や連絡などを確実に行
うことができる効果がある。
【0134】実施の形態7.この実施の形態7の音声符
号切換方法を用いる端末Aの構成は、図1に示す実施の
形態1と同様である。図15は、この発明による実施の
形態7の音声符号切換方法における端末Aの切換手段3
0内の制御手段31で用いる符号の選択基準を示す。
【0135】図15では、音声符号Aと音声符号Bを復
号して得られた復号音声の振幅および過去の選択結果に
基づいて、音声符号Aの復号音声の振幅があるしきい値
THよりも大きい場合には優先的に音声符号Aを選択す
る。それ以外の時は上記実施の形態1と同様な基準に基
づいて選択する。このように構成することにより、話者
Aと通話している話者B及び他の端末で傍受している者
に対して、優先的に話者Aの発声内容を送出できるの
で、指示や連絡などを確実に行うことができる。
【0136】なお、上記実施の形態で、図15に示すの
とは別の選択基準を用いる構成も当然可能である。さら
に、複数の選択基準を適応的に、あるいは外部からの指
示により切り換えて用いる構成も当然可能である。
【0137】また、上記実施の形態では、実施の形態1
を基に音声符号Bによらずに、音声符号Aが所定条件を
満足するときに優先的に選択する例外条件を持たせるよ
うにしているが、別の実施の形態を基にする構成も当然
可能である。
【0138】この実施の形態7によれば、話者Aによる
入力音声を符号化した音声符号Aと、話者Bによる入力
音声を符号化した音声符号Bとを入力とし、一定時間の
フレーム毎に音声符号Aと音声符号Bの一方を選択して
出力する音声符号切換方法において、音声符号Bによら
ずに、音声符号Aが所定条件を満足するときに優先的に
選択する例外条件を持たせるようにしたので、音声符号
Aを確実に送出できる効果がある。
【0139】この実施の形態7による音声符号切換方法
を、複数の端末間で2つの回線を共有して、2つの端末
間の通話を他の端末でも傍受することが可能なディジタ
ル化した音声通信システムに適用した場合に、通話者間
では通話内容が欠落することがなく、指示や連絡などを
確実に行うことができる効果がある。
【0140】実施の形態8.図16は、この発明による
実施の形態8の音声符号切換方法を用いる端末Aの構成
を示す。この実施の形態8は上記実施の形態1に誤り訂
正処理を付加したものである。なお、この端末Aを図2
3の端末Aとして用いたものが、この発明による音声符
号切換方法を適用した音声通信システムの構成となる。
【0141】図において、45は音声符号化手段17か
らの情報符号Aに誤り訂正符号Aを付加して音声符号A
として出力する誤り訂正符号化手段、46は復調手段1
2からの音声符号Bの誤り訂正符号Bを復号する誤り訂
正復号化手段、30は切換手段、31は制御手段、32
は選択手段である。47は上記切換手段30内の誤り訂
正復号化手段、48は同じく上記切換手段30内の誤り
訂正符号化手段である。なお、図1と同一符号は同一ま
たは相当部分を示すので説明を省略する。
【0142】以下、図に基づいて動作を説明する。端末
Aには、話者Aが発声した音声が入力音声Aとして入力
される。また、回線Bを介して端末Bから変調信号Bが
入力される。復調手段12は、所定時間のフレーム毎に
前記変調信号Bを復調して、得られた音声符号Bを誤り
訂正復号化手段46と切換手段30内の誤り訂正復号化
手段47に出力する。
【0143】前記音声符号Bは、音声情報を表す情報符
号Bと、その誤り訂正符号Bによって構成される。誤り
訂正復号化手段46は、前記音声符号Bに誤り訂正を施
して得られた情報符号Bを音声復号化手段13に出力す
る。
【0144】音声復号化手段13は、前記情報符号Bを
復号化し、得られたディジタル出力音声AをD−A変換
手段14に出力する。D−A変換手段14は、前記ディ
ジタル出力音声Aに対してディジタル・アナログ変換
(D−A変換)を行ってアナログ信号である出力音声A
を出力する。
【0145】A−D変換手段16は、前記入力音声Aに
対してアナログ・ディジタル変換(A−D変換)を行っ
てディジタル信号であるディジタル入力音声Aを得る。
音声符号化手段17は、前記ディジタル入力音声Aを所
定時間のフレーム毎に符号化して、得られた情報符号A
を誤り訂正符号化手段45に出力する。誤り訂正符号化
手段45は、前記情報符号Aに誤り訂正符号Aを付加し
て音声符号Aとし、この音声符号Aを切換手段30内の
制御手段31および選択手段32に出力する。
【0146】切換手段30内の誤り訂正復号化手段47
は、入力された音声符号Bに誤り訂正を施して得られた
情報符号Bを誤り訂正符号化手段48に出力する。誤り
訂正符号化手段48は、前記情報符号Bに誤り訂正符号
B’を付加して音声符号B’とし、この音声符号B’を
制御手段31と選択手段32に出力する。このように構
成することにより、音声符号B’は回線Bにおける伝送
誤りの影響が解消されるので、回線Aに出力した場合に
は回線Aの伝送誤りの影響のみ受け、回線Bと回線Aの
両回線の誤りの影響が累積することを回避できる。
【0147】制御手段31は、入力された音声符号Aと
音声符号B’の内の一方を所定の選択基準、例えば実施
の形態1に示す基準に従って選択し、どちらを選択した
かに関する情報を選択手段32に出力する。選択手段3
2は、前記制御手段31から入力された情報に従いスイ
ッチを切り換えて、選択された音声符号を音声符号A’
として変調手段18に出力する。そして、変調手段18
は、切換手段30から入力された音声符号A’をディジ
タル変調して、得られた変調信号を変調信号Aとして、
回線Aに出力する。
【0148】なお、上記実施の形態では、実施の形態1
を基に音声符号Bに対して誤り訂正復号化および誤り訂
正符号化を行うようにしているが、別の実施の形態を基
にする構成も当然可能である。
【0149】また、上記実施の形態において誤り訂正符
号化手段45と誤り訂正符号化手段48の動作は同じで
あるので、図17に示すように誤り訂正符号化手段45
の位置を切換手段30と変調手段18の間に移動するこ
とにより、誤り訂正符号化手段48を無くす構成も当然
可能である。
【0150】また、上記実施の形態において誤り訂正復
号化手段46と誤り訂正復号化手段47の動作は同じで
あるので、図18に示すように誤り訂正復号化手段46
の位置を切換手段30と復調手段12の間に移動するこ
とにより、誤り訂正復号化手段47を無くす構成も当然
可能である。
【0151】この実施の形態8によれば、話者Aによる
入力音声を符号化した音声符号Aと、話者Bによる入力
音声を符号化した音声符号Bとを入力とし、一定時間の
フレーム毎に音声符号Aと音声符号Bの一方を選択して
出力する音声符号切換方法において、各音声符号が、音
声情報を表す情報符号と、その誤り訂正符号によって構
成され、音声符号Bに対して誤り訂正復号化および誤り
訂正符号化を行うようにしたので、伝送誤りの影響の無
い音声符号を出力できる効果がある。
【0152】この実施の形態8による音声符号切換方法
を、複数の端末間で2つの回線を共有して、2つの端末
間の通話を他の端末でも傍受することが可能なディジタ
ル化した音声通信システムに適用した場合に、複数の回
線を通過する音声符号Bに対して各回線毎の伝送誤りが
累積することを回避でき、品質の高い通話を実現できる
効果がある。
【0153】実施の形態9.図19は、この発明による
実施の形態9の音声符号切換方法を用いる端末Aの構成
を示す。また、図20は、この端末Aを用いた音声通信
システムの構成を示す。図19において、30は切換手
段、31は制御手段、50、51は符号抽出手段、52
は符号組合せ手段、32は選択手段である。この実施の
形態9の端末Aは図1に示す実施の形態1と切換手段3
0が異なり、他は同様であるので、同一符号を付し説明
を省略する。また図20において、53、54は分離手
段、55は音声復号化手段、56は加算手段である。な
お、図23と同一符号は同一または相当部分を示し説明
を省略する。
【0154】以下、図に基づいて動作を説明する。端末
Aには、話者Aが発声した音声が入力音声Aとして入力
される。また、回線Bを介して端末Bから変調信号Bが
入力される。復調手段12は、前記変調信号Bを復調し
て、得られた音声符号Bを音声復号化手段13と切換手
段30内の制御手段31、符号抽出手段51および選択
手段32に出力する。ここで、音声符号Bは音声符号B
0と音声符号B1の2つの部分からなる2段階のスケー
ラブル符号構成としており、音声符号B0のみ用いても
品質はやや劣化するものの了解できる音声を復号できる
符号構成をとる。
【0155】音声復号化手段13は、前記音声符号Bを
復号化し、得られたディジタル出力音声AをD−A変換
手段14に出力する。D−A変換手段14は、前記ディ
ジタル出力音声Aに対してディジタル・アナログ変換
(D−A変換)を行ってアナログ信号である出力音声A
を出力する。
【0156】A−D変換手段16は、前記入力音声Aに
対してアナログ・ディジタル変換(A−D変換)を行っ
てディジタル信号であるディジタル入力音声Aを得る。
音声符号化手段17は、前記ディジタル入力音声Aを符
号化して、得られた音声符号Aを切換手段30内の制御
手段31、符号抽出手段50および選択手段32に出力
する。ここで、音声符号Aは音声符号A0と音声符号A
1の2つの部分からなる2段階のスケーラブル符号構成
としており、音声符号A0のみ用いても品質はやや劣化
するものの了解できる音声を復号できる符号構成をと
る。
【0157】切換手段30内の符号抽出手段50は、入
力された音声符号Aから音声符号A0を抽出し、符号組
合せ手段52に出力する。また、切換手段30内の符号
抽出手段51は、入力された音声符号Bから音声符号B
0を抽出し、符号組合せ手段52に出力する。符号組合
せ手段52は、入力された音声符号A0と音声符号B0
を組み合わせた符号を生成し、選択手段32に出力す
る。制御手段31は、入力された音声符号Aと音声符号
Bおよび音声符号A0と音声符号B0の組合せの内のど
れか一つを所定の選択基準に従って選択し、どれを選択
したかに関する情報を選択手段32に出力する。
【0158】選択手段32は、前記制御手段31から入
力された情報に従いスイッチを切り換えて、選択された
音声符号を音声符号A’として変調手段18に出力す
る。そして、変調手段18は、切換手段30から入力さ
れた音声符号A’をディジタル変調して、得られた変調
信号を変調信号Aとして、回線Aに出力する。
【0159】次に、この端末Aを用いた音声通信システ
ムの動作を図20に従い説明する。端末Bには、話者B
が発声した音声が入力音声Bとして入力される。また、
回線Aを介して、端末Aから変調信号Aが入力される。
A−D変換手段23は、前記入力音声Bに対してアナロ
グ・ディジタル変換(A−D変換)を行ってディジタル
信号であるディジタル入力音声Bを得る。音声符号化手
段24は、前記ディジタル入力音声Bを符号化して、得
られた音声符号Bを変調手段25に出力する。変調手段
25は、入力された音声符号Bをディジタル変調して、
得られた変調信号を変調信号Bとして、回線Bに出力す
る。
【0160】端末B内の復調手段20は、前記端末Aか
らの変調信号Aを復調して、得られた音声符号A’を分
離手段53に出力する。分離手段53は、前記音声符号
A’から入力音声Aに対する音声符号のみを分離して音
声復号化手段21に出力する。すなわち音声符号A’が
音声符号Aである場合は音声符号Aが、音声符号A’が
音声符号A0と音声符号B0の組合わせである場合は音
声符号A0が音声復号化手段21への入力となる。
【0161】音声復号化手段21は、前記分離手段53
から入力された音声符号を復号化し、得られたディジタ
ル出力音声BをD−A変換手段22に出力する。D−A
変換手段22は、前記ディジタル出力音声Bに対してデ
ィジタル・アナログ変換(D−A変換)を行ってアナロ
グ信号である出力音声Bを出力する。
【0162】端末Cには、回線Aを介して、端末Aから
変調信号Aが入力される。復調手段26は、前記変調信
号Aを復調して得られた音声符号A’を分離手段54に
出力する。分離手段54は、前記音声符号A’を入力音
声Aに対する音声符号と入力音声Bに対する音声符号に
分離し、入力音声Aに対する音声符号を音声復号化手段
27に、入力音声Bに対する音声符号を音声復号化手段
55に出力する。
【0163】すなわち音声符号A’が音声符号Aである
場合は音声符号Aが音声復号化手段27への入力とな
り、音声符号A’が音声符号A0と音声符号B0の組合
せである場合は音声符号A0が音声復号化手段27へ
の、音声符号B0が音声復号化手段55への入力とな
り、音声符号A’が音声符号Bである場合は音声符号B
が音声復号化手段55への入力となる。
【0164】音声復号化手段27は、前記分離手段54
から入力された入力音声Aに対する音声符号を復号化
し、得られたディジタル出力音声CAを出力する。ま
た、音声復号化手段55は前記分離手段54から入力さ
れた入力音声Bに対する音声符号を復号化し、得られた
ディジタル出力音声CBを出力する。D−A変換手段2
8は、前記ディジタル出力音声CAとディジタル出力音
声CBを加算手段56で加算して得られるディジタル出
力音声Cに対してディジタル・アナログ変換(D−A変
換)を行ってアナログ信号である出力音声Cを出力す
る。
【0165】なお、上記実施の形態では、切換手段にお
いて実施の形態1を基にスケーラブルな音声符号Aと音
声符号Bの両方の選択出力が必要と判定したときに、両
音声符号の一部を組み合わせた符号を出力するようにし
ているが、別の実施の形態を基にする構成も当然可能で
ある。
【0166】また、上記実施の形態では、音声符号を2
段階のスケーラブル符号構成としているが、3段階以上
のスケーラブルな符号構成とする構成も当然可能であ
る。さらに、これら複数段階のスケーラブルな符号から
抽出する符号部分や、その組合せ方を複数設定してお
き、これらを切り換えて出力する構成も当然可能であ
る。
【0167】また、上記実施の形態では、端末Cにおい
て2つのディジタル出力音声を加算した後にD−A変換
を施しているが、2つのディジタル出力音声をそれぞれ
D−A変換して得られる2つのアナログ信号を加算して
出力音声とする構成も当然可能である。さらに、2つの
アナログ信号を加算して1つの信号とするのではなく、
それぞれを個別に出力する構成も当然可能である。
【0168】この実施の形態9によれば、話者Aによる
入力音声を符号化した音声符号Aと、話者Bによる入力
音声を符号化した音声符号Bとを入力とし、所定時間の
フレーム毎に音声符号Aと音声符号Bの一方を選択して
出力する音声符号切換方法において、各音声符号が、そ
の一部のみを用いても音声を復号できるスケーラブルな
符号構成であり、各音声符号の一部ずつを組み合わせた
符号を、選択して出力する候補の一つとするようにした
ので、話者Aと話者Bが同時に発声した場合でも、両話
者の音声を復号できる音声符号を出力することができる
効果がある。
【0169】この実施の形態9による音声符号切換方法
を、複数の端末間で2つの回線を共有して、2つの端末
間の通話を他の端末でも傍受することが可能なディジタ
ル化した音声通信システムに適用した場合に、話者Aと
話者Bが同時に発声した場合でも、情報量を増すことな
く両話者の音声を復号できる音声符号を出力することが
できるので、通話が欠落することなく、2回の符号化お
よびダブルトーク音声の符号化による大きな品質劣化を
回避できる効果がある。
【0170】実施の形態10.図21は、この発明によ
る音声符号切換方法を用いる端末Aの構成を示す。な
お、この端末Aを図23の端末Aとして用いたものが、
本発明による音声符号切換方法を適用した音声通信シス
テムの構成となる。この実施の形態10が、図1に示す
実施の形態1と異なるところは、制御手段31の出力を
選択手段32だけでなく、変調手段18にも出力すると
ころにある。その他は、図1と同様であるので説明を省
略する。
【0171】以下、図に基づいて動作を説明する。端末
Aには、話者Aが発声した音声が入力音声Aとして入力
される。また、回線Bを介して端末Bから変調信号Bが
入力される。復調手段12は、前記変調信号Bを所定時
間のフレーム毎に復調して、得られた音声符号Bを音声
復号化手段13と切換手段30内の制御手段31および
選択手段32に出力する。音声復号化手段13は、前記
音声符号Bを復号化し、得られたディジタル出力音声A
をD−A変換手段14に出力する。D−A変換手段14
は、前記ディジタル出力音声Aに対してディジタル・ア
ナログ変換(D−A変換)を行ってアナログ信号である
出力音声Aを出力する。
【0172】A−D変換手段16は、前記入力音声Aに
対してアナログ・ディジタル変換(A−D変換)を行っ
てディジタル信号であるディジタル入力音声Aを得る。
音声符号化手段17は、前記ディジタル入力音声Aを所
定時間のフレーム毎に符号化して、得られた音声符号A
を切換手段30内の制御手段31および選択手段32に
出力する。制御手段31は、入力された音声符号Aと音
声符号Bの内の一方を所定の選択基準に従って選択し、
どちらを選択したかに関する情報を選択手段32および
変調手段18に出力する。なお、制御手段31の選択基
準は上記実施の形態1と同じものとする。
【0173】選択手段32は、前記制御手段31から入
力された情報に従いスイッチを切り換えて、選択された
音声符号を音声符号A’として変調手段18に出力す
る。そして、変調手段18は、前記制御手段31で選択
された符号の識別情報の後に切換手段30から入力され
た音声符号A’をつけた信号をディジタル変調して、得
られた変調信号を変調信号Aとして、回線Aに出力す
る。
【0174】このように構成することにより、話者Aと
話者Bの通話を傍受している端末Cにおいては、受信し
た音声符号がどちらの話者のものか認識できるので、各
話者毎に適した処理を行う、あるいは符号切換時点を認
識して出力音声Cの不連続性を予め察知し、緩和するな
どの特別な処理を行うことができ、通話品質を向上する
ことができる。
【0175】なお、上記実施の形態では、実施の形態1
を基にどの符号を選択したかを識別できる情報を出力す
るようにしているが、別の実施の形態を基にする構成も
当然可能である。
【0176】この実施の形態10によれば、話者Aによ
る入力音声を符号化した音声符号Aと、話者Bによる入
力音声を符号化した音声符号Bとを入力とし、一定時間
のフレーム毎に音声符号Aと音声符号Bの一方を選択し
て出力する音声符号切換方法において、どの符号を選択
したかを識別できる情報を出力するようにしたので、出
力された音声符号系列が音声符号Aであるか音声符号B
であるかを正確に認識できるという効果がある。
【0177】この実施の形態10による音声符号切換方
法を、複数の端末間で2つの回線を共有して、2つの端
末間の通話を他の端末でも傍受することが可能なディジ
タル化した音声通信システムに適用した場合に、受信し
た音声符号がどちらの話者のものか認識できるので、各
話者毎に適した処理を行う、あるいは符号切換時点を認
識して出力音声Cの不連続性を予め察知し、緩和するな
どの特別な処理を行うことができ、通話品質を向上する
ことができる効果がある。
【0178】
【発明の効果】この発明によれば、話者Aによる入力音
声を符号化した音声符号Aと、話者Bによる入力音声を
符号化した音声符号Bとを入力して、所定時間のフレー
ム毎に音声符号Aと音声符号Bの一方を選択して出力す
る音声符号切換又は手段において、出力フレームの選択
制御は過去の選択結果に基づいて行うようにしたので、
選択結果の連続性を保つことができる効果がある。
【0179】また、この発明によれば、話者Aによる入
力音声を符号化した音声符号Aと、話者Bによる入力音
声を符号化した音声符号Bとを入力して、所定時間のフ
レーム毎に音声符号Aと音声符号Bの一方を選択して出
力する音声符号切換方法において、音声符号Aと音声符
号BをNフレーム分格納しておき、この格納してあるN
フレーム分の音声符号Aと音声符号Bに基づいて、Nフ
レーム前の音声符号Aと音声符号Bの一方を選択して出
力するようにしたので、通話を主導している話者の符号
を的確に選択でき、また、選択結果の連続性を保つこと
ができる効果がある。
【0180】また、この発明によれば、所定時間のフレ
ーム毎に音声符号Aと音声符号Bの一方を選択して出力
する音声符号切換方法のおいて、音声符号Aと音声符号
Bの両方の選択出力が必要と判定したときに、前フレー
ムで選択していなかった方の音声符号を順次格納してい
き、前フレームで選択していた音声符号の選択出力が不
必要となったフレーム以降に、それまで格納しておいた
音声符号系列を時間順に順次出力するようにしたので、
必要な音声符号が欠落することがないという効果があ
る。
【0181】また、この発明によれば、話者Aによる入
力音声を符号化した音声符号Aと、話者Bによる入力音
声を符号化した音声符号Bとを入力とし、所定時間のフ
レーム毎に音声符号Aと音声符号Bの一方を選択して出
力する音声符号切換方法において、外部からの所定入力
を受けつけたときに、その所定入力に従って一方の音声
符号を優先的に選択するようにしたので、所望の音声符
号を確実に送出できる効果がある。
【0182】また、この発明によれば、話者Aによる入
力音声を符号化した音声符号Aと、話者Bによる入力音
声を符号化した音声符号Bとを入力とし、一定時間のフ
レーム毎に音声符号Aと音声符号Bの一方を選択して出
力する音声符号切換方法において、音声符号Bによらず
に、音声符号Aが所定条件を満足するときに優先的に選
択する例外条件を持たせるようにしたので、音声符号A
を確実に送出できる効果がある。
【0183】また、この発明によれば、話者Aによる入
力音声を符号化した音声符号Aと、話者Bによる入力音
声を符号化した音声符号Bとを入力とし、一定時間のフ
レーム毎に音声符号Aと音声符号Bの一方を選択して出
力する音声符号切換方法において、各音声符号が、音声
情報を表す情報符号と、その誤り訂正符号によって構成
され、音声符号Bに対して誤り訂正復号化および誤り訂
正符号化を行うようにしたので、伝送誤りの影響の無い
音声符号を出力できる効果がある。
【0184】また、この発明によれば、話者Aによる入
力音声を符号化した音声符号Aと、話者Bによる入力音
声を符号化した音声符号Bとを入力とし、所定時間のフ
レーム毎に音声符号Aと音声符号Bの一方を選択して出
力する音声符号切換方法において、各音声符号が、その
一部のみを用いても音声を復号できるスケーラブルな符
号構成であり、各音声符号の一部ずつを組み合わせた符
号を、選択して出力する候補の一つとするようにしたの
で、話者Aと話者Bが同時に発声した場合でも、両話者
の音声を復号できる音声符号を出力することができる効
果がある。
【0185】また、この発明によれば、話者Aによる入
力音声を符号化した音声符号Aと、話者Bによる入力音
声を符号化した音声符号Bとを入力とし、一定時間のフ
レーム毎に音声符号Aと音声符号Bの一方を選択して出
力する音声符号切換方法において、どの符号を選択した
かを識別できる情報を出力するようにしたので、出力さ
れた音声符号系列が音声符号Aであるか音声符号Bであ
るかを正確に認識できるという効果がある。
【図面の簡単な説明】
【図1】 この発明の実施の形態1による音声符号切換
方法を用いる音声通信システムにおける端末の構成を示
すブロック図である。
【図2】 この発明の実施の形態1による音声符号切換
方法における符号選択手順を示す説明図である。
【図3】 この発明の実施の形態1による音声符号切換
方法における別の符号選択手順を示す説明図である。
【図4】 この発明の実施の形態1による音声符号切換
方法における別の符号選択手順を示す説明図である。
【図5】 この発明の実施の形態2による音声符号切換
方法を用いる音声通信システムにおける端末の構成を示
すブロック図である。
【図6】 この発明の実施の形態2による音声符号切換
方法における符号選択手順を示す説明図である。
【図7】 この発明の実施の形態3による音声符号切換
方法を用いる音声通信システムにおける端末の構成を示
すブロック図である。
【図8】 この発明の実施の形態3による音声符号切換
方法における符号選択基準を示す説明図である。
【図9】 この発明の実施の形態4による音声符号切換
方法を用いる音声通信システムにおける端末の構成を示
すブロック図である。
【図10】 この発明の実施の形態4による音声符号切
換方法における符号選択基準を示す説明図である。
【図11】 この発明の実施の形態5による音声符号切
換方法を用いる音声通信システムにおける端末の構成を
示すブロック図である。
【図12】 この発明の実施の形態5による音声符号切
換方法における符号選択基準を示す説明図である。
【図13】 この発明の実施の形態6による音声符号切
換方法を用いる音声通信システムにおける端末の構成を
示すブロック図である。
【図14】 この発明の実施の形態6による音声符号切
換方法における符号選択手順を示す説明図である。
【図15】 この発明の実施の形態7による音声符号切
換方法における符号選択手順を示す説明図である。
【図16】 この発明の実施の形態8による音声符号切
換方法を用いる音声通信システムにおける端末の構成を
示すブロック図である。
【図17】 この発明の実施の形態8による音声符号切
換方法を用いる音声通信システムにおける端末の構成を
示すブロック図である。
【図18】 この発明の実施の形態8による音声符号切
換方法を用いる音声通信システムにおける端末の構成を
示すブロック図である。
【図19】 この発明の実施の形態9による音声符号切
換方法を用いる音声通信システムにおける端末の構成を
示すブロック図である。
【図20】 この発明の実施の形態9による音声通信シ
ステムの全体構成を示すブロック図である。
【図21】 この発明の実施の形態10による音声符号
切換方法を用いる音声通信システムにおける端末の構成
を示すブロック図である。
【図22】 従来の音声通信システムの全体構成を示す
ブロック図である。
【図23】 従来のディジタル化を図った音声通信シス
テムの全体構成を示すブロック図である。
【符号の説明】
1:端末A、2:端末B、3:端末C、12:復調手
段、13:音声復号化手段、・14:D−A変換手段、
15:音声重畳手段、16:A−D変換手段、17:音
声符号化手段、18:変調手段、20:復調手段、2
1:音声復号化手段、22:D−A変換手段、23:A
−D変換手段、24:音声符号化手段、25:変調手
段、26:復調手段、27:音声復号化手段、28:D
−A変換手段、30:切換手段、31:制御手段、3
2:選択手段、33、35:格納手段、34、36:遅
延手段、40:格納手段、41:第2選択手段、42:
第2格納手段、43:変更符号生成手段、45:誤り訂
正符号化手段、46:誤り訂正復号化手段、47:誤り
訂正復号化手段、48:誤り訂正符号化手段、50、5
1:符号抽出手段、52:符号組合せ手段、53、5
4:分離手段、55:音声復号化手段、56:加算手
段。

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 話者Aによる入力音声を符号化した音声
    符号Aと、話者Bによる入力音声を符号化した音声符号
    Bとを入力とし、所定時間のフレーム毎に音声符号Aと
    音声符号Bの一方を選択して出力する音声符号切換方法
    であって、 出力するフレームの選択は過去の選択結果に基づいて行
    うようにしたことを特徴とする音声符号切換方法。
  2. 【請求項2】 話者Aによる入力音声を符号化した音声
    符号Aと、話者Bによる入力音声を符号化した音声符号
    Bとを入力とし、所定時間のフレーム毎に音声符号Aと
    音声符号Bの一方を選択して出力する音声符号切換方法
    であって、 音声符号Aと音声符号BをNフレーム分格納し、この格
    納してあるNフレーム分の音声符号Aと音声符号Bに基
    づいて、Nフレーム前の音声符号Aまたは音声符号Bの
    一方を選択して出力するようにしたことを特徴とする音
    声符号切換方法。
  3. 【請求項3】 話者Aによる入力音声を符号化した音声
    符号Aと、話者Bによる入力音声を符号化した音声符号
    Bとを入力とし、所定時間のフレーム毎に音声符号Aと
    音声符号Bの一方を選択して出力する音声符号切換方法
    であって、 音声符号Aと音声符号Bの一方を選択判定時に両方の出
    力が必要と判定したとき、前フレームでの非選択音声符
    号を順次格納し、前フレームで選択した音声符号の出力
    が不必要となったフレーム以降に、出力不要となった時
    点まで格納していた音声符号系列を時間順に順次出力す
    るようにしたことを特徴とする音声符号切換方法。
  4. 【請求項4】 前記格納しておいた音声符号系列を時間
    順に順次出力する際に、現フレームの音声符号をその音
    声符号系列の末尾に配置していき、格納してある音声符
    号系列の全部もしくは一部が非音声区間であると判定さ
    れたときに、その区間の音声符号の末尾への配置を中止
    するか廃棄するようにしたことを特徴とする請求項3記
    載の音声符号切換方法。
  5. 【請求項5】 話者Aによる入力音声を符号化した音声
    符号Aと、話者Bによる入力音声を符号化した音声符号
    Bとを入力とし、所定時間のフレーム毎に音声符号Aと
    音声符号Bの一方を選択して出力する音声符号切換方法
    であって、 外部から何れか一方の音声符号を選択指示する所定入力
    を受けつけたときに、その所定入力に従って一方の音声
    符号を優先的に選択するようにしたことを特徴とする音
    声符号切換方法。
  6. 【請求項6】 話者Aによる入力音声を符号化した音声
    符号Aと、話者Bによる入力音声を符号化した音声符号
    Bとを入力とし、所定時間のフレーム毎に音声符号Aと
    音声符号Bの一方を選択して出力する音声符号切換方法
    であって、 音声符号Aが所定条件を満足するとき、音声符号Aを優
    先的に選択するようにしたことを特徴とする音声符号切
    換方法。
  7. 【請求項7】 話者Aによる入力音声を符号化した音声
    符号Aと、話者Bによる入力音声を符号化して変調し、
    さらに復調した音声符号Bとを入力とし、所定時間のフ
    レーム毎に音声符号Aと音声符号Bの一方を選択して出
    力する音声符号切換方法であって、 前記各音声符号が、音声情報を表す情報符号と、その誤
    り訂正符号によって構成され、音声符号Bに対しては誤
    り訂正復号化および誤り訂正符号化を行った後選択判定
    されて出力されることを特徴とする音声符号切換方法。
  8. 【請求項8】 話者Aによる入力音声を符号化した音声
    符号Aと、話者Bによる入力音声を符号化した音声符号
    Bとを入力とし、所定時間のフレーム毎に音声符号Aと
    音声符号Bの一方を選択して出力する音声符号切換方法
    であって、 前記音声符号Aと音声符号Bが、その一部のみを用いて
    も音声を復号できるスケーラブルな符号構成であり、音
    声符号Aの一部である音声符号A’と音声符号Bの一部
    である音声符号B’を組み合わせた符号を、選択して出
    力する候補の一つとするようにしたことを特徴とする音
    声符号切換方法。
  9. 【請求項9】 選択出力される音声符号が切り変わった
    時点のフレームは、そのフレームの出力に先立ち 選択
    音声符号を識別可能な情報を出力し、この情報の出力の
    後に、選択された音声符号の順次出力を行うようにした
    ことを特徴とする請求項1乃至請求項8の何れかに記載
    の音声符号切換方法。
  10. 【請求項10】 話者Aによる入力音声を符号化した音
    声符号Aと、話者Bによる入力音声を符号化した音声符
    号Bとを入力し、所定時間のフレーム毎に音声符号Aと
    音声符号Bの一方を選択して出力する制御手段を備える
    音声符号切換手段であって、制御手段は出力するフレー
    ムの選択を過去の選択結果に基づいて行う構成されたこ
    とを特徴とする音声符号切換手段。
  11. 【請求項11】 話者Aによる入力音声を符号化した音
    声符号Aと、話者Bによる入力音声を符号化した音声符
    号Bとが、その一部のみを用いても音声を復号できるス
    ケーラブルな符号構成であり、音声符号Aの一部である
    音声符号A’と音声符号Bの一部である音声符号B’と
    を組み合わせた符号を入力して復調する復調手段と、復
    調された音声符号A’と音声符号B’とを分離する分離
    手段と、分離された音声符号A’と音声符号B’とを夫
    々別個に復号し、出力音声Aと出力音声Bとを出力する
    夫々の音声復号化手段と、復号化された出力音声Aと出
    力音声Bとを加算する加算手段と、加算手段の出力をD
    −A変換するD−A変換手段とを備えた音声通信端末。
JP2001010250A 2001-01-18 2001-01-18 音声符号切換方法並びに音声符号切換手段及び音声通信端末 Pending JP2002215193A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2001010250A JP2002215193A (ja) 2001-01-18 2001-01-18 音声符号切換方法並びに音声符号切換手段及び音声通信端末
TW090116447A TW515191B (en) 2001-01-18 2001-07-05 Voice code switching method, voice code switching device and voice communication terminal
CNB011407468A CN1331340C (zh) 2001-01-18 2001-08-17 声音码切换方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001010250A JP2002215193A (ja) 2001-01-18 2001-01-18 音声符号切換方法並びに音声符号切換手段及び音声通信端末

Publications (1)

Publication Number Publication Date
JP2002215193A true JP2002215193A (ja) 2002-07-31

Family

ID=18877595

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001010250A Pending JP2002215193A (ja) 2001-01-18 2001-01-18 音声符号切換方法並びに音声符号切換手段及び音声通信端末

Country Status (3)

Country Link
JP (1) JP2002215193A (ja)
CN (1) CN1331340C (ja)
TW (1) TW515191B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2245862A1 (en) * 2008-01-29 2010-11-03 QUALCOMM Incorporated Improving sound quality by intelligently selecting between signals from a plurality of microphones
JP2013528832A (ja) * 2010-11-12 2013-07-11 ポリコム,インク. マルチポイント環境におけるスケーラブルオーディオ処理
JP2020161879A (ja) * 2019-03-25 2020-10-01 株式会社日立国際電気 無線通信システム、及び中央装置

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6820475B2 (ja) * 2017-02-08 2021-01-27 アイコム株式会社 音声通信システム、端末装置、および、プログラム
CN111212452B (zh) * 2020-01-13 2022-05-17 海能达通信股份有限公司 语音通信的越区切换方法、通信系统、终端和存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2618967B1 (fr) * 1987-07-31 1989-12-15 Js Telecommunications Procede et circuit de gestion d'audioconference
US5559876A (en) * 1995-09-01 1996-09-24 Telefonaktiebolaget L M Ericsson (Publ) Conferencing circuit, and associated method, for automatically conferencing subscriber units together in a telephonic conference
JPH09270859A (ja) * 1996-03-29 1997-10-14 Mitsubishi Electric Corp 会議通話方法および装置
CN1120610C (zh) * 1999-04-26 2003-09-03 华为技术有限公司 会议电话的控制电路及其控制方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2245862A1 (en) * 2008-01-29 2010-11-03 QUALCOMM Incorporated Improving sound quality by intelligently selecting between signals from a plurality of microphones
JP2014045507A (ja) * 2008-01-29 2014-03-13 Qualcomm Incorporated 複数のマイクからの信号間で知的に選択することによって音質を改善すること
US8831932B2 (en) 2010-07-01 2014-09-09 Polycom, Inc. Scalable audio in a multi-point environment
JP2013528832A (ja) * 2010-11-12 2013-07-11 ポリコム,インク. マルチポイント環境におけるスケーラブルオーディオ処理
JP2020161879A (ja) * 2019-03-25 2020-10-01 株式会社日立国際電気 無線通信システム、及び中央装置
JP7240220B2 (ja) 2019-03-25 2023-03-15 株式会社日立国際電気 無線通信システム、及び中央装置

Also Published As

Publication number Publication date
CN1331340C (zh) 2007-08-08
TW515191B (en) 2002-12-21
CN1366412A (zh) 2002-08-28

Similar Documents

Publication Publication Date Title
US7599834B2 (en) Method and apparatus of voice mixing for conferencing amongst diverse networks
EP1154408B1 (en) Multimode speech coding and noise reduction
US7362811B2 (en) Audio enhancement communication techniques
US20040174984A1 (en) Method and apparatus for DTMF detection and voice mixing in the CELP parameter domain
US6697342B1 (en) Conference circuit for encoded digital audio
US7443978B2 (en) Method and apparatus for audio coding with noise suppression
JPH1063293A (ja) 電話音声認識装置
JP2002215193A (ja) 音声符号切換方法並びに音声符号切換手段及び音声通信端末
US11996107B2 (en) Sound signal receiving and decoding method, sound signal encoding and transmitting method, sound signal decoding method, sound signal encoding method, sound signal receiving side apparatus, sound signal transmitting side apparatus, decoding apparatus, encoding apparatus, program and storage medium
US7181000B2 (en) Voice transmission device and voice transmission system
US8509460B2 (en) Sound mixing apparatus and method and multipoint conference server
JP3764339B2 (ja) 音声通信システム
JP2004053763A (ja) 多地点制御装置の音声符号化伝送システム
JP2002229595A (ja) 音声通信端末並びに音声通信システム
KR100798955B1 (ko) 음성인식을 통한 통화 중 대체음원 송출 제어 방법 및 장치
JP5480226B2 (ja) 信号処理装置および信号処理方法
JP3781992B2 (ja) 音声多重化装置
JP2000151827A (ja) 電話音声認識システム
JP5887736B2 (ja) Dtmf信号検出装置、dtmf信号検出方法およびdtmf信号検出プログラム
JP2002062897A (ja) 音声符号化装置と音声復号化装置及び音声符号化方法と音声復号化方法
JP2002041100A (ja) ディジタル音声処理装置
JPS6338339A (ja) デイジタル音声通信方式
JPH02235100A (ja) 音声帯域圧縮方式
JPH09162785A (ja) 音声通信端末装置および音声通信方法
JPS59181737A (ja) 伝送方式

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20040630

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050308

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050405

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050506

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050712

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050831

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20051004