WO2010125802A1

WO2010125802A1 - デジタル音声通信制御装置及び方法

Info

Publication number: WO2010125802A1
Application number: PCT/JP2010/003002
Authority: WO
Inventors: 田中朗宏
Original assignee: パナソニック株式会社
Priority date: 2009-04-30
Filing date: 2010-04-27
Publication date: 2010-11-04
Also published as: JPWO2010125802A1; US8775170B2; US20120046941A1

Abstract

音声入力部から入力される特定話者からの音声と、デジタル音声パケット受信部から入力される特定話者以外の１つ以上の話者の音声をミキシングする第一ミキシング部と、第一ミキシング部でミキシングした音声と、特定話者の音声をミキシングする第二ミキシング部を具備し、第二ミキシング部でミキシングした音声を特定話者にフィードバックする。

Description

デジタル音声通信制御装置及び方法

　本発明は、主に話者の声を本人と離れた場所に放送（本明細書において、「アナウンス」も同義語として用いる）するための、デジタル音声通信制御装置及び方法に関する。

　近年、通信ネットワーク技術の発達に伴い、従来アナログ信号を用いて実現していた音声によるアナウンス等を、話者の声をデジタル信号化し、それをパケット化したデジタル音声パケットを、デジタル通信ネットワーク上で送信することによっても実現できるようになった。

　そして、音声のデジタル化により、複雑な配線を必要とすることなく、複数に分けたアナウンスエリアのうちの一部に自由にアナウンスを行ったり、複数人の話者が同時に同じ又は異なるエリアに向けてアナウンスを行ったりすることが可能となった。

　更に、同一のデジタル通信ネットワーク上を同一の受話器を用いて、複数の話者間での通話にも用いることが可能となった。例えば、１人の人間が対象エリアに向けてアナウンスを行うと同時に、２人の人間が同じデジタル通信ネットワークに接続された受話器を用いて、通話をする場合などである。この時には、送信側でそれぞれの人間の声をデジタルパケット化してデジタル通信ネットワーク上を多重化して送信し、受信側では必要なパケットのみを取得して、取得したパケットをデコード及び再生することで実現される。

　一般に、話者と離れている等の理由で放送されている声が聞こえない場所へアナウンスを行う場合、又は、複数話者間での会話で自身の声が遅れて返ってくる、若しくは全く聞こえない場合、などには話者がアナウンスや会話を行う際に違和感を覚える場合がある。また、アナウンスを行う場合に、実際に音声が対象エリアに出力されているかどうかを確認する術がないため、話者として不安を抱く可能性も否定できない。

　これに対して、複数のアナログ回線を用いて、アナウンスや通話をそれぞれの回線を用いて実現する場合には、話者の声を受信した受話器又は放送装置が、そのまま話者の受話器へ受信したアナログ音声をフィードバックし、話者の受話器からフィードバックされた音声を出力することで、話者の違和感を減じ、かつ、確かに音声が受信側へ到達していることを確認させることができた。

　しかし、複数音源からなるデジタル音声パケットを、複数の用途に用いる場合には、途中でデジタル音声処理を実施することが必要となる。このデジタル音声処理には、一定期間のデジタル音声パケットをバッファリングし、他のデジタル音声パケットとの間でミキシング処理やミキシング後の音量調整処理などを行うことが不可避であり、そのためにどうしても処理遅延が発生してしまう。この遅延が原因で、フィードバックされた自身の音声を聞いた話者が違和感を禁じ得ない場合があった。

　特許文献１によれば、自身の音声を他の音声と多重化後に、話者にフィードバックする方法が開示されている。

　特許文献２によれば、複数話者の会議において、聞き手が必要とする話者の声だけを選択して聞き手に出力する方法が開示されている。

　しかしながら、上記特許文献１及び特許文献２のいずれも、聞き手が必要とする音声が多くなると、より高いＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）やＤＳＰ（Ｄｉｇｉｔａｌ　ＳｉｇｎａｌＰｒｏｃｅｓｓｏｒ）の処理能力を必要とし、人間が違和感を覚えるほどの遅延が生じてしまうことを完全に回避することができない、という課題があった。

特開平７－２０２８８８号公報特開２００６－２０３５４８号公報

　本発明のデジタル音声通信制御装置は、特定話者からの音声を第１の音声信号として入力する第一音声入力部と、特定話者以外の１つ以上の話者の音声を第２の音声信号として受信する第二音声入力部と、第１の音声信号と第２の音声信号をミキシングして、１つ以上の第３の音声信号を生成する第一ミキシング部と、第１の音声信号と、第２の音声信号のうちの１つの音声信号とをミキシングして、１つの第４の音声信号を生成する第二ミキシング部と、１つ以上の第３の音声信号を外部に出力する第一音声出力部と、第４の音声信号を外部に出力する第二音声出力部、から構成される。

　このような構成により、如何にミキシング処理が複雑な条件を要したとしても、特定話者に対するフィードバック音声のミキシング処理を、第二ミキシング部を用いて行うことで他の音声に影響を受けることなく、一定内の少ない遅延で処理を実行でき、フィードバックされた自身の音声を聞いた話者に違和感を感じさせないようにすることが可能となる。

　本発明のデジタル音声通信制御方法は、特定話者からのアナログ音声信号を受信する音声入力ステップと、アナログ音声信号を第１のデジタル音声ストリームに変換するＡ／Ｄ変換ステップと、特定話者以外の１人以上の話者のデジタル音声ストリームを構成するデジタル音声パケットとデータパケットが多重化されたデジタルデータを受信し、デジタルデータからデジタル音声パケットのみを抽出するデジタル音声パケット受信ステップと、デジタル音声パケット受信ステップで抽出したデジタル音声パケットを、話者ごとのデジタル音声パケットに分離し、話者ごとの第２のデジタル音声ストリームを構築するデジタル音声パケット分離ステップと、第１のデジタル音声ストリームと第２のデジタル音声ストリームとをミキシングし、第３のデジタル音声ストリームを１つ以上生成する、第一ミキシングステップと、第１のデジタル音声ストリームと第３のデジタル音声ストリームのうちの１つのデジタル音声ストリームとをミキシングし、第４の出力デジタル音声ストリームを生成する、第二ミキシングステップと、第一ミキシングステップで生成した、１つ以上の第３のデジタル音声ストリームを多重化し、装置外部へ出力するデジタル音声パケット送信ステップと、第二ミキシングステップで生成した、第４のデジタル音声ストリームをアナログ音声信号に変換するＤ／Ａ変換ステップと、Ｄ／Ａ変換ステップで変換したアナログ音声信号を、装置外部に出力する音声フィードバックステップと、から構成される。

図１は機内アナウンス・通話システムの構成の概略図である。図２は本発明の実施の形態１のデジタル音声通信制御装置の構成を示すブロック図である。図３は機内アナウンス・通話システムの構成の一例を示す概略図である。図４Ａはデジタル音声通信制御装置への入力データの一例を示す構成図である。図４Ｂはデジタル音声通信制御装置への入力データの一例を示す構成図である。図５Ａは入力データが分離された後のデジタル音声ストリームの一例を示す構成図である。図５Ｂは入力データが分離された後のデジタル音声ストリームの一例を示す構成図である。図５Ｃは入力データが分離された後のデジタル音声ストリームの一例を示す構成図である。図６は入力音声がＡ／Ｄ変換により変換された後のデジタル音声ストリームの一例を示す構成図である。図７Ａは第一ミキシング部への入力となる、デジタル音声ストリームの一例を示す構成図である。図７Ｂは第一ミキシング部への入力となる、デジタル音声ストリームの一例を示す構成図である。図７Ｃは第一ミキシング部への入力となる、デジタル音声ストリームの一例を示す構成図である。図７Ｄは第一ミキシング部への入力となる、デジタル音声ストリームの一例を示す構成図である。図８は出力デジタル音声ストリームの生成処理を表すフローチャートである。図９Ａは入力用バッファの状態の一例を示す構成図である。図９Ｂは入力用バッファの状態の一例を示す構成図である。図９Ｃは入力用バッファの状態の一例を示す構成図である。図９Ｄは入力用バッファの状態の一例を示す構成図である。図１０Ａは出力バッファの状態の一例を示す構成図である。図１０Ｂは出力バッファの状態の一例を示す構成図である。図１０Ｃは出力バッファの状態の一例を示す構成図である。図１１は出力対象となるデジタル音声ストリームの決定処理を表すフローチャートである。図１２Ａは生成される出力デジタル音声ストリームの一例を示す構成図である。図１２Ｂは生成される出力デジタル音声ストリームの一例を示す構成図である。図１２Ｃは生成される出力デジタル音声ストリームの一例を示す構成図である。図１３は本発明の実施の形態２のデジタル音声通信制御装置の構成を示すブロック図である。

　本発明では、フィードバックされた自身の音声を聞いた話者に遅延による違和感を感じさせないように、フィードバック音声のミキシング処理を、第二ミキシング部を用いて行った。

　（実施の形態１）
　本実施の形態では、航空機における機内放送及び乗務員の機内通話を実現するシステムを例に、図面を参照しながら述べる。

　図１は、航空機における機内アナウンス・通話システムの構成の概略図である。機内アナウンス・通話システム１００は、大きく音声制御サーバ１０１、フライトデッキヘッドフォン１０２、フライトデッキハンドセット１０４、複数のキャビンハンドセット１０３、複数のキャビンスピーカ１０５から構成される。

　音声制御サーバ１０１は、機内アナウンス・通話システム１００全体を流れる音声を制御する装置で、フライトデッキハンドセット１０４やキャビンハンドセット１０３からデジタル音声パケットの受信機能、並びにフライトデッキヘッドフォン１０２から伝送されるアナログ音声の受信及びデジタル音声パケットへの変換機能を持つ。加えて、音声制御サーバ１０１は、受信及び変換したデジタル音声パケットに対して、ミキシング、ミュート、音声レベルの調整、等のデジタル音声処理を行う。また、デジタル音声処理を施して生成されたデジタル音声パケットを、フライトデッキハンドセット１０４、キャビンハンドセット１０３、キャビンスピーカ１０５へ送信したり、生成されたデジタル音声パケットをアナログ音声に変換してフライトデッキヘッドフォン１０２に伝送したりする。

　フライトデッキヘッドフォン１０２は、ヘッドフォンとマイクが一体になっており、フライトデッキ（コックピット）においてパイロットがキャビン（客室）内へのアナウンスや乗務員などとの通話に用いるための機器である。通話だけでなく、パイロット自身のアナウンスした音声がフィードバックされた音声も聞くことができる。フライトデッキヘッドフォン１０２は、他の機器と異なり、音声制御サーバ１０１とデジタル通信ネットワークを介して接続されるのではなく、２本のアナログ回線を介して接続される。このアナログ回線は、それぞれ１本ずつアナウンス用、通話用に使用される。通常は、コパイロット（副操縦士）やパイロットオブザーバ用にフライトデッキヘッドフォン１０２が複数搭載されているが、音声制御サーバ１０１との通信回線は、アナウンス用、通話用に１本ずつしか存在しない。そのため、複数の人間が同時にアナウンスや通話を実施した場合には、これら複数人の声がミキシングされた結果がアナログ回線を介して音声制御サーバ１０１へ伝送される。

　キャビンハンドセット１０３は、キャビンの様々な場所に設置されるハンドセット（通話装置）である。乗務員が入力した音声をデジタル音声パケットに変換し、音声制御サーバ１０１に送信する機能や、音声制御サーバ１０１からデジタル音声パケットを受信し、受信したデジタル音声パケットをアナログ音声に変換し、出力する機能等を持つ。キャビンの乗務員はキャビンハンドセット１０３を用いて、アナウンスや通話を実行する。

　フライトデッキハンドセット１０４は、フライトデッキに設置されるハンドセットであり、機能はキャビンハンドセット１０３と変わらない。通常時は、パイロットがアナウンスや通話に用いるのは、フライトデッキヘッドフォン１０２であるため、フライトデッキハンドセット１０４は、フライトデッキヘッドフォン１０２に障害が発生した場合の予備としての位置づけが強い。

　キャビンスピーカ１０５は、キャビンに設置されるスピーカであり、音声制御サーバ１０１からデジタル音声パケットを受信し、受信したデジタル音声パケットをアナログ音声に変換し、出力する機能等を持つ。

　以上のように構成された機内アナウンス・通話システム１００において、パイロットがアナウンスをする場合には、まず、フライトデッキヘッドフォン１０２を用いて音声制御サーバ１０１にアナログ音声を送信する。音声制御サーバ１０１では、受信したアナログ音声をデジタル音声パケットに変換し、ミキシングや音声レベル調整などの必要な処理をした後、放送対象のキャビンスピーカ１０５へ送信する。音声制御サーバ１０１から送信されたデジタル音声パケットは、キャビンスピーカ１０５によって再びアナログ音声に変換され、機内に放送される。

　一方、キャビンの乗務員がアナウンスをする場合には、まず、キャビンハンドセット１０３を用いて音声制御サーバ１０１にデジタル音声パケットを送信する。音声制御サーバ１０１では、受信したデジタル音声パケットをミキシングや音声レベル調整などの必要な処理をした後、放送対象のキャビンスピーカ１０５へ送信する。音声制御サーバ１０１から送信されたデジタル音声パケットは、キャビンスピーカ１０５によって再びアナログ音声に変換され、機内に放送される。

　なお、一般にはスピーカは音声を拡張する機能のみしか持たないため、デジタル音声パケットをアナログ音声に変換する機器がキャビンスピーカ１０５の前段において必要となる。しかし、本発明の本質とは関連しないため、本明細書においては、キャビンスピーカ１０５がデジタル音声パケットをアナログ音声に変換する処理も行うものとして記載するものとする。

　図２は、本発明の実施の形態１の音声通信制御装置である音声制御サーバ１０１の構成を示すブロック図である。音声制御サーバ１０１は、音声入力部２０１、Ａ／Ｄ変換部２０２、デジタル音声パケット受信部２０３、デジタル音声パケット分離部２０４、第一ミキシング部２０５、第二ミキシング部２０６、Ｄ／Ａ変換部２０７、音声フィードバック部２０８、デジタル音声パケット送信部２０９から構成される。

　音声入力部２０１は、フライトデッキヘッドフォン１０２からのアナログ音声入力を受信する手段であり、フライトデッキヘッドフォン１０２でパイロットが話す音声を、アナログ音声として受信することが想定される。

　Ａ／Ｄ変換部２０２は、音声入力部２０１で受信したアナログ音声をデジタル音声パケットに変換する手段である。Ａ／Ｄ変換部２０２により、受信されたパイロットの音声はデジタル音声パケット化される。変換されたデジタル音声パケットは、一つの音声（この例の場合パイロットの声）のみからなるデジタル音声パケットが時系列に並んだパケット列（以下、「第１のデジタル音声ストリーム」と呼ぶ）であり、第一ミキシング部２０５及び第二ミキシング部２０６へ引き渡される。

　デジタル音声パケット受信部２０３は、キャビンハンドセット１０３及びフライトデッキハンドセット１０４からデジタル音声パケットを受信する手段である。デジタル音声パケット受信部２０３は、デジタル通信ネットワークからのデータを受信するため、データパケット等のデジタル音声パケット以外のパケットも受信する。デジタル音声パケット受信部２０３では、デジタル音声パケット以外のパケットを破棄又は他の機能へ引き渡し、複数の話者のデジタル音声パケットのみが多重された状態で、デジタル音声パケット分離部２０４に引き渡す。

　デジタル音声パケット分離部２０４は、デジタル音声パケット受信部２０３から受け取ったデジタル音声パケットを分離し、それぞれがひとつの音声からなる複数の第２のデジタル音声ストリームを生成する。

　第一ミキシング部２０５は、第１と第２の複数のデジタル音声ストリームを入力とし、入力された複数のデジタル音声ストリームから、必要なデジタル音声ストリームを抽出し、それらをミキシングする。ミキシングに際して必要な処理、例えば音声レベルやゲイン調整などは、第一ミキシング部２０５で行う。第一ミキシング部２０５でミキシング処理を実施することで、抽出された複数のデジタル音声ストリームの音声が重畳された１つの第３のデジタル音声ストリームが生成される。なお、第一ミキシング部２０５は、抽出するデジタル音声ストリームのパターンを複数種類とることを可能とすることとする。

　例えば、ａ、ｂ、ｃの３種類のデジタル音声ストリームが入力された場合に、ａ、ｂ、ｃのいずれをも抽出対象としたデジタル音声ストリームＡとａ、ｂのみを抽出対象とするデジタル音声ストリームＢの２種類のデジタル音声ストリームを生成する、という処理が可能である。この場合、デジタル音声ストリームＡはａとｂとｃが重畳された１つのデジタル音声ストリームとなり、デジタル音声ストリームＢはａとｂが重畳された１つのデジタル音声ストリームとなる。以下、本明細書において、１つのデジタル音声ストリームが複数の音声が重畳されて構成されていることを表すのに、デジタル音声ストリームＡの内容をａ＋ｂ＋ｃ、デジタル音声ストリームＢの内容をａ＋ｂのように、“＋”を用いて表記するものとする。

　第二ミキシング部２０６は、２つのデジタル音声ストリーム（第１のデジタル音声ストリームと第３のデジタル音声ストリームのうち一つ）を入力とし、それらをミキシングして、第４のジタル音声ストリームを出力する。ミキシングに際して必要な処理は、例えばミキシングした結果音声が大きくなりすぎるため、音量を調整する等の、最低限必要な処理のみ実行する。このため、第二ミキシング部２０６は、第一ミキシング部２０５に比較して小さなサイズのバッファとすることができる。音声制御サーバ１０１は、アナウンス用、通話用に第二ミキシング部２０６を２つ持つ。ただし、論理的に２種類のミキシングを行うためここでは２つ記載しているが、１つの第二ミキシング部２０６が２×２本のデジタル音声ストリームを扱えるとしても良い。

　Ｄ／Ａ変換部２０７は、第二ミキシング部２０６から第４のデジタル音声ストリームを受信し、受信したデジタル音声ストリームをアナログ音声に変換した上で音声フィードバック部２０８に引き渡す。

　音声フィードバック部２０８は、Ｄ／Ａ変換部２０７から受信したアナログ音声を、フライトデッキヘッドフォン１０２に伝送する。

　以下、図を用いて、音声制御サーバ１０１の動作を中心に、機内アナウンス・通話システム１００におけるアナウンス、通話を行う際のデジタル音声通信制御方法について説明する。

　図３は機内アナウンス・通話システム１００の構成の一例を示す概略図である。本実施の形態においては、キャビンハンドセット１０３－１とキャビンハンドセット１０３－２とフライトデッキヘッドフォン１０２との間で通話を、キャビンハンドセット１０３－３からキャビンスピーカ１０５－１へアナウンスを行う場合の例を示す。

　図４Ａに、音声制御サーバ１０１へのデジタル通信ネットワークからの入力データ（パケット）の一例の構成図を表す。なお、図４Ａにおいて、各パケットは時間的に左から先に入力される、すなわち音声パケット４０１、音声パケット４０２、データパケット４０３、・・・、音声パケット４１４の順で入力されるものとする。ただし、ここで示すパケットは、ＴＣＰ（ＴｒａｎｓｍｉｓｓｉｏｎＣｏｎｔｒｏｌＰｒｏｔｏｃｏｌ）やＵＤＰ（ＵｓｅｒＤａｔａｇｒａｍＰｒｏｔｏｃｏｌ）等の転送のためのパケットそのものではなく、一定の意味を持つデータのまとまりや一定期間のデジタル音声データのまとまりを表すものとする。一定のまとまりを持つデータを通信するための通信路を提供するプロトコルは、ＴＣＰやＵＤＰ、ＡＴＭ（ＡｓｙｎｃｈｒｏｎｏｕｓＴｒａｎｓｆｅｒＭｏｄｅ）等様々なものが存在するが、本発明は通信プロトコルに依存せず、どのようにしてデジタル音声パケットの通信を行うかについては、特定の方法に限らない。

　上記入力データは、まずデジタル音声パケット受信部２０３で受信され、デジタル音声パケットとそれ以外のデータとに分けられる。図４Ａにおいては、データパケット４０３、データパケット４０６、データパケット４１２が、デジタル音声パケット受信部２０３でデジタル音声パケット以外のパケットとしてフィルタリングされる。

　図４Ｂは、デジタル音声パケット受信部２０３のフィルタリング処理の結果として抽出されたデジタル音声パケットを表す構成図である。図４Ａと図４Ｂにおいて同一の番号が振られているパケットは、同一のパケットを表すものとする。図４Ａでは含まれていたデータパケット４０３、データパケット４０６、データパケット４１２は、図４Ｂには含まれていない。これは、デジタル音声パケット受信部２０３のフィルタリング処理の結果であることが分かる。

　図４Ｂにおいては、各デジタル音声パケットの詳細情報を示している。各デジタル音声パケットは、キャビンハンドセット１０３－１又はキャビンハンドセット１０３－２又はキャビンハンドセット１０３－３から入力されるパケットに対応し、Ｃ１－ＸＸがキャビンハンドセット１０３－１からの入力、Ｃ２－ＸＸがキャビンハンドセット１０３－２からの入力、Ｃ３－ＸＸがキャビンハンドセット１０３－３からの入力を、それぞれ表す。ここでは、ＸＸは任意の数字とする。

　図４Ｂに示すデジタル音声パケットは、デジタル音声パケット分離部２０４によって、デジタル音声ストリームに分離される。図５Ａ～５Ｃは、図４Ｂに示すデジタル音声パケットがデジタル音声パケット分離部２０４によって分離された後のデジタル音声ストリームの一例を示す構成図である。元々多重されていたデジタル音声パケットが、キャビンハンドセット１０３－１からの音声入力であるデジタル音声ストリーム５０１、キャビンハンドセット１０３－２からの音声入力であるデジタル音声ストリーム５０２、キャビンハンドセット１０３－３からの音声入力であるデジタル音声ストリーム５０３に分離される。

　一方、フライトデッキヘッドフォン１０２から音声入力部２０１へ入力された、パイロットの音声は、Ａ／Ｄ変換部２０２によって、デジタル音声ストリームに変換される。Ａ／Ｄ変換部２０２によって変換されたデジタル音声ストリームの構成の一例を図６に示す。パイロットの音声をデジタル変換したデジタル音声ストリーム６０１は、デジタル音声パケット６０１、デジタル音声パケット６０２、デジタル音声パケット６０３、・・・、からなる。また、デジタル音声ストリーム５０１等と同様、時系列に左から順に示しているものとする。

　デジタル音声パケット分離部２０４によって分離された、デジタル音声ストリーム５０１～デジタル音声ストリーム５０３と、Ａ／Ｄ変換部２０２によってデジタル変換されたデジタル音声ストリーム６０１は、第一ミキシング部２０５に入力される。同時に、デジタル音声ストリーム６０１は、第二ミキシング部２０６にも入力される。

　図７Ａ～７Ｄは、第一ミキシング部２０５への入力となる、複数のデジタル音声ストリームを表す構成図である。図７Ａ～７Ｄは、図５Ａ～５Ｃ及び図６とパケット間での直接の対応はないものとするが、デジタル音声ストリーム７０１～７０３、７１０がそれぞれ、キャビンハンドセット１０３－１～キャビンハンドセット１０３－３、フライトデッキヘッドフォン１０２からの入力を示すことは同様である。

　ＸＸは任意の数字とし、Ｃ１－ＸＸがキャビンハンドセット１０３－１からの入力、Ｃ２－ＸＸがキャビンハンドセット１０３－２からの入力、Ｃ３－ＸＸがキャビンハンドセット１０３－３からの入力を、Ｆ－ＸＸがフライトデッキヘッドフォン１０２からの入力をそれぞれ表す。ここでは、デジタル音声ストリーム５０１～５０３、及びデジタル音声ストリーム６０１の各デジタル音声ストリームの１パケットは４ミリ秒間の音声情報を表すものとし、各デジタル音声ストリームの入力タイミングは、それぞれＸＸの値が同じものは同時に入力されたものとする。例えば、デジタル音声ストリーム７０１のＣ１－１とデジタル音声ストリーム７０２のＣ２－１のパケットは同じタイミングで話された４ミリ秒間の音声を表し、Ｃ１－２はＣ１－１から遅れること４ミリ秒後のタイミングで話された４ミリ秒間の音声を表す。

　図８は、第一ミキシング部２０５における出力デジタル音声ストリームを生成する際の処理を表すフローチャートである。第一ミキシング部２０５では、まずステップ８０１において、受信した各デジタル音声ストリームから処理に必要な分のパケットを、それぞれバッファに格納する。本実施の形態では、例として、処理には５パケット分、すなわち２０ミリ秒分のパケットが必要であるとする。

　図９Ａ～９Ｄに、Ｃ１－１のパケットの直前のパケットが入力された時から、Ｃ１－５のパケットが入力された時の２０ミリ秒間を処理の単位とした場合の、Ｃ１－５のパケットが入力された後に、ステップ８０１がループ８５０について実行された時の、バッファ状態を表す。各デジタル音声ストリーム用のバッファには、図９Ａ～９Ｄに示すように、それぞれＹＹ－１からＹＹ－５までのパケットが格納されている。ここで、ＹＹは、Ｃ１、Ｃ２、Ｃ３又はＦを表すものとする。

　次に、図８におけるステップ８０２の処理を行うが、ステップ８０２の処理は生成するデジタル音声ストリーム数分だけループする。本実施の形態においては、生成するデジタル音声ストリームは、第二ミキシング部２０６へ出力するための通話用及びアナウンス用のデジタル音声ストリーム、並びに、デジタル音声パケット送信部２０９へ出力するための通話用及びアナウンス用のデジタル音声ストリームが対象となる。アナウンス用のデジタル音声ストリームは、第二ミキシング部２０６へ出力するもの、デジタル音声パケット送信部２０９へ出力するもの、両者いずれもデジタル音声ストリーム７０３が対象となるため、１つの出力バッファを共用することが可能である。

　なお、本実施の形態においては、キャビンハンドセット１０３－３からのみしかアナウンスが発生していないが、複数のキャビンハンドセット１０３から同時に、複数のエリアに対するアナウンスが実施される場合もある。加えて、複数の通話が同時に発生する場合も考えられる。例えば、キャビンハンドセット１０３－１とキャビンハンドセット１０３－２が２者間通話をして、キャビンハンドセット１０３－３とキャビンハンドセット１０３－４とキャビンハンドセット１０３－５とフライトデッキヘッドフォン１０２が４者間通話をする、というような場合である。

　上述の例のように、複数のアナウンスや通話が同時に実施される場合には、第一ミキシング部２０５で必要とするバッファ数も多くなる。ただし、音声フィードバック部２０８への出力、すなわち最終的にフライトデッキへの出力となるデジタル音声ストリームは、最大でも通話用とアナウンス用の２つのバッファに収まる。

　本実施の形態においては、生成するデジタル音声ストリームが３つであるため、ループ８５１は３回実行することとなる。まず、アナウンス用のデジタル音声ストリームに対応するループ８５１について説明する。アナウンス用のデジタル音声ストリームは、デジタル音声パケット送信部２０９と第二ミキシング部２０６の両者に共通となる。

　ステップ８０２において、アナウンス用のデジタル音声ストリームの出力バッファをクリアし、ループ８５２へ進む。本実施の形態においては、アナウンスはキャビンハンドセット１０３－３から１つだけ実行されている。従って、ステップ８０３においてｙｅｓとなるのはキャビンハンドセット１０３－３からの入力であるデジタル音声ストリーム７０３の場合のみである。従って、アナウンス用のデジタル音声ストリームの出力バッファには、Ｃ３－１～Ｃ３－５のパケットが格納される。

　次に、デジタル音声パケット送信部２０９へ出力する通話用のデジタル音声ストリームについての、ループ８５１の処理を述べる。まず、ステップ８０２において、通話(キャビン)用出力バッファをクリアする。

　次に、ループ８５２のループ処理を行う。本実施の形態においては、キャビンハンドセット１０３－１、キャビンハンドセット１０３－２、及びフライトデッキヘッドフォン１０２との間で通話が実施されているため、ステップ８０３でｙｅｓとなるのは、デジタル音声ストリーム７０１、デジタル音声ストリーム７０２、デジタル音声ストリーム７１０に対してである。これらのデジタル音声ストリームに対して、ステップ８０４を実行すると通話(キャビン)用出力バッファには、図９Ａ～９ＤにおけるＣ１－１～Ｃ１－５、Ｃ２－１～Ｃ２－５、Ｆ－１～Ｆ－５のデジタル音声パケットが、それぞれミキシングされたパケットが格納される。

　ステップ８０４におけるミキシング処理の内容としては、様々なアルゴリズムの利用が考えられる。また、ミキシングに際して、ＡＧＣ（ＡｕｔｏｍａｔｉｃＧａｉｎＣｏｎｔｒｏｌ）や音声レベル調整などを実行することも考えられる。本発明は、ステップ８０４で実行するミキシング処理、更にはミキシングに際して実行するその他の音声処理の内容によらず有効である。たとえ、音声が時間圧縮されていたとしても、適切な単位、例えば該単位のデータが全て揃えば、特定期間の音声を完全に再現できるような単位、にデジタル音声パケットを定義することで、処理が可能となる。

　デジタル音声パケット送信部２０９へ出力する通話用のデジタル音声ストリームについての、ループ８５１の処理終了後、第二ミキシング部２０６へ出力する通話用のデジタル音声ストリームについての、ループ８５１の処理を実行する。まず、ステップ８０２において、通話(フライトデッキ)用出力バッファをクリアする。

　後述のように、第二ミキシング部２０６へ出力する通話用のデジタル音声ストリームには、Ａ／Ｄ変換部２０２から入力されたデジタル音声ストリームは出力しない。このためステップ８０３でｙｅｓとなるのは、入力デジタル音声ストリームがデジタル音声ストリーム７０１及びデジタル音声ストリーム７０２の場合である。従って、２つのデジタル音声ストリームに対してステップ８０４の処理を実行することになる。

　以上の、デジタル音声ストリーム生成処理を実行した結果、出力バッファは図１０Ａ～１０Ｃに示す状態となる。ここで、Ｃ１－１＋Ｃ２－１＋Ｆ－１は、Ｃ１－１とＣ２－１とＦ－１のデジタル音声パケットのデジタル音声をミキシングし、３つの音声が重畳されていることを表す。デジタル音声パケット分離部２０４は、こうして生成されたデジタル音声パケットを、第二ミキシング部２０６又はデジタル音声パケット送信部２０９へ引き渡す。

　以降、入力デジタル音声ストリームの次のパケット群、すなわち図７Ａ～７ＤにおけるＣ１－６～Ｃ１－１０、Ｃ２－６～Ｃ２－１０、Ｃ３－６～Ｃ３－１０、Ｆ－６～Ｆ－１０、に対して同様の処理を繰り返す。

　以下に、図８のフローチャートにおけるループ８５１で繰り返す、生成対象となるデジタル音声ストリームの決定の仕方を詳しく述べる。

　図１１は、生成対象となるデジタル音声ストリームを決定するフローチャートである。まずステップ１１０１において、フライトデッキ用、すなわち第二ミキシング部２０６へ出力するための、デジタル音声ストリーム（生成対象ストリーム（ＦＡ））を生成対象とする。この時点では、生成対象ストリーム（ＦＡ）にはどの音声も含まないものとする。

　次に、実施中の全アナウンスに対して、ループ１１５１の処理を実施する。ここでは、説明の便宜のために、アナウンスに順番を付け、ｉ番目のアナウンスをアナウンス（ｉ）と呼ぶこととする。まずステップ１１０２において、各アナウンスを実行しているキャビンハンドセット１０３（フライトデッキヘッドフォン１０２、フライトデッキハンドセット１０４でも良い）から入力されるデジタル音声ストリームを、生成対象ストリーム（ｉ）とし、更に、生成対象ストリーム（ＦＡ）に、キャビンハンドセット１０３（フライトデッキヘッドフォン１０２、フライトデッキハンドセット１０４）からの入力を追加する（ステップ１１０３）。

　ループ１１５１のループ処理を完了することで、実施中のアナウンス数＋１本の生成対象ストリームが決定される。例えば、アナウンス１とアナウンス２がキャビンハンドセット１０３－１とキャビンハンドセット１０３－２から実施されている場合、生成対象ストリームは、「キャビンハンドセット１０３－１からのストリームから成る、生成対象ストリーム（１）」と「キャビンハンドセット１０３－２からのストリームから成る、生成対象ストリーム（２）」と「キャビンハンドセット１０３－１からのストリーム及びキャビンハンドセット１０３－２からのストリームから成る、生成対象ストリーム（ＦＡ）」の３本の生成対象ストリームが決定される。

　ステップ１１０４以降では、通話用の生成対象ストリームを決定する。まず、ステップ１１０４でフライトデッキ用、すなわち第二ミキシング部２０６へ出力するための、デジタル音声ストリーム（生成対象ストリーム（ＦＣ））を生成対象とする。この時点では、生成対象ストリーム（ＦＣ）にはどの音声も含まないものとする。

　次に、実施中の全通話に対して、ループ１１５２の処理を実施する。ここでは、説明の便宜のために、通話に順番を付け、ｊ番目の通話を通話（ｊ）と呼ぶこととする。まずステップ１１０５において、各通話に参加しているキャビンハンドセット１０３（フライトデッキハンドセット１０４でも良い）から入力されるデジタル音声ストリーム全てを含むストリームとして、生成対象ストリーム（ｊ）を決定する。

　次に、ステップ１１０６において、対象とする通話（ｊ）が、フライトデッキヘッドフォン１０２を含んでいるかどうかを判定する。対象とする通話（ｊ）が、フライトデッキヘッドフォン１０２を含んでいる場合にはステップ１１０７へ進み、含まない場合にはループ処理の先頭に戻る。

　ステップ１１０７においては、対象とする通話（ｊ）に参加しているキャビンハンドセット１０３（フライトデッキハンドセット１０４でも良い）から入力されるデジタル音声ストリーム全てを、生成対象ストリーム（ＦＣ）に追加する。その後、ステップ１１０８で、生成対象ストリーム（ｊ）にフライトデッキヘッドフォン１０２からの入力を追加する。

　ループ１１５２のループ処理を完了することで、実施中の通話数＋１本の生成対象ストリームが決定される。例えば、通話１がキャビンハンドセット１０３－１とキャビンハンドセット１０３－２の間で、通話２がキャビンハンドセット１０３－３とフライトデッキヘッドフォン１０２との間で実施されている場合、生成対象ストリームは、「キャビンハンドセット１０３－１からのストリーム及びキャビンハンドセット１０３－２からのストリームから成る、生成対象ストリーム（１）」と「キャビンハンドセット１０３－３及びフライトデッキヘッドフォン１０２からのストリームから成る、生成対象ストリーム（２）」と「キャビンハンドセット１０３－３からのストリームから成る、生成対象ストリーム（ＦＣ）」の３本の生成対象ストリームが決定される。

　最後に、ステップ１１０９において、全く同じ入力源からなる生成対象ストリームがあればそれを１つにまとめる処理を行う。例えば、図１０Ａ～１０Ｃで示したアナウンス用バッファがそれに該当する。なお、この処理は、本発明に影響を与えないため、必ずしも実施する必要はない。

　第一ミキシング部２０５は、順次、生成したデジタル音声ストリームのうち、フライトデッキに出力するための２つのストリーム「キャビンハンドセット１０３－１からのストリーム及びキャビンハンドセット１０３－２からのストリームから成る、生成対象ストリーム（１）」を第二ミキシング部２０６に引き渡し、残りのデジタル音声ストリームをデジタル音声パケット送信部２０９に引き渡す。

　第一ミキシング部２０５から、デジタル音声ストリームを受信した、デジタル音声パケット送信部２０９は、アナウンス用のデジタル音声ストリームを、放送対象エリアに属するキャビンスピーカ１０５へ、通話用のデジタル音声ストリームを、通話に参加しているキャビンハンドセット１０３へ、それぞれ送信する。

　一方、第一ミキシング部２０５とＡ／Ｄ変換部２０２から、それぞれデジタル音声ストリームを受信した第二ミキシング部２０６は、アナウンス用の出力ストリーム同士、通話用のストリーム同士を、それぞれミキシングする。以下に、第二ミキシング部２０６のミキシング処理の詳細について説明する。

　図１２Ａ～１２Ｃは、第二ミキシング部２０６が、第一ミキシング部２０５から受信した通話用のデジタル音声ストリーム（通話用デジタル音声ストリーム１２００）と、Ａ／Ｄ変換部２０２から受信した通話用のデジタル音声ストリーム（通話用デジタル音声ストリーム１２１０）と、第二ミキシング部２０６が２つのストリームをミキシングして生成するデジタル音声ストリーム（出力デジタル音声ストリーム１２２０）を表す図である。

　図１２Ａ～１２Ｃでは、通話用デジタル音声ストリーム１２００と通話用デジタル音声ストリーム１２１０について、同じタイミングで入力されるパケットについては、ｘ座標を同じ位置に記載している。また、Ｃ１－ＸＸとＣ２－ＸＸとＦ－ＸＸは、音声制御サーバ１０１に入力されたタイミングが同じであることを表している。ただし、ここでＸＸは任意の数字を表すものとする。

　第一ミキシング部２０５での処理として、バッファに２０ミリ秒分のデジタル音声パケットを格納し、それから１２ミリ秒間かかるとすると、通話用デジタル音声ストリーム１２００が第二ミキシング部２０６に入力されるタイミングは、通話用デジタル音声ストリーム１２１０が第二ミキシング部２０６に入力されるタイミングと比べて、８パケット分遅れる。すなわち、第二ミキシング部２０６にＣ１－１＋Ｃ２－１が入力されるタイミングと、Ｆ－９が入力されるタイミングが同時になる。

　第二ミキシング部２０６は、これら２つのデジタル音声パケットが入力されると、単純にこれらを、１つのデジタル音声パケットにミキシングする最小限の処理のみを行う。第二ミキシング部２０６は、図１２Ａ～１２Ｃの出力デジタル音声ストリーム１２２０に示すように、Ａ／Ｄ変換部２０２から入力されたデジタル音声パケットと、第一ミキシング部２０５から３２ミリ秒遅れて入力されたデジタル音声パケット、とを重畳したデジタル音声パケットを生成する。

　第二ミキシング部２０６が、生成したデジタル音声パケットを、Ｄ／Ａ変換部２０７に出力すると、Ｄ／Ａ変換部２０７は入力されたデジタル音声パケットをアナログ音声に変換し、音声フィードバック部２０８を通じてフライトデッキに、アナログ音声を送信する。

　また、第二ミキシング部２０６では、アナウンス用のデジタル音声ストリームに対する処理も、通話用のデジタル音声ストリームに対する処理と全く同様に行う。

　一連の処理により、それほど大きな演算能力を持たないＣＰＵ／ＤＳＰでも、フライトデッキヘッドフォン１０２からの音声を、大きな遅延なく、必要となるキャビンハンドセット１０３からの音声と重畳した音声を、フライトデッキヘッドフォン１０２へフィードバックすることが可能となる。

　つまり、本実施の形態では、全ての音声をミキシングしてフィードバックするよりも、フライトデッキヘッドフォンからの音声を３２ミリ秒早くフィードバックすることができる。

　これにより、パイロットが、フライトデッキヘッドフォン１０２からの音声が確実に音声制御サーバ１０１に到達していることの確認と、自身の声が大きな遅延なくフィードバックされることによる違和感の軽減が可能となる。

　なお、第二ミキシング部２０６でも、遅延が問題にならない程度であれば、音声信号処理を実行しても良い。この際の、第二ミキシング部２０６の処理が負担にならないよう、第二ミキシング部２０６で特定の信号処理が実行される前提で、第一ミキシング部２０５が予め信号処理をすることも考えられる。例えば、第二ミキシング部２０６では、Ａ／Ｄ変換部２０２から入力されたデジタル音声ストリームの音声レベルを１／ｎにして、第一ミキシング部２０５から入力されたデジタル音声ストリームと加算演算を行うだけで、適切なミキシングが完了するように調整する、等である。

　（実施の形態２）
　図１３は、本発明の実施の形態２のデジタル音声通信制御装置を示すブロック図で、第二ミキシング部３０６がアナログミキシングを行う場合の、音声制御サーバ１３００の構成を表す。

　実施の形態１と異なるところは、第二ミキシング部３０６が、デジタル音声ストリームではなく、アナログ音声信号をミキシングさせるようにした点である。

　このため、音声入力部２０１で受信したアナログ音声信号を、Ａ／Ｄ変換部２０２と、第二ミキシング部３０６にそれぞれ送信する。また、第一ミキシング部２０５から送信されるデジタル音声ストリームを、Ｄ／Ａ変換部２０７でアナログ音声信号に変換し、第二ミキシング部３０６に送信する。第二ミキシング部３０６では、音声入力部２０１からのアナログ音声信号と、Ｄ／Ａ変換部２０７からのアナログ音声信号とをミキシングし、音声フィードバック部２０８を通じてフライトデッキに、アナログ音声を送信する。

　この場合、第二ミキシング部３０６が、２×２本のアナログ音声を受信して、それらをアナログ音声としてミキシングする。この際に、ＡＧＣや音声レベル調整などを行っても良い。なお、この場合のアナログ音声ミキシング処理は、ＣＯＤＥＣ（ＣＯｄｅｒ／ＤＥＣｏｄｅｒ）や専用のハードウェアなどで行うことも考えられる。また、この場合の第二ミキシング部３０６が、フライトデッキヘッドフォン１０２に備わるシステム構成とすることも考えられる。

　上記実施の形態においては、デジタル音声パケット送信部２０９が、出力対象となるキャビンハンドセット１０３やキャビンスピーカ１０５を認識して、それらに対して適切なデジタル音声ストリームを送信することとしているが、デジタル音声パケット送信部２０９は出力対象を選択せずに、全てのキャビンハンドセット１０３、キャビンスピーカ１０５に全デジタル音声ストリームを送信しても良い。この場合、デジタル音声ストリームを受信したキャビンハンドセット１０３やキャビンスピーカ１０５が、自身がどの通話に属しているか、どのアナウンスを放送しているか、を認識して、必要なデジタル音声ストリームを選択して再生する機能を持つものとする。

　上記実施の形態においては、アナウンス中の音声は、全てフライトデッキヘッドフォン１０２へフィードバックするとしているが、特定の種類のアナウンスのみをフライトデッキヘッドフォン１０２へフィードバックするとしても良い。例えば、アナウンスに緊急放送とバックグラウンドミュージックの２種類があるとした場合、図１１におけるステップ１１０３の処理を、対象としているアナウンス（ｉ）が緊急放送である場合のみ、生成対象ストリーム（ＦＡ）にＣＨ（ｉ）からの入力を追加する処理に代えれば良い。もちろん、アナウンスの種類が複数ある場合に、データベースなどを使ってステップ１１０３の処理の判断基準としても良いし、アナウンスの種類だけでなく、放送元がどのキャビンハンドセット１０３であるかに応じて、フライトデッキヘッドフォン１０２へフィードバックするかしないかを決定しても良い。

　上記実施の形態においては、航空機内のアナウンス・通話システムについて説明をしたが、もちろん本発明は、航空機内のシステムに限られるものではなく、一般のアナウンス・通話システムで用いることも可能である。

　本発明にかかるデジタル音声通信制御装置及び方法は、複数のエリアに対するアナウンス及び複数ハンドセット間の通話を、同時に複数回線実施することが要求されるシステムにおいて、話者が違和感なく離れた場所にアナウンスをしたり、複数の相手と通話をしたりすることができるようになり、特に、航空機内のアナウンス・通話システムとして有用である。

　１００　　機内アナウンス・通話システム
　１０１　　音声制御サーバ
　１０２　　フライトデッキヘッドフォン
　１０３　　キャビンハンドセット
　１０４　　フライトデッキハンドセット
　１０５　　キャビンスピーカ
　２０１　　音声入力部
　２０２　　Ａ／Ｄ変換部
　２０３　　デジタル音声パケット受信部
　２０４　　デジタル音声パケット分離部
　２０５　　第一ミキシング部
　２０６　　第二ミキシング部
　２０７　　Ｄ／Ａ変換部
　２０８　　音声フィードバック部
　２０９　　デジタル音声パケット送信部

Claims

特定話者からの音声を入力し、第１の音声信号として出力する第一音声入力部と、
前記特定話者以外の１人以上の話者の音声を受信し、第２の音声信号として出力する第二音声入力部と、
前記第１の音声信号と前記第２の音声信号をミキシングして、１つ以上の第３の音声信号を生成し、出力する第一ミキシング部と、
前記第３の音声信号のうちの１つ以上の音声信号を受信し、外部に出力する第一音声出力部と、
前記第３の音声信号のうちの１つの音声信号と、前記第１の音声信号とをミキシングして、第４の音声信号を生成し、出力する第二ミキシング部と、
前記第４の音声信号を外部に出力する第二音声出力部と、
からなることを特徴とするデジタル音声通信制御装置。
前記第一音声入力部は、
アナログ音声入力信号を受信する音声入力部と、前記アナログ音声入力信号を第１のデジタル音声ストリームに変換するＡ／Ｄ変換部とからなり、前記第１のデジタル音声ストリームを、前記第一ミキシング部及び前記第二ミキシング部にそれぞれ送信し、
前記第二音声入力部は、
１人以上の話者のデジタル音声ストリームを構成するデジタル音声パケットとデータパケットが多重化されたデジタルデータを受信し、前記デジタルデータから前記デジタル音声パケットのみを抽出し、出力するデジタル音声パケット受信部と、
前記デジタル音声パケット受信部からデジタル音声パケットを受信し、話者ごとのデジタル音声パケットに分離し、話者ごとの第２のデジタル音声ストリームを構築するデジタル音声パケット分離部とからなり、
前記デジタル音声パケット分離部が構築した第２のデジタル音声ストリームを、前記第一ミキシング部に送信し、
前記第一ミキシング部は、
前記第一音声入力部から受信した前記第１のデジタル音声ストリームと、前記第二音声入力部から受信した前記第２のデジタル音声ストリームとをミキシングして、１つ以上の第３のデジタル音声ストリームを出力し、
前記第一音声出力部は、
前記第一ミキシング部から１つ以上の第３のデジタル音声ストリームを受信し、前記第３のデジタル音声ストリームを多重化したデジタルデータを生成し、前記デジタルデータを出力するデジタル音声パケット送信部からなり、
前記第二ミキシング部は、
前記第３のデジタル音声ストリームのうちの１つのデジタル音声ストリームを受信し、前記第１のデジタル音声ストリームとミキシングして、第４のデジタル音声ストリームを出力し、
前記第二音声出力部は、
前記第二ミキシング部から第４のデジタル音声ストリームを受信し、前記第４のデジタル音声ストリームをアナログ音声出力信号に変換するＤ／Ａ変換部と、前記アナログ音声出力信号を出力する音声フィードバック部とからなり、前記音声フィードバック部は、前記アナログ音声出力信号を出力する、
ことを特徴とする請求項１記載のデジタル音声通信制御装置。
前記第一ミキシング部は、
前記第１のデジタル音声ストリームと、前記第２のデジタル音声ストリームのうち特定条件を満たす１つ以上のデジタル音声ストリームとをミキシングした前記第３のデジタル音声ストリームを１つ以上生成し、前記第３のデジタル音声ストリームのうちの１つのデジタル音声ストリームを、前記第二ミキシング部へ出力し、他の前記第３のデジタル音声ストリームを前記デジタル音声パケット送信部へ出力し、
前記第二ミキシング部は、
前記第１のデジタル音声ストリームと、前記第一ミキシング部から受信した１つのデジタル音声ストリームとをミキシングした、前記第４のデジタル音声ストリームを生成し、前記音声フィードバック部へ出力する、
ことを特徴とする請求項２記載のデジタル音声通信制御装置。
前記第一ミキシング部が生成し、前記第二ミキシング部へ出力する前記第３のデジタル音声ストリームは、前記第１のデジタル音声ストリームを含まない、
ことを特徴とする請求項２記載のデジタル音声通信制御装置。
前記第一ミキシング部は、複数のデジタル音声ストリームのミキシングを行う際に、音声レベルやゲイン調整を行い、
前記第二ミキシング部は、前記第一ミキシング部に比較して小さなサイズのバッファを利用して、２つのデジタル音声ストリームのミキシングに必要な処理のみを行う、
ことを特徴とする請求項２記載のデジタル音声通信制御装置。
前記音声入力部と、前記Ａ／Ｄ変換部と、前記Ｄ／Ａ変換部と、前記音声フィードバック部は、
複数のアナログ音声信号又は複数の前記第４のデジタル音声ストリームに対して、それぞれ独立して処理を行い、
前記第二ミキシング部は、
それぞれが２つのデジタル音声ストリームからなる複数の複数の前記第1および前記第3のデジタル音声ストリームに対して、それぞれ独立して処理を行う、
ことを特徴とする請求項２記載のデジタル音声通信制御装置。
前記Ａ／Ｄ変換部と、前記Ｄ／Ａ変換部と、前記音声フィードバック部が扱うアナログ音声信号又はデジタル音声ストリームはそれぞれ２つであって、
前記第二ミキシング部が扱うミキシング対象デジタル音声ストリームの組は２つであって、
そのうちの１つのデジタル音声ストリームは、アナウンス用に用い、残りの１つのデジタル音声ストリームは通話用に用いる、
ことを特徴とする請求項６記載のデジタル音声通信制御装置。
前記第一音声入力部は、
アナログ音声入力信号を受信する音声入力部と、前記アナログ音声入力信号を第１のデジタル音声ストリームに変換するＡ／Ｄ変換部とからなり、前記第１のデジタル音声ストリームを前記第一ミキシング部に、前記アナログ音声入力信号を前記第二ミキシング部にそれぞれ送信し、
前記第二音声入力部は、
１人以上の話者のデジタル音声ストリームを構成するデジタル音声パケットとデータパケットが多重化されたデジタルデータを受信し、前記デジタルデータから前記デジタル音声パケットのみを抽出し、出力するデジタル音声パケット受信部と、
前記デジタル音声パケット受信部からデジタル音声パケットを受信し、話者ごとのデジタル音声パケットに分離し、話者ごとの第２のデジタル音声ストリームを構築するデジタル音声パケット分離部とからなり、
前記デジタル音声パケット分離部が構築した第２のデジタル音声ストリームを、前記第一ミキシング部に送信し、
前記第一ミキシング部は、
前記第一音声入力部から受信した前記第１のデジタル音声ストリームと、前記第二音声入力部から受信した前記第２のデジタル音声ストリームとをミキシングして、１つ以上の第３のデジタル音声ストリームを出力し、
前記第一音声出力部は、
前記第一ミキシング部から１つ以上の第３のデジタル音声ストリームを受信し、前記第３のデジタル音声ストリームを多重化したデジタルデータを生成し、前記デジタルデータを出力するデジタル音声パケット送信部からなり、
前記第二ミキシング部は、
前記第３のデジタル音声ストリームのうちの１つのデジタル音声ストリームがＤ／Ａ変換部により変換されたアナログ音声変換信号を受信し、前記アナログ音声入力信号とミキシングして、アナログ音声出力信号を出力し、
前記第二音声出力部は、
音声フィードバック部を有し、前記音声フィードバック部は、前記アナログ音声出力信号を出力する、
ことを特徴とする請求項１記載のデジタル音声通信制御装置。
前記第一ミキシング部は、
前記第１のデジタル音声ストリームと、前記第２のデジタル音声ストリームのうち特定条件を満たす１つ以上のデジタル音声ストリームとをミキシングした前記第３のデジタル音声ストリームを１つ以上生成し、前記第３のデジタル音声ストリームのうちの１つのデジタル音声ストリームを、前記Ｄ／Ａ変換部によりＤ／Ａ変換してアナログ音声変換信号として前記第二ミキシング部へ出力し、他の前記第３のデジタル音声ストリームを前記デジタル音声パケット送信部へ出力し、
前記第二ミキシング部は、
前記アナログ音声入力信号と、前記Ｄ／Ａ変換部から受信したアナログ音声変換信号とをミキシングした、前記アナログ音声出力信号を生成し、前記音声フィードバック部へ出力する、
ことを特徴とする請求項８記載のデジタル音声通信制御装置。
前記第一ミキシング部が生成し、前記Ｄ／Ａ変換部へ出力する前記第３のデジタル音声ストリームは、前記第１のデジタル音声ストリームを含まない、
ことを特徴とする請求項８記載のデジタル音声通信制御装置。
前記第一ミキシング部は、複数のデジタル音声ストリームのミキシングを行う際に、音声レベルやゲイン調整を行い、
前記第二ミキシング部は、前記第一ミキシング部に比較して小さなサイズのバッファを利用して、２つのデジタル音声ストリームのミキシングに必要な処理のみを行う、
ことを特徴とする請求項８記載のデジタル音声通信制御装置。
前記音声入力部と、前記Ａ／Ｄ変換部と、前記Ｄ／Ａ変換部と、前記音声フィードバック部は、
複数のアナログ音声入力信号又は複数の前記アナログ音声出力信号に対して、それぞれ独立して処理を行い、
前記第二ミキシング部は、
それぞれが２つのアナログ音声信号からなる複数の前記アナログ音声出力信号および前記アナログ音声変換信号に対して、それぞれ独立して処理を行う、
ことを特徴とする請求項８記載のデジタル音声通信制御装置。
前記Ａ／Ｄ変換部と、前記Ｄ／Ａ変換部と、前記音声フィードバック部が扱うアナログ音声入力信号又はアナログ音声変換信号又はアナログ音声出力信号はそれぞれ２つであって、
そのうちの１つの前記アナログ音声入力信号又は前記アナログ音声変換信号又は前記アナログ音声出力信号は、アナウンス用に用い、残りの１つのデジタル音声ストリームは通話用に用いる、
ことを特徴とする請求項１２記載のデジタル音声通信制御装置。
前記第一ミキシング部が生成するデジタル音声ストリームを決定する際の特定条件は、発生中のそれぞれのエリアに対するアナウンスで用いるデジタル音声ストリーム、及び発生中の通話に参加している全人員のデジタル音声ストリーム、及び発生中の全エリアのアナウンスに用いるデジタル音声ストリーム、及び特定話者が参加中の通話に参加している全人員から特定話者を除いた人員のデジタル音声ストリーム、を対象とする、
ことを特徴とする請求項３又は請求項９記載のデジタル音声通信制御装置。
前記第一ミキシング部が生成するデジタル音声ストリームを決定する際の特定条件は、発生中のそれぞれのエリアに対するアナウンスで用いるデジタル音声ストリーム、及び発生中の通話に参加している全人員のデジタル音声ストリーム、及び発生中の全エリアのアナウンスのうち、事前に特定話者に転送すると定義されたアナウンスに用いるデジタル音声ストリーム、及び特定話者が参加中の通話に参加している全人員から特定話者を除いた人員のデジタル音声ストリーム、を対象とする、
ことを特徴とする請求項３又は請求項９記載のデジタル音声通信制御装置。
航空機や電車等の乗り物に装備し、アナウンス機能、通話機能を提供する、
ことを特徴とする請求項７又は請求項１３記載のデジタル音声通信制御装置。
音声入力部及び音声フィードバック部は、フライトデッキ席又は運転士席の特定話者との音声入出力に使用する、
ことを特徴とする請求項１６記載のデジタル音声通信制御装置。
特定話者からのアナログ音声信号を受信する音声入力ステップと、
前記アナログ音声信号を第１のデジタル音声ストリームに変換するＡ／Ｄ変換ステップと、
前記特定話者以外の１人以上の話者のデジタル音声ストリームを構成するデジタル音声パケットとデータパケットが多重化されたデジタルデータを受信し、前記デジタルデータから前記デジタル音声パケットのみを抽出するデジタル音声パケット受信ステップと、
前記デジタル音声パケット受信ステップで抽出したデジタル音声パケットを、話者ごとのデジタル音声パケットに分離し、話者ごとの第２のデジタル音声ストリームを構築するデジタル音声パケット分離ステップと、
前記第１のデジタル音声ストリームと前記第２のデジタル音声ストリームとをミキシングし、第３のデジタル音声ストリームを１つ以上生成する、第一ミキシングステップと、
前記第１のデジタル音声ストリームと前記第３のデジタル音声ストリームのうちの１つのデジタル音声ストリームとをミキシングし、第４の出力デジタル音声ストリームを生成する、第二ミキシングステップと、
前記第一ミキシングステップで生成した、１つ以上の前記第３のデジタル音声ストリームを多重化し、装置外部へ出力するデジタル音声パケット送信ステップと、
前記第二ミキシングステップで生成した、前記第４のデジタル音声ストリームをアナログ音声信号に変換するＤ／Ａ変換ステップと、
前記Ｄ／Ａ変換ステップで変換した前記アナログ音声信号を、装置外部に出力する音声フィードバックステップと、
からなることを特徴とするデジタル音声通信制御方法。
前記音声入力ステップと、前記Ａ／Ｄ変換ステップと、前記Ｄ／Ａ変換ステップと、前記音声フィードバックステップは、
複数のアナログ音声信号又は複数の前記第４のデジタル音声ストリームに対して、それぞれ独立して処理を行い、
前記第二ミキシングステップは、
それぞれが２つのデジタル音声ストリームからなる複数の前記第１および前記第３のデジタル音声ストリームに対して、それぞれ独立して処理を行い、
前記複数のアナログ音声信号又は複数の前記第４のデジタル音声ストリーム又は複数の前記第１および前記第３のデジタル音声ストリームのうち、少なくとも１つはアナウンス用に用い、少なくとも１つは通話用に用いる、
ことを特徴とする請求項１８記載のデジタル音声通信制御方法。