JP2010147864A - 通信装置 - Google Patents
通信装置 Download PDFInfo
- Publication number
- JP2010147864A JP2010147864A JP2008323753A JP2008323753A JP2010147864A JP 2010147864 A JP2010147864 A JP 2010147864A JP 2008323753 A JP2008323753 A JP 2008323753A JP 2008323753 A JP2008323753 A JP 2008323753A JP 2010147864 A JP2010147864 A JP 2010147864A
- Authority
- JP
- Japan
- Prior art keywords
- bit rate
- data
- unit
- audio
- audio data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
- Telephonic Communication Services (AREA)
Abstract
【課題】複数の通信を伴うサービスを限られた帯域内で行う場合に、各サービスの品質を向上させることのできる技術を提供する。
【解決手段】端末10は、通信ネットワーク20を介して他の端末10と音声通信、映像通信及びデータ通信を行う。このとき、端末10は、音声データ以外のデータ(非音声データ)の単位時間当たりの送信量を検出し、検出した送信量に応じて、音声データのビットレートを決定する。端末10は、決定したビットレートでエンコードされた音声データを他の端末10へ送信する。
【選択図】図1
【解決手段】端末10は、通信ネットワーク20を介して他の端末10と音声通信、映像通信及びデータ通信を行う。このとき、端末10は、音声データ以外のデータ(非音声データ)の単位時間当たりの送信量を検出し、検出した送信量に応じて、音声データのビットレートを決定する。端末10は、決定したビットレートでエンコードされた音声データを他の端末10へ送信する。
【選択図】図1
Description
本発明は、通信装置に関する。
通信網を介して接続された複数の通信端末間で通信を行う際に、送信拠点と受信拠点の間のスループットを測定し、同時に発生する全ての通信のピークの合計値が測定結果を超えないように通信量(音声や、映像のビットレート)を設定する方法が提案されている。また、特許文献1には、各利用者端末における映像および音声の送信と、双方向通信サーバ10による映像及び音声の配信を、ネットワークの通信帯域に応じて品質を変更する技術が提案されている。特許文献1に記載の技術によれば、使用できる通信帯域を検出し、これが制限されるときはその通信帯域に応じて送信する映像のフレームレートを下げることにより、ネットワークの通信帯域が制限されても通信帯域に対応した品質での双方向対話機能が維持され、最適なサービスの提供が可能となる。
特開2006−174511号公報
ところで、同時に発生する全ての通信のピークの合計値が、送信拠点と受信拠点の間のスループットの測定結果以下になるように設定した場合、通信のピークが重なる頻度が低い場合は、帯域を有効に利用できない。100Kbps以下の帯域で音声が映像を送信する場合には特に問題になる。例えば、資料を表示し、音声で説明するような形態の会議では、ほとんどの時間、音声のみを送信しており、資料の送信時間が全体に占める割合が極めて少ない。しかし、通常、音声のエンコーダと資料の送信機能は独立して動作するため、資料を送信している間のみビットレートを下げることはできない。よって、使用する帯域を制限する場合、音声と資料の送信を同時に行った場合に予め定められた帯域を越えないようにしなければならない。結果として、音声のみ送信している時間は、使用できる帯域を余すことになり、帯域を有効活用できない。これは、同時に動作するサービスが増えれば増えるほど、帯域を有効利用できないことを意味する。
本発明は上述した背景に鑑みてなされたものであり、複数の通信を伴うサービスを限られた帯域内で行う場合に、各サービスの品質を向上させることのできる技術を提供することを目的とする。
本発明は上述した背景に鑑みてなされたものであり、複数の通信を伴うサービスを限られた帯域内で行う場合に、各サービスの品質を向上させることのできる技術を提供することを目的とする。
上記課題を解決するために、本発明は、音声データおよび非音声データを送信する送信手段と、前記非音声データの単位時間当たりの送信量を検出する検出手段と、前記検出手段により検出された送信量に応じて、前記音声データのビットレートを決定する決定手段と、前記決定手段により決定されたビットレートでエンコードされた音声データを前記送信手段に供給する供給手段とを具備することを特徴とする通信装置を提供する。
本発明の好ましい態様において、前記供給手段は、前記送信手段に供給する音声データのビットレートを前記決定手段により決定されたビットレートに変更する場合には、予め定められた期間において、前記決定手段により決定されたビットレートでエンコードされた音声データと変更前のビットレートでエンコードされた音声データとを、時分割で混合して前記送信手段に供給してもよい。
本発明の更に好ましい態様において、前記供給手段は、前記送信手段に供給する音声データのビットレートを変更する場合には、前記決定手段により決定されたビットレートでエンコードされた音声データと変更前のビットレートでエンコードされた音声データの割合を時間の経過に伴って変化させてもよい。
また、本発明の更に好ましい態様において、前記供給手段は、前記割合をスプライン曲線に基づいて変化させてもよい。
また、本発明の別の好ましい態様において、前記供給手段は、前記送信手段に供給する音声データのビットレートを前記決定手段により決定されたビットレートに変更する場合には、前記送信手段への音声データの供給が途切れたタイミングで変更してもよい。
また、本発明の別の好ましい態様において、前記供給手段は、前記送信手段に供給する音声データのビットレートを前記決定手段により決定されたビットレートに変更する場合には、前記決定手段により決定されたビットレートと前記送信手段に供給中の音声データのビットレートとの中間値でエンコードされた音声データを前記送信手段に供給した後に、前記決定手段により決定されたビットレートでエンコードされた音声データを前記送信手段に供給してもよい。
本発明によれば、複数の通信を伴うサービスを限られた帯域内で行う場合に、各サービスの品質を向上させることができる。
<第1実施形態>
<構成>
図1は、この発明の一実施形態である遠隔会議システム1の構成を示すブロック図である。この遠隔会議システム1は、複数の拠点のそれぞれに設置された複数の端末10a,10b,10c,10dがそれぞれ、ルータ40a,40b,40c,40dを介して、インターネット等の通信ネットワーク20に接続されて構成される。なお、図1においては4つの端末10a,10b,10c,10dを図示しているが、端末の数は4に限定されるものではなく、これより多くても少なくてもよい。また、以下の説明においては、説明の便宜上、端末10a,10b,10c,10dを各々区別する必要がない場合には、これらを「端末10」と称して説明する。同様に、ルータ40a,40b,40c,40dを各々区別する必要がない場合には、これらを「ルータ40」と称して説明する。遠隔会議の参加者が端末10を用いて通信を行うことで、遠隔会議が実現される。
<構成>
図1は、この発明の一実施形態である遠隔会議システム1の構成を示すブロック図である。この遠隔会議システム1は、複数の拠点のそれぞれに設置された複数の端末10a,10b,10c,10dがそれぞれ、ルータ40a,40b,40c,40dを介して、インターネット等の通信ネットワーク20に接続されて構成される。なお、図1においては4つの端末10a,10b,10c,10dを図示しているが、端末の数は4に限定されるものではなく、これより多くても少なくてもよい。また、以下の説明においては、説明の便宜上、端末10a,10b,10c,10dを各々区別する必要がない場合には、これらを「端末10」と称して説明する。同様に、ルータ40a,40b,40c,40dを各々区別する必要がない場合には、これらを「ルータ40」と称して説明する。遠隔会議の参加者が端末10を用いて通信を行うことで、遠隔会議が実現される。
図2は、端末10の構成の一例を示すブロック図である。図2に示す例では、説明の便宜上、送信側の端末10を「端末10A」とし、受信側の端末10を「端末10B」として説明する。また、以下の説明においては、送信側の端末10Aについては送信処理において特徴的な構成について主に説明するとともに、受信側の端末10Bについては受信処理において特徴的な構成について主に説明する。また、送信側の端末10Aのルータ40を「ルータ40A」とし、受信側の端末10Bのルータ40を「ルータ40B」として説明する。
図において、マイクロホン15は、収音し、収音した音声を表す音声データを出力する。撮影部19は、撮影し、撮影した映像を表す映像データを出力する。コンピュータ装置30は、例えばパーソナルコンピュータであり、遠隔会議等で用いられる資料を表す画像データや会議の参加者を模した画像を表す画像データ等を出力する。ここでは、コンピュータ装置30から画像データが出力される場合について説明するが、コンピュータ装置30から出力されるデータは画像データに限らず、例えば、テキストデータやHTMLデータなどであってもよく、会議の資料や参加者等に関するデータであればどのようなものであってもよい。
端末10Aは、マイクロホン15で収音された音声を表す音声データと、撮影部19で撮影された映像を表す映像データと、コンピュータ装置30から出力されるデータとを、受信側の端末10Bへ送信する。以下の説明では、説明の便宜上、端末10Aへ送信されるデータのうち、音声データ以外のデータ(すなわち映像データとコンピュータ装置30から出力されるデータ)を「非音声データ」と称して説明する。
音声エンコード部111は、マイクロホン15から出力される音声データを、複数のビットレートでそれぞれエンコードし、エンコードした音声データを各々音声送信部112へ出力する。ここでは、音声エンコード部111は、マイクロホン15から出力される音声データを、8kbps、16kbps、32kbps、64kbps、96kbpsの5種類のビットレートでそれぞれエンコードし、エンコードした音声データを各々音声送信部112へ出力する。
音声送信部112は、音声エンコード部111から出力される複数種類のエンコード済の音声データからいずれかひとつを選択し、選択した音声データを通信部18へ供給する。このとき、音声送信部112は、非音声データの単位時間当たりの送信量を検出し、検出した送信量に応じてビットレートを決定する。音声送信部112は、決定したビットレートでエンコードされた音声データを選択し、通信部18に供給する。より具体的には、音声送信部112は、非音声データの単位時間当たりの送信量が大きいほど、音声データのビットレートを低くする。例えば、音声送信部112は、非音声データを送信している期間は音声データのビットレートを下げる(例えば8kbps)一方、非音声データを送信していない(又は非音声データの送信量が少ない)期間は音声データのビットレートを上げる(例えば44kbps)。
このとき、音声送信部112は、決定したビットレートを示すデータをヘッダに含めて音声データを送信する。
このとき、音声送信部112は、決定したビットレートを示すデータをヘッダに含めて音声データを送信する。
映像エンコード部113は、撮影部19から出力される映像データを、複数のビットレートでそれぞれエンコードし、エンコードした音声データを各々映像送信部114へ出力する。ここでは、映像エンコード部113は、撮影部19から出力される映像データを、16kbps、32kbps、64kbps、96kbps、128kbpsの5種類のビットレートでエンコードし、エンコードした映像データを各々映像送信部114へ出力する。
映像送信部114は、映像エンコード部113から出力される複数種類のエンコード済の映像データからいずれかひとつを選択し、選択した映像データを通信部18へ供給する。このとき、映像送信部114は、映像データ以外のデータの単位時間当たりの送信量を検出し、検出した送信量に応じて、映像データのビットレートを決定する。映像送信部114は、決定したビットレートでエンコードされた映像データを選択し、通信部18に供給する。より具体的には、映像送信部114は、映像データ以外のデータの単位時間当たりの送信量が大きいほど、映像データのビットレートを低くする。例えば、映像送信部114は、映像データ以外のデータを送信している期間においては映像データのビットレートを下げる一方、映像データ以外のデータを送信していない(又は映像データ以外のデータの送信量が少ない)期間においては映像データのビットレートを上げる。
このとき、映像送信部114は、決定したビットレートを示すデータをヘッダに含めて映像データを送信する。
このとき、映像送信部114は、決定したビットレートを示すデータをヘッダに含めて映像データを送信する。
キャプチャ画像データ生成部115は、コンピュータ装置30から出力される画像データに基づいて、該画像データの表す画像をキャプチャしてキャプチャ画像データを生成する。このとき、キャプチャ画像データ生成部115は、画像をキャプチャし、前回生成したキャプチャ画像との間で差分が発生している場合のみキャプチャ画像データを生成する。
キャプチャ画像送信部116は、キャプチャ画像データ生成部115によって生成されたキャプチャ画像データを帯域測定部117からの通知に応じたレートで送信する。帯域測定部117は、端末10Aの通信における使用帯域を測定し、測定結果をキャプチャ画像送信部116に通知する。
通信部18は、他の端末10との間で通信ネットワーク20を介して通信を行うための通信手段である。通信部18は、音声送信部112から供給される音声データ、映像送信部114から供給される映像データ、及びキャプチャ画像送信部116から供給されるキャプチャ画像データを、受信側の端末10Bへ送信する。端末10Aから送信された音声データ及び非音声データは、ルータ40A及びルータ40Bを介して端末10Bで受信される。
次に、受信側の端末10Bの構成の一例について図2を参照しつつ説明する。端末10Bの通信部18は、音声データ、映像データ及びキャプチャ画像データを受信し、受信した音声データを音声受信部118へ供給するとともに、受信した映像データを映像受信部120へ供給する。また、通信部18は受信したキャプチャ画像データをキャプチャ画像受信部122へ供給する。
音声受信部118は、通信部18から供給される音声データのヘッダを参照して、音声デコーダ119a,119b,119c,119d,119eのいずれかを選択し、選択した音声デコーダに対して音声データを供給する。
音声デコーダ119a,119b,119c,119d,119eはそれぞれ、入力される音声データをデコードし、スピーカ17に出力する。音声デコーダ119aは入力される音声データを8kbpsでデコードする。音声デコーダ119bは入力される音声データを16kbpsでデコードする。音声デコーダ119cは入力される音声データを32kbpsでデコードする。音声デコーダ119dは入力される音声データを64kbpsでデコードする。音声デコーダ119eは入力される音声データを96kbpsでデコードする。なお、以下の説明においては、説明の便宜上、音声デコーダ119a,119b,119c,119d,119eを各々区別する必要がない場合には、これらを「音声デコーダ119」と称して説明する。
スピーカ17は、音声デコーダ119から出力される音声データに応じて放音する。音声デコーダ119から出力される音声データはスピーカ17に出力され、スピーカ17から音として放音される。
映像受信部120は、通信部18から供給される映像データのヘッダを参照して、映像デコーダ121a,121b,121c,121d,121eのうちのいずれかを選択し、選択した映像デコーダに対して映像データを供給する。
映像デコーダ121a,121b,121c,121d,121eはそれぞれ、入力される映像データをデコードし、表示部13に出力する。映像デコーダ121aは入力される音声データを16kbpsでデコードする。映像デコーダ121bは入力される画像データを32kbpsでデコードする。映像デコーダ121cは入力される画像データを64kbpsでデコードする。映像デコーダ121dは入力される画像データを96kbpsでデコードする。映像デコーダ119eは入力される画像データを128kbpsでデコードする。なお、以下の説明においては、説明の便宜上、映像デコーダ121a,121b,121c,121d,121eを各々区別する必要がない場合には、これらを「映像デコーダ121」と称して説明する。
表示部13は、液晶パネル等を備え、映像デコーダ121から供給される映像データに応じて映像を表示する。映像デコーダ121から出力される映像データは表示部13に出力され、表示部13に映像として表示される。
キャプチャ画像受信部122は、通信部18から供給されるキャプチャ画像データを画像復元部123へ出力する。画像復元部123は、キャプチャ画像受信部122から供給されるキャプチャ画像データを復元し、指定されたフォーマットでコンピュータ装置30へ出力する。コンピュータ装置30は、画像復元部123から供給されるデータに応じて資料等の画像を表示する。
<動作>
次に、本実施形態の動作について説明する。端末10の利用者によって遠隔会議を開始する旨の操作が行われると、端末10は、マイクロホン15で収音した音声を表す音声データを他の端末10へ送信するとともに、撮影部19で撮影された映像データを他の端末10へ送信する。また、端末10は、他の端末10から音声データを受信し、受信した音声データをスピーカ17から音として放音するとともに、他の端末10から映像データを受信し、受信した映像データの示す映像を表示部13に表示させる。また、端末10は、コンピュータ装置30から入力された画像データに基づいたキャプチャ画像データを他の端末10へ送信するとともに、他の端末10からキャプチャ画像データを受信し、受信したキャプチャ画像データをコンピュータ装置30へ出力する。
次に、本実施形態の動作について説明する。端末10の利用者によって遠隔会議を開始する旨の操作が行われると、端末10は、マイクロホン15で収音した音声を表す音声データを他の端末10へ送信するとともに、撮影部19で撮影された映像データを他の端末10へ送信する。また、端末10は、他の端末10から音声データを受信し、受信した音声データをスピーカ17から音として放音するとともに、他の端末10から映像データを受信し、受信した映像データの示す映像を表示部13に表示させる。また、端末10は、コンピュータ装置30から入力された画像データに基づいたキャプチャ画像データを他の端末10へ送信するとともに、他の端末10からキャプチャ画像データを受信し、受信したキャプチャ画像データをコンピュータ装置30へ出力する。
このとき、端末10は、非音声データの単位時間当たりの送信量を検出し、検出した送信量に応じて音声データのビットレートを決定する。ここでは、端末10は、検出した非音声データの送信量が多いほど、音声データのビットレートを低くする。このビットレートの決定処理(変更処理)は、例えば、音声送信部112が、予め定められた単位時間毎(例えば、1分毎、10分毎、等)に行うようにしてもよく、また、例えば、検出された送信量が予め定められた条件を満たす場合に帯域配分を決定(変更)するようにしてもよく、要は、音声送信部112が、予め定められたタイミングでビットレートの変更処理を行うようにすればよい。音声送信部112は、決定したビットレートでエンコードされた音声データを他の端末10へ送信する。
ここで、ビットレートの変更処理の具体的な内容の例について、図面を参照しつつ説明する。以下の動作例では、目標帯域を100kbpsとし、音声データのみを送信する場合は64kbpsで、映像データのみを送信する場合は96kbpsで通信を行う。一方、映像データと音声データとを同時に送信する場合には、音声データを32kbps、映像データを64kbpsで送信する。
<動作例1>
この動作例では、端末10が音声通信のみを行っている状態において、音声通信及び映像通信に切り替える場合の動作について図3乃至図6を参照しつつ説明する。図3は、音声データ通信を64kbpsで行っている状態を示す。図3において、ひとつのブロックが1パケットを示している。また、図3においてペイロードは1000byteとする。端末10の音声送信部112は、非音声データの単位時間当たりの送信量を検出する。このとき、非音声データの送信は行われていないため、音声送信部112は、音声データのビットレートを64kbpsと決定し、決定したビットレートでエンコードされた音声データを送信する。
この動作例では、端末10が音声通信のみを行っている状態において、音声通信及び映像通信に切り替える場合の動作について図3乃至図6を参照しつつ説明する。図3は、音声データ通信を64kbpsで行っている状態を示す。図3において、ひとつのブロックが1パケットを示している。また、図3においてペイロードは1000byteとする。端末10の音声送信部112は、非音声データの単位時間当たりの送信量を検出する。このとき、非音声データの送信は行われていないため、音声送信部112は、音声データのビットレートを64kbpsと決定し、決定したビットレートでエンコードされた音声データを送信する。
次に、音声通信のみを行っている状態において映像送信イベントが発生した場合の送信制御について説明する。映像送信イベントが発生すると、端末10は、図4に示すように、映像データの送信を開始する。このとき、端末10の映像送信部114は、映像データ以外のデータの単位時間当たりの送信量を検出する。このとき、音声データの送信が64kbpsで行われているため、映像送信部114は、映像データのビットレートを64kbpsと決定し、決定したビットレートでエンコードされた映像データの送信を開始する。
一方、音声送信部112は、映像送信イベントが発生すると、非音声データ(すなわちこの動作例では映像データ)の単位時間当たりの送信量を検出し、検出された送信量に応じて、音声データのビットレートを決定する。ここでは、音声送信部112は、音声データのビットレートを32kbpsと決定する。すなわち、音声送信部112は、音声データのビットレートを64kbpsから32kbpsに変更すると決定する。
音声送信部112は、決定されたビットレートでエンコードされた音声データを通信部18に供給する。すなわち、音声送信部112は、通信部18に供給する音声データを、64kbpsでエンコードされた音声データから32kbpsでエンコードされた音声データに切り替える。
このとき、音声データのビットレートが突然に切り替わると、音声を聴取する聴取者が違和感を覚える場合がある。そこで、この動作例では、音声送信部112は、ビットレートを切り替える際には、予め定められた期間が経過するまでの間、ビットレートの異なる複数の音声データを時分割で混合して送信する。より具体的には、音声送信部112は、図5に示すように、32kbpsの音声データと64kbpsの音声データとを時分割で混合して送信する。
予め定められた期間が経過すると、音声送信部112は、図6に示すように、64kbpsの音声データの送信を停止し、32kbpsの音声データのみを送信する。このように、音声データのビットレートを変更する際に、予め定められた期間においてビットレートの異なる複数の音声データを混合して送信することにより、聴取者が感じる違和感を軽減することができる。また、図6において、映像送信部114は、音声データの単位時間当たりの送信量を検出し、検出結果に応じて、映像データのビットレートを32kbpsから64kbpsに変更する。
なお、この動作例では、音声データと映像データとを送信する場合について説明したが、キャプチャ画像データを送信する場合は、キャプチャ画像データの送信レート(単位時間当たりの送信量)を図3乃至図6の映像データのビットレートと同じように制御する。なお、キャプチャ画像データの送信レート(単位時間当たりの送信量)の制御処理の内容については、映像データのビットレートと同様であるため、ここではその詳細な説明を省略する。
<動作例2>
次に、音声通信と映像通信とを行っている最中において、音声終了イベントが発生した場合の動作について、図7及び図8を参照しつつ説明する。図7は、32kbpsで音声通信を行うとともに、64kbpsで映像通信を行っている状態を示す。図7に示す状態において、音声終了イベントが発生した場合(又は無音状態になり、音声を送信する必要が無い場合)には、音声送信部112は、音声データの送信を停止する。このとき、映像送信部114は、映像データ以外のデータの単位時間当たりの送信量を検出し、検出結果に応じて、映像データのビットレートを64kbpsから96kbpsに変更する(図8参照)。このように、この動作例では、映像送信部114が、映像データ以外のデータの単位時間当たりの送信量に応じて、映像データのビットレートを変更するから、限られた帯域の利用効率を上げることができる。
次に、音声通信と映像通信とを行っている最中において、音声終了イベントが発生した場合の動作について、図7及び図8を参照しつつ説明する。図7は、32kbpsで音声通信を行うとともに、64kbpsで映像通信を行っている状態を示す。図7に示す状態において、音声終了イベントが発生した場合(又は無音状態になり、音声を送信する必要が無い場合)には、音声送信部112は、音声データの送信を停止する。このとき、映像送信部114は、映像データ以外のデータの単位時間当たりの送信量を検出し、検出結果に応じて、映像データのビットレートを64kbpsから96kbpsに変更する(図8参照)。このように、この動作例では、映像送信部114が、映像データ以外のデータの単位時間当たりの送信量に応じて、映像データのビットレートを変更するから、限られた帯域の利用効率を上げることができる。
<動作例3>
次に、音声通信と映像通信とを行っている最中において、映像終了イベントが発生した場合の動作について、図9乃至図11を参照しつつ説明する。図9は、32kbpsで音声通信を行うとともに、64kbpsで映像通信を行っている状態を示す。図9に示す状態において、映像終了イベントが発生した場合、映像送信部114は、映像データの送信を停止する。このとき、音声送信部112は、非音声データの単位時間当たりの送信量を検出し、検出結果に応じて、音声データのビットレートを32kbpsから64kbpsに変更する。このとき、音声データのビットレートが変更される際に聴取者が感じる違和感を軽減するために、音声送信部112は、予め定められた時間が経過するまでの間、ビットレートの異なる複数の音声データを時分割で混合して送信する。すなわち、音声送信部112は、図10に示すように、32kbpsの音声データと64kbpsの音声データとを時分割で混合して送信する。
次に、音声通信と映像通信とを行っている最中において、映像終了イベントが発生した場合の動作について、図9乃至図11を参照しつつ説明する。図9は、32kbpsで音声通信を行うとともに、64kbpsで映像通信を行っている状態を示す。図9に示す状態において、映像終了イベントが発生した場合、映像送信部114は、映像データの送信を停止する。このとき、音声送信部112は、非音声データの単位時間当たりの送信量を検出し、検出結果に応じて、音声データのビットレートを32kbpsから64kbpsに変更する。このとき、音声データのビットレートが変更される際に聴取者が感じる違和感を軽減するために、音声送信部112は、予め定められた時間が経過するまでの間、ビットレートの異なる複数の音声データを時分割で混合して送信する。すなわち、音声送信部112は、図10に示すように、32kbpsの音声データと64kbpsの音声データとを時分割で混合して送信する。
予め定められた期間が経過すると、音声送信部112は、図11に示すように、32kbpsの音声データの送信を停止し、64kbpsの音声データのみを送信する。このように、音声データのビットレートを変更する際に、予め定められた期間においてビットレートの異なる複数の音声データを混合して送信することにより、聴取者が感じる違和感を軽減することができる。
以上説明したように本実施形態によれば、拠点間で映像や音声、画像などを送受信する場合、同時に発生する通信に対し、その合計帯域が設定した通信帯域を越えないよう、決められた通信帯域内で通信するために、エンコーダのビットレートやデータの転送レートをアプリケーション間で協調しながら動的に制御する。例えば、画像を送信している数秒間のみ音声品質を低下(ビットレートを低くする)させ、それ以外は高品質な(ビットレートの高い)音声を送信するように制御する。すなわち、本実施形態では、アプリケーション間で通信中かどうかの情報を共有し、複数の通信が重なっている間は、それぞれの使用帯域を下げ、重なっていないときには使用帯域を上げる。このようにすることにより、複数の通信を伴うサービスを限られた帯域内で行う場合に、各サービスの品質を向上させることができる。
また、本実施形態では、音声データのビットレートを変更する際に、予め定められた期間の間、ビットレートの異なる複数の音声データを時分割で混合して送信する。このようにすることにより、ビットレートが変更される際の聴取者の違和感を軽減することができる。
また、本実施形態では、使用する帯域を制御するために、複数のエンコーダで複数のビットレートのデータを同時に作成する。このようにすることにより、切替時にノイズが発生することがなく、切替時の聴取者の違和感を軽減することができる。
<第2実施形態>
次に、この発明の第2の実施形態について説明する。図12は、この実施形態に係る端末10の構成の一例を示すブロック図である。図12は、上述した第1実施形態における図2に対応するものである。図12に示す端末10の構成が上述した第1の実施形態において図2に示した端末10と異なる点は、送信側の端末10Cがサンプリングレート変換器110を有している点と、音声送信部112Cの処理が異なる点であり、他の構成については上述した第1の実施形態のそれと同様である。そのため、以下の説明においては、上述した第1の実施形態と同様の構成要素については同じ符号を付して適宜その説明を省略する。
次に、この発明の第2の実施形態について説明する。図12は、この実施形態に係る端末10の構成の一例を示すブロック図である。図12は、上述した第1実施形態における図2に対応するものである。図12に示す端末10の構成が上述した第1の実施形態において図2に示した端末10と異なる点は、送信側の端末10Cがサンプリングレート変換器110を有している点と、音声送信部112Cの処理が異なる点であり、他の構成については上述した第1の実施形態のそれと同様である。そのため、以下の説明においては、上述した第1の実施形態と同様の構成要素については同じ符号を付して適宜その説明を省略する。
図12において、サンプリングレート変換器110は、マイクロホン15から出力される音声データを、複数のサンプリングレートのいずれかでサンプリングし、サンプリングした音声データを各々音声エンコード部111へ出力する。ここでは、サンプリングレート変換器110は、マイクロホン15から出力される44.1kHzの音声データのサンプリングレートを、44.1kHz,22.05kHz,11.025kHz,8kHzのいずれかに変換し、サンプリングレートを変換した音声データを音声エンコード部111へ出力する。
この実施形態では、音声送信部112Cは、非音声データの送信量に応じてビットレートを切り替える際に、サンプリングレートを変更することによって切替時の違和感を減少させる。この具体的な動作の一例について、図13を参照しつつ説明する。図13は、この実施形態の動作の一例を示す図である。図13に示す例においては、音声データのビットレートを64Kbpsから8kbpsに切り替える場合を例示している。図13において、音声送信部112Cは、非音声データの単位時間当たりの送信量を検出し、検出した送信量に応じてビットレートを決定する。このとき、音声送信部112Cは、ビットレートを切り替えるときに、サンプリングレート変換器110を制御してサンプリングレートを徐々に切り替える。より具体的には、例えば、図13に示す例においては、音声送信部112Cは、ビットレートを切り替えるに先立って、サンプリングレートを、44.1kHzから、22.05kHz、11.025kHz、8kHzの順に変更する(図13の(a)乃至(d)参照)。なお、音声エンコード部111は、第1の実施形態と同様に、同時に複数のビットレートでエンコードを行う。サンプリングレートが8kHzに変更された後に、音声送信部112は、サンプリングレートを11.025kHzに変更するとともに、ビットレートを8kbpsに変更する(図13の(e)参照)。このようにすることで、ビットレートを切り替える際の違和感が軽減される。
<変形例>
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限定されることなく、他の様々な形態で実施可能である。以下にその例を示す。なお、以下の各態様を適宜に組み合わせてもよい。
(1)上述の実施形態では、音声エンコード部111は、8kbps、16kbps、32kbps、64kbps、96kbpsの5種類のビットレートでそれぞれエンコードを行ったが、ビットレートの値はこれらに限らず、他の値であってもよい。また、上述の実施形態では、5種類のビットレートでエンコードを行ったが、エンコードするビットレートの種類の数はこれに限らず、これより多くても少なくてもよい。音声デコーダについても同様であり、他のビットレートでデコードするようにしてもよく、また、デコーダの数は上述した実施形態で示したものより多くても少なくてもよい。要は、音声エンコード部111がエンコードを行う際のビットレートと音声デコーダ119のビットレートとが対応していればよい。
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限定されることなく、他の様々な形態で実施可能である。以下にその例を示す。なお、以下の各態様を適宜に組み合わせてもよい。
(1)上述の実施形態では、音声エンコード部111は、8kbps、16kbps、32kbps、64kbps、96kbpsの5種類のビットレートでそれぞれエンコードを行ったが、ビットレートの値はこれらに限らず、他の値であってもよい。また、上述の実施形態では、5種類のビットレートでエンコードを行ったが、エンコードするビットレートの種類の数はこれに限らず、これより多くても少なくてもよい。音声デコーダについても同様であり、他のビットレートでデコードするようにしてもよく、また、デコーダの数は上述した実施形態で示したものより多くても少なくてもよい。要は、音声エンコード部111がエンコードを行う際のビットレートと音声デコーダ119のビットレートとが対応していればよい。
(2)上述の実施形態では、音声送信部112は、音声データのビットレートを切り替える際には、予め定められた期間が経過するまでの間、ビットレートの異なる複数の音声データ(すなわち変更前のビットレートでエンコードされた音声データと変更後のビットレートでエンコードされた音声データ)を時分割で混合して送信するようにした(図5、図10参照)。この予め定められた期間において、音声送信部112が、音の種類(人の声、音楽など)に合わせ、聴取者が違和感を覚えないように策定した関数に従い割合を変化させるようにしてもよい。具体的には、例えば、音声送信部112が、図14及び図15に例示するように、16kbps(変更前のビットレート)の音声データと8kbps(変更後のビットレート)の音声データとの割合を時間の経過に伴って直線的に変化させるようにしてもよい。このように送信する音声データの割合を時間の経過に伴って徐々に変化させることによって、聴取者が感じる違和感を軽減することができる。
また、割合の変更態様の他の例として、例えば、図16及び図17に例示するように、音声送信部112が、16kbps(変更前のビットレート)の音声データと8kbps(変更後のビットレート)の音声データとの割合を、スプライン曲線に基づいて変化させるようにしてもよい。このように送信する音声データの割合を時間の経過に伴って徐々に変化させることによって、聴取者が感じる違和感を軽減させることができる。
また、割合の変更態様を、音の種類(人の声、音楽など)に応じて異ならせるようにしてもよい。この場合は、例えば、音の特徴(スペクトル等)を表す特徴データと、割合の変更態様(直前的に変更、スプライン曲線に基づいて変更、等)とを予めメモリ等の記憶手段に記憶しておく構成とし、端末10の音声送信部112が、音声エンコード部111から供給される音声データから音声の特徴を抽出し、抽出結果を記憶手段に記憶された特徴データと照合し、照合結果に応じて割合の変更態様を決定するようにしてもよい。
(3)また、上述の実施形態では、音声送信部112は、音声データのビットレートを切り替える際に、予め定められた期間が経過するまでの間、変更前のビットレートでエンコードされた音声データと変更後のビットレートでエンコードされた音声データとを時分割で混合して送信するようにしたが、音声データのビットレートの切替の態様はこれに限らない。例えば、音声送信部112が、音声データのビットレートを複数段階に分けて徐々に変更するようにしてもよい。より具体的には、例えば、音声送信部112が、音声データのビットレートを変更する際には、変更前のビットレートと変更後のビットレートとの中間値でエンコードされた音声データを、予め定められた期間が経過するまでの間送信するようにしてもよい。例えば、音声データのビットレートを32kbpsから96kbpsに変更する場合には、音声送信部112が、32kbpsと96kbpsの中間値である64kbpsの音声データを予め定められた期間送信した後に、96kbpsの音声データに切り替えるようにしてもよい。
また、音声データのビットレートの切替の態様の他の例として、例えば、音声送信部112が、通信部18への音声データの供給が途切れたタイミング(又は無音になったタイミング)でビットレートを切り替えるようにしてもよい。
(4)上述の実施形態において、通信ネットワーク上のトラフィックが増大している期間は、音声データのビットレートを下げ、そうでない期間は音声データのビットレートを上げるようにしてもよい。
(5)上述の実施形態では、本発明に係る端末(通信装置)を用いて遠隔会議を行う場合について説明したが、本発明はこれに限らず、例えば、通信ネットワークを介して講義や講演を行う場合等においても本発明を適用することができる。これ以外にも、音声通信、映像通信及び資料等のデータ装置等の複数種類の通信を併用するシステムにおいて本発明を適用することができる。
(6)上述の実施形態に係る端末10の各部は、ハードウェアとして構成されていてもよく、また、CPU等の制御手段がメモリ等に記憶されたコンピュータプログラムを読み出して実行することによってソフトウェアとして実現されるものであってもよい。端末10の各部がソフトウェアとして実現される場合には、端末10の制御手段によって実行されるコンピュータプログラムは、磁気記録媒体(磁気テープ、磁気ディスクなど)、光記録媒体(光ディスクなど)、光磁気記録媒体、半導体メモリなどのコンピュータが読取可能な記録媒体に記憶した状態で提供し得る。また、インターネットのようなネットワーク経由で端末10にダウンロードさせることも可能である。なお、このような制御を行う制御手段としてはCPU以外にも種々の装置を適用することができ、例えば、専用のプロセッサなどを用いてもよい。
1…遠隔会議システム、10…端末、13…表示部、15…マイクロホン、17…スピーカ、18…通信部、19…撮影部、20…通信ネットワーク、30…コンピュータ装置、40…ルータ、111…音声エンコード部、112…音声送信部、113…映像エンコード部、114…映像送信部、115…キャプチャ画像データ生成部、116…キャプチャ画像送信部、117…帯域測定部、118…音声受信部、119…音声デコーダ、120…映像受信部、121…映像デコーダ、122…キャプチャ画像受信部、123…画像復元部。
Claims (3)
- 音声データおよび非音声データを送信する送信手段と、
前記非音声データの単位時間当たりの送信量を検出する検出手段と、
前記検出手段により検出された送信量に応じて、前記音声データのビットレートを決定する決定手段と、
前記決定手段により決定されたビットレートでエンコードされた音声データを前記送信手段に供給する供給手段と
を具備することを特徴とする通信装置。 - 前記供給手段は、前記送信手段に供給する音声データのビットレートを前記決定手段により決定されたビットレートに変更する場合には、予め定められた期間において、前記決定手段により決定されたビットレートでエンコードされた音声データと変更前のビットレートでエンコードされた音声データとを、時分割で混合して前記送信手段に供給する
ことを特徴とする請求項1に記載の通信装置。 - 前記供給手段は、前記送信手段に供給する音声データのビットレートを変更する場合には、前記決定手段により決定されたビットレートでエンコードされた音声データと変更前のビットレートでエンコードされた音声データの割合を時間の経過に伴って変化させる
ことを特徴とする請求項2に記載の通信装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008323753A JP2010147864A (ja) | 2008-12-19 | 2008-12-19 | 通信装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008323753A JP2010147864A (ja) | 2008-12-19 | 2008-12-19 | 通信装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010147864A true JP2010147864A (ja) | 2010-07-01 |
Family
ID=42567815
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008323753A Pending JP2010147864A (ja) | 2008-12-19 | 2008-12-19 | 通信装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010147864A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014077268A1 (ja) * | 2012-11-14 | 2014-05-22 | 日本電気株式会社 | パケット転送制御装置、パケット転送制御方法およびプログラム |
-
2008
- 2008-12-19 JP JP2008323753A patent/JP2010147864A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014077268A1 (ja) * | 2012-11-14 | 2014-05-22 | 日本電気株式会社 | パケット転送制御装置、パケット転送制御方法およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2479986B1 (en) | Audio processing in a multi-participant conference | |
US20190035383A1 (en) | Artificially generated speech for a communication session | |
US20050062843A1 (en) | Client-side audio mixing for conferencing | |
JP5528811B2 (ja) | 効率的なメディアの扱いのための受信機の動作及び実装 | |
JP2006512027A5 (ja) | ||
JP2008099276A (ja) | クライアントにデータをストリームする方法、ストリーミング・データ用のサーバおよびクライアントに伝送されるストリーミング・データのビットレートを調節する方法 | |
JP2008022552A (ja) | 会議方法および会議システム | |
FR2896372A1 (fr) | Appareil terminal video, dispositif de reseau et procede pour une transmission de donnees video/audio | |
JP4331049B2 (ja) | データ伝送装置およびデータ伝送方法 | |
CN102025972A (zh) | 应用于视频会议的静音指示的方法及装置 | |
KR101701742B1 (ko) | 이동통신 단말기 간 실시간 스트리밍을 위한 장치 및 방법 | |
KR101396832B1 (ko) | 휴대 단말기의 화상 회의 방법 및 장치 | |
EP2158753B1 (en) | Selection of audio signals to be mixed in an audio conference | |
JP3818054B2 (ja) | 多地点ビデオ会議制御装置、音声切替え方法、およびそのプログラムを記録した記録媒体 | |
TW201138464A (en) | Network device, information processing apparatus, stream switching method, information processing method, program, and content distribution system | |
JP2007251501A (ja) | テレビ会議システム及びテレビ会議方法 | |
US20100268529A1 (en) | Voice communication apparatus | |
US20060182233A1 (en) | Erasure of DTMF signal transmitted as speech data | |
JP2010147864A (ja) | 通信装置 | |
JP2007135108A (ja) | ネットワーク会議支援プログラムおよびネットワーク会議支援サーバ | |
JP2008141348A (ja) | 通信装置 | |
JP4531013B2 (ja) | 映像音声会議システムおよび端末装置 | |
KR20080047683A (ko) | 휴대용 단말기에서 스트리밍 서비스 전송 방법 및 장치 | |
JP2008219462A (ja) | 通信装置 | |
Hardman et al. | Internet/Mbone Audio |