JP2005151082A

JP2005151082A - 音声データ通信装置および音声データ伝送システム

Info

Publication number: JP2005151082A
Application number: JP2003384677A
Authority: JP
Inventors: Katsuhiko Hirozawa; 克彦廣澤; Takahiro Okai; 隆弘岡井; Takehito Yoshida; 岳人吉田; Masatoshi Takagi; 誠利高木
Original assignee: NIPPON CULTURAL BROADCASTING I; NIPPON CULTURAL BROADCASTING Inc; NTT Docomo Inc
Current assignee: NIPPON CULTURAL BROADCASTING I; NIPPON CULTURAL BROADCASTING Inc; NTT Docomo Inc
Priority date: 2003-11-14
Filing date: 2003-11-14
Publication date: 2005-06-09

Abstract

【課題】ネットワークの遅延時間を効果的に低減するとともにパケット欠落などの影響を最小限にし、高速かつ高品質の音声データの伝送を実現する。
【解決手段】高速伝送路を介して音声データの送受信を行う送信装置と受信装置を含む音声データ伝送システムにおいて、送信装置は、入力された音声データを所定の圧縮単位で圧縮して圧縮単位ごとの圧縮データファイルを生成し、圧縮データファイルのデータ量をパケット長に基づいて調整し、データ列を生成することなく個々の圧縮データファイルから直接パケットを生成する。圧縮データファイル単位で生成されたパケットは同じタイミングで伝送路に送出される。受信装置は、圧縮データファイル単位でパケットを受信し、直ちに圧縮データを再生し、伸張する。
【選択図】図２

Description

本発明は、ディジタル音声伝送技術に関し、特に、音声データの圧縮時間単位に着目して、送信側での圧縮データのデータ列化を排除し、音声通信ネットワークでの遅延時間を最小限に抑えることのできる音声データ伝送技術に関する。

現在、ディジタル音声通信では、
（１）低速ではあるが、信頼性の高い一定速度の回線を利用した通信と、
（２）高速ではあるが、信頼性の低いベストエフォート型回線を利用した通信
のいずれかが用いられている。

前者は回線の信頼性がそのまま伝送の安定性につながる。このため、多少たりともデータが欠ける可能性のある回線では、この方法を利用して高音質のディジタル化音声信号を伝送することは困難になる。

後者は、信頼性の低さをデータの再送によって補っている。このため、大量のバッファが必要となり、結果的に長い遅延時間を生じさせている。

第３世代携帯電話のデータ通信などに用いられる回線は、多少の誤りが生じる可能性があるため、前者（通信サービス（１））には不向きである。また、後者（通信サービス（２））を利用した高音質の音声データ伝送は、大きな遅延を生じさせるため、会話など、双方向での良質な音声伝送を確保するには難点がある。

また、携帯電話におけるデータ通信では、誤りを生じる可能性のある無線回線と、高品質のバックボーン回線の双方を経由するが、無線回線に合わせてバッファが設定されている。このため、せっかくの高品質バックボーン回線が、遅延時間の低減に寄与しないという問題があり、無線ネットワークでの遅延の低減が望まれている。

ディジタル音声通信では、高品質の音を実現し、データ転送時の負荷を軽減するために、ＭＥＰＧ１などの圧縮アルゴリズムを用いて、音声データを圧縮する。このとき、送信側で音声信号を圧縮して得られる圧縮符号化データ列から伝送用のパケットを順次切り出して、回線あるいはネットワークに送出する。受信側では、パケットを伸張し復号することによって、音声信号を回復する。

図１は、従来の音声データ伝送手法を示す図である。音声信号は、時間方向にサンプリングされ、電圧方向に量子化されて、圧縮前データ列１０１が得られる。たとえば、１６ＫＨｚサンプリングの１６ビットであれば、毎秒２５６ｋｂｉｔの圧縮前データ１００１が生成される。

この圧縮前データ１００１を、圧縮アルゴリズムを用いて所定の圧縮レートで圧縮する。これにより、圧縮後データ１００３が得られる。圧縮後データ１００３は、ストリーミングのためにバッファリングされ、時系列で圧縮後データ列（コードストリーム）１００５が生成される。１／４圧縮であれば、圧縮前２５６ｋｂｐｓのデータは６４ｋｂｐｓの圧縮後データ列になる。

所定の圧縮レートで圧縮され、バッファリングされた圧縮後データ列１００５は、所定のサイズのパケット１００７にパケット化され（あるいは同期をとって）、伝送路の伝送速度に応じたタイミングでネットワークに送信される。

ネットワークを介して相手側に受信されたパケットは、順次受信バッファに格納されて、伝送後データ列１００９が得られる。伝送後データ列１００９から所定の伸張単位で圧縮後データ１０１１が取り出され、伸張プロセスを経て伸張後データ１０１３が得られる。この伸張後データ１０１３は、圧縮前データ１００１に対応する状態である。

このような従来の手法では、圧縮後のデータ１００３をいったんデータ列にしてから、伝送路の速度に合わせてパケットを切り出し、送出している。これは主として、従来は圧縮後データ列の速度に比較して十分に速い伝送網が確保されなかったことと、パケット通信に汎用性を持たせるため、という理由による。

図１に示す従来例では、圧縮後データ列１００５から順次パケットを切り出し、順番に伝送網に送出する。たとえば、伝送網の速度が圧縮速度の３倍だとすると、１秒で圧縮後データのパケットを送信し、２秒待ってから、次の１秒で圧縮後データ列１００５から次のパケットを切り出して送信し、また２秒待つ。
受信側では、パケットを順次バッファリングし、伸張単位分のデータに相当するパケットをすべてが受信されたならば、圧縮後データ１０１１を取出して伸張処理を行う。換言すると、伸張単位相当分のパケットの受信が完了するまで伸張処理は行われず、この時間分だけ遅延が生じる。

また、圧縮符号化データ列１００５からパケット化する場合、パケットの切れ目と圧縮符号化フレーム（あるいはブロック）の切れ目が一致しないことが多い。このような場合、圧縮符号化フレームの途中でパケット化の境界が発生し、ひとつのフレームのデータが２つの別々のパケットとして送信されることになる。結果として、パケット単位で完結する復号が行われず、その前後のバケットにも影響し。音切れなどの通信品質劣化の原因となる。

パケット化の切れ目と圧縮符号化フレームの切れ目を一致させるために、パケットを１またはその整数倍の圧縮符号化フレーム（あるいはブロック）で構成する方法が提案されている（たとえば、特許文献１および２参照）。
特開２００３−１４０６９８号公報特開２００３−２２４８３９号公報

しかし、上記いずれの文献においても、パケット化を行う前に、ある程度の圧縮符号化フレームをデータ列として蓄積しておかなければならない。このため、送信側で圧縮符号化列生成のためのバッファリング処理と、パケット化に先立つ読み出し処理が必須となる。

そこで本発明は、伝送路での遅延時間を効果的に低減するとともに、パケット欠落などの影響を最小限にし、高速かつ高品質の音声データの伝送を実現することを目的とする。

上記目的を達成するために、本発明は、音声データが一定時間単位で圧縮されることに着目し、その圧縮時間単位ごとに生成される圧縮データファイルを利用する。すなわち、圧縮データファイルを圧縮符号化データ列にすることなく、そのままパケット化して伝送路に送出する。受信側では圧縮単位でパケットを受け取るので、受信後、即座に伸張復号処理を開始できる。

この手法を採用すると、送信側で、圧縮符号化データ列生成のためのバッファリングプロセスを排除できるとともに、受信側では、伸張単位相当分のデータパケットが揃うまでの遅延を解消できる。これにより、ネットワーク全体の遅延時間を低減することができる。

さらに、圧縮単位でパケット化を行うので、音声データの先頭と終端が必ずそろっており、パケットの先頭に予測値との差分情報などの音声以外のデータが存在する場合に生じるディジタルノイズを低減することができる。伝送路でパケット欠落があったとしても、その影響は圧縮化の単位内で完結し、他へ影響しない。

これを実現する前提として、伝送路の伝送速度は、圧縮後の圧縮データ速度の４倍以上、好ましくは６倍以上とする。逆に言えば、伝送路の伝送速度を検出し、それに基づいてターゲットとする圧縮後データ速度を設定することで、圧縮時間単位の圧縮データファイルをそのままパケット化することができる。

より具体的には、本発明の第１の側面では、高速かつ高音質の音声データ通信装置を提供する。この音声データ通信装置は、音声データを所定の圧縮単位で圧縮し、または外部から供給される音声圧縮データに基づき、圧縮単位ごとの圧縮データファイルを出力する圧縮データ出力部と、圧縮データファイルのデータ量をパケット長に基づいて調整するデータ量調整部と、前記データ量が調整された圧縮データファイルから直接パケットを生成するパケット生成部と、生成されたパケットを所定のタイミングで伝送路に送信するパケット制御部とを備える。

このように、音声データが一定時間単位で圧縮されることに着目して、圧縮時間単位ごとの圧縮データファイルを、データ列を生成せずに直接パケット化することによって、送信側での圧縮データ列化のためのバッファリング処理を排除することができる。

ここで、「直接」パケット化するという文言は、データ列の生成を介することなく、という意味で用いられる。

データ量調整部は、圧縮データファイルのデータ量がパケット長またはその整数倍となるように、前記圧縮データファイルのデータ量を調整する。具体的には、圧縮データファイルのデータ量がパケット長またはその整数倍になるように、ヌルデータを挿入する。たとえば、圧縮データファイルのデータ量が、パケット長より小さい場合は、パケット長に一致するまでヌルデータを挿入する。圧縮データファイルのデータ量がパケット長よりも大きい場合は、パケット長で除算して、余剰部分についてパケット長に一致するまでヌルデータを挿入する。

このように圧縮データファイルのデータ量を調整することによって、ひとつの圧縮データファイルで完結するパケットが生成されるので、パケット欠落があっても、影響を最小限に抑えることができる。

好ましくは、パケット制御部は、伝送路の伝送速度を検出し、圧縮部は、検出された伝送速度に基づいてターゲットとする圧縮データ速度を設定する。伝送路の伝送速度は、圧縮データ速度の４倍以上、より好ましくは、６倍以上である。

このように圧縮後の圧縮データの速度と伝送路の伝送速度との関係を設定することで、ネットワーク全体の遅延低減効果が顕著になる。

本発明の第２の側面では、伝送路を介して音声データの送受信を行う送信装置と受信装置を含む音声データ伝送システムを提供する。このシステムにおいて、送信装置は、入力された音声データを所定の圧縮単位で圧縮して、当該圧縮単位ごとの圧縮データファイルを生成し、圧縮データファイルのデータ量をパケット長に基づいて調整し、データ量が調整された個々の圧縮データファイルから直接パケットを生成して、圧縮データファイルごとにパケットを前記伝送路に送出する。

受信装置は、圧縮データファイル単位で送られたパケットを一度に受信して、圧縮データを再生する。

この音声データ伝送システムでは、受信装置は、圧縮時間単位でパケットを受信するので、パケットをデータ列化することなく、パケット受信後、直ちに伸張、復号処理を開始できる。したがって、従来必要とされていた受信バッファに相当する分の遅延を解消することができる。

また、受信側ではデータの先頭と終端がそろった圧縮時間単位でパケットを受け取るので、ディジタルノイズを最小限にできる。

好ましくは、送信装置は、次の圧縮単位の圧縮データファイルの作成を完了する前に、受信装置から再送信要求を受け取り、この再送信要求に応じて、要求されたパケットを受信装置に再送信する。これにより、高品質の音声データ通信が実現される。

本発明のその他の特徴、効果は、以下で図面を参照して述べる詳細な説明により、いっそう明確になる。

ネットワーク全体の遅延時間を低減して高速の音声データパケット通信を実現するとともに、高品質の音声伝送を可能にする。

図２は、本発明の音声データ伝送手法を説明するための概略図である。

音声データは、サンプリングされ量子化されて、圧縮前データ列１が得られる。たとえば、１６ＫＨｚサンプリングの１６ビットであれば、毎秒２５６ｋｂｉｔの圧縮前データ列１が生成される。

この圧縮前データ１００１を、圧縮アルゴリズムを用いて所定の圧縮率で圧縮する。本発明の一実施形態では、圧縮アルゴリズムとして、ＭＰＥＧ１オーディオを用いる。レイヤＩの１／４圧縮であれば、圧縮前２５６ｋｂｐｓのデータは、圧縮後６４ｋｂｐｓのデータとなる。

ＭＰＥＧ１オーディオでは、３８４サンプルを圧縮単位とするので、３８４サンプリングごとに、圧縮後データファイル３が得られる。圧縮後データファイル３は、圧縮データ列生成のためのバッファリング処理なしに、そのままパケット化されて高速伝送路に送出される。高速伝送路は、たとえば下り伝送速度が３８４ｋｂｐｓのＦＯＭＡ（登録商標）網である。

高速伝送路を介して相手側に受信された圧縮後データパケット５は、バッファでデータ列化されることなく、受信後直ちに、圧縮時間単位に対応する伸張単位で伸張され、伸張後データ列７が得られる。伸張後データ１、伸張後データ２、伸張後データ３は、それぞれ圧縮前データ１、圧縮前データ２、圧縮前データ３に対応するデータである。

図３は、本発明の音声データ伝送手法と、従来の手法をわかりやすく比較した図である。図３（ａ）に示すように、従来の手法では、たとえ圧縮の単位でパケット化するとしても、十分に早い伝送路が確保されていない、あるいは圧縮後の圧縮信号速度を伝送路の伝送速度に合わせて可変にする必要がある、などの理由により、いったん圧縮後データ列１００５を生成するためのバッファリングを必要としていた。

これに比べ、本願発明は、圧縮時間単位ごとに出力される圧縮音声データファイル３をそのままパケット化して高速伝送路に送出しようとするものである。

図４は、本発明が適用されるネットワーク構成例を示す図であり、図２および３（ｂ）に示した本発明のコンセプトを実現する音声データ通信装置１０を含む図である。音声データ通信装置１０は、増幅器１２、圧縮部１３、データ量調整部２１、パケット生成部２２、およびパケット制御部２３を含む。データ量調整部２１と、パケット生成部２２と、パケット制御部２３で、圧縮データパケット生成ユニット２０を構成する。

マイクロフォン１１で収集された音声は、増幅器１２で増幅され、図示しないＡ／Ｄコンバータで時間方向にサンプリングされ、電圧方向に量子化されてディジタル音声データとなる。このディジタル音声データは、圧縮部１３によって、所定の圧縮時間単位ごとに圧縮処理が施され、圧縮時間単位での圧縮データファイルが生成される。圧縮部１３は任意の音声ＣＯＤＥＣで構成されるが、たとえば、ＭＰＥＧ１オーディオでは、３８４サンプルを圧縮単位としてデータ圧縮を行うので、１６ｋＨｚサンプリングの信号では、２４ｍＳが圧縮音声信号（ＡＡＵ）の単位となる。なお、圧縮部１３は、ターゲットとする圧縮後データ列の速度を設定することによって、所望の信号速度の圧縮後データとなるように、圧縮アルゴリズムを構成するようにしてもよい。

所定の圧縮時間単位で圧縮された圧縮後データファイルは、圧縮データパケット生成ユニット２０のデータ量調整部２１に送られる。データ量調整部２１は、伝送路で用いられるパケット長に適合するように、圧縮データファイルのデータ量を調整する。このデータ量の調整の詳細な手順については、後述する。

パケット生成部２２は、データ量が調整された圧縮データファイルから、直接パケットを生成する。すなわち、圧縮データファイルをいったん圧縮データ列に再構成したものから順次パケットを切り出すのではなく、データ量調整後の圧縮データファイルをそのまま利用してパケット化する。圧縮データファイルのデータ量に応じて、１の圧縮データファイルから１のパケットが生成される場合もあれば、２以上のパケットが生成される場合もある。

パケット制御部２３は、圧縮データファイルごとに生成されたパケットを、所定のタイミングで伝送路に送出する。パケット生成部２２がひとつの圧縮データファイルから２以上のパケットを生成した場合は、これらのパケットを同時に伝送路へ送出する。

伝送路は、音声データ通信装置１０の圧縮後データのデータ速度よりも十分に速い伝送速度を有し、好ましくは圧縮後データ速度の４倍以上、より好ましくは６倍以上の伝送速度を有する。図２を参照して述べた例では、音声データ通信装置１０の圧縮後のデータ速度が６４ｋｂｐｓ、伝送路の速度は３８４ｋｂｐｓであり、６倍の伝送速度になる。

受信側では、受信装置４０のパケット制御部４２は、伝送路を介してパケットを受信する。データ再生部４３は、パケットから圧縮音声データを取り出して、圧縮後データファイルの状態に再生する。伸張部４５は、再生されたデータファイルの単位で伸張処理を施す。伸張された伸張後データは、図示しないＤ／Ａコンバータによりアナログ電気信号に変換され、増幅器４６からスピーカ４７に出力される。

データ再生部４３は従来手法と異なり、順次到着するパケットから圧縮音声データを取り出してデータ列として再生するのではなく、圧縮単位相当の音声データファイルから生成されたパケットを一度に受け取り、圧縮データファイルを再生する。伸張部４５は、圧縮単位相当の音声データファイルを受け取るので、対応する伸張単位でそのまま伸張することができる。したがって、受信したパケットのデータを蓄積してデータ列を生成するための受信バッファが不要になる。

図４の例では、音声データ通信装置１０は、たとえば通信機能内蔵のパーソナルコンピュータ、取り外し可能な通信カードが挿入されたパーソナルコンピュータなどを想定しており、外部マイクロフォン１１がケーブル等により接続されている。しかし、マイクロフォン内蔵型のパーソナルコンピュータであってもよいし、音声圧縮／伸張機能つきの携帯端末、サーバなどであってもよい。音声データ通信装置１０は、圧縮部１３で圧縮されたデータのみならず、所定の圧縮時間単位ごとに外部から供給される圧縮データに対しても、データ列を介することなくパケット化し、送信することができる。

受信装置４０も同様に、伸張、復号された音声の出力先が遠隔のスピーカ４７であるかわりに、スピーカ機能内蔵のパーソナルコンピュータや音響装置であってもよいし、音声圧縮／伸張機能つきの携帯端末であってもよい。

図５は、本発明の位置実施形態に係る音声データの伝送動作を示すフローチャートである。このフローチャートでは、図４に示す音声データ通信装置（送信装置）１０と受信装置４０の間のデータ伝送フローを示す。

まず、送信側で音声データ通信装置１０の圧縮部１３は、１フレーム（圧縮時間単位）分の圧縮音声データを作成する（Ｓ１０１）。上述したＭＰＥＧ１オーディオを圧縮アルゴリズムとして用いる場合は、１６ｋＨｚサンプリングで２４ｍＳ分の圧縮音声データが得られる。

データ量調整部２１は、伝送路のパケット長に適合するように、圧縮データのデータ量を調整し（Ｓ１０３）、パケット生成部２２でデータ量が調整された圧縮データから直接パケットを生成する（Ｓ１０４）。パケット制御部２３は、この圧縮単位から得られたパケットを同じタイミングで送出する（Ｓ１０７）。

受信側で、受信装置４０のパケット制御部４２はパケットを受信すると（Ｓ１０９）、正常に受信できているか否かを判断する（Ｓ１１１）。正常に受信されていれば、そのまま圧縮データファイルを再生し、伸張、復号を行う（Ｓ１１７）。同時に、受信証を発行する（Ｓ１１９）。送信側の音声データ通信装置１０は、受信証を受領し（Ｓ１２１）、次の圧縮データを待ってデータ量調整およびパケット生成の処理に入る。

一方、パケットが正常に受信されていない場合は（Ｓ１１１でＮＯ）、受信装置４０のパケット制御部４２は再送信要求を送信する（Ｓ１１３）。送信側で、音声データ通信装置１０のパケット制御部２３は、再送信要求を受け取ると、正常に受信されなかったパケットを再度、送信する（Ｓ１０７）。

図６は、パケットの生成と圧縮後データのデータ量との関係を説明するための図、図７は、図５のデータ量調節ステップ（Ｓ１０３）を詳しく説明するフローチャートである。

図６（ａ）に示すように、音声データ通信装置１０の圧縮部１３が出力した圧縮データファイル３０ａに含まれるデータ量が、伝送路で用いられるパケット長よりも大きい場合は、パケット生成部２２は、複数のデータパケットを生成する。このとき、伝送路で用いるパケットのパケット長は、あらかじめパケット制御部２３で検出されているものとする。データ量調整部２１は、パケット長が分かっているので、圧縮データファイルのデータ量がパケット長の整数倍になるようにヌルデータを追加して、圧縮データファイルのデータ量を調整する。パケット生成部２２は、データ量が調整された圧縮データファイルのデータをパケットに割り振る。

図６（ａ）の例では、圧縮データファイル３０ａから、２つのパケット５０ａ−１、５０ａ−２が生成される。各パケットは、ヘッダ領域５１、データ領域５５、誤り訂正等の領域５３を有する。１つめのパケット５０ａ−１のデータ領域５５は、圧縮後データで満たされる。２つ目のパケット５０ａ−２では、圧縮後データがデータ領域５５のサイズに満たないので、残りはヌルデータで埋められる。

図６（ｂ）に示すように、圧縮データファイル３０ｂのデータ量と、パケット長が等しい場合は、データ量調整部２１はヌルデータを追加することなく、圧縮後データファイル３０ｂをパケット生成部２２に送る。パケット生成部２２は、圧縮データファイル３０ｂをそのままパケット５０ｂにパケット化する。

図６（ｃ）に示すように、圧縮データファイル３０ｃのデータ量がパケット長に満たない場合は、データ量調整部２１は、パケット長になるまでヌルデータを追加して、圧縮データファイルをパケット生成部２２に送る。パケット生成部２２は、データ量が調整された圧縮データファイルをパケット５０ｃにパケット化する。パケット５０ｃのデータ領域５５のデータの不足部分は、ヌルデータで埋められている。

図７は、データ量調整部２１が行うデータ量調整動作のフローチャートである。まず、圧縮部１３から１フレーム（圧縮時間単位）分の圧縮音声データを受け取る（Ｓ２０１）。データ量調整部２１では、パケット制御部２３から通知された伝送路のパケット長に基づいて、圧縮部１３から出力された圧縮データファイルのデータ量が、パケット長あるいはその整数倍に等しいかを判断する（Ｓ２０３）。圧縮データファイルのデータ量がパケット長あるいはその整数倍に等しい場合は、圧縮データファイルのデータ量を調整することなく、パケット生成部２２に出力する（Ｓ２０７）。これは図６（ｂ）のパターンに該当する。

圧縮データファイルのデータ量がパケット長あるいはその整数倍と異なる場合は（Ｓ２０３でＮＯ）、パケット長に不足する分のヌルデータを追加し（Ｓ２０５）、調整後の圧縮データファイルをパケット生成装置２２に出力する（Ｓ２０７）。これは図６（ａ）および図６（ｃ）のパターンに該当する。

このように、データ量調整部２１は、簡単な除算と加算だけで、送信されるパケットが圧縮データファイル内で完結するように、圧縮データファイルのデータ量を調整する。パケット生成装置２２は、受けとった圧縮データファイルを直接パケット化することができる。パケット数が複数にわたる場合であっても、ひとつの圧縮時間単位で定義される圧縮データファイルから生成されたパケットは、パケット制御部２３により、同じタイミングで伝送路に送出される。

たとえば、圧縮部１３が出力した圧縮ファイルが５００バイトであり、パケット長（データ領域のサイズ）が１２０バイトであるとする。この場合、５パケットが一度に生成され、最後のパケットのデータ不足分はヌルデータで埋められる。５つのパケットはいっせいに送信され、受信装置は、圧縮時間単位で完結するデータを含んだパケットを一度に受信する。

この手法は、圧縮データを順次バッファリングして生成したデータ列からタイミングクロックに合わせて低速でデータを読み出し、順次パケットを切り出し、送信していた従来の手法と比較して、非常に簡単な構成で、迅速なパケット出力を可能にする。

受信側でも、圧縮単位（伸張単位）に相当する量のパケットがすべて送られてくるまで伸張処理を先延ばしにする必要がなく、音声復元を迅速に行うことができる。

このようなパケット生成／伝送方法は、伝送路の伝送速度が圧縮後データ速度の４倍以上、好ましくは６倍以上のときに、より顕著な効果を発揮する。

図８は、受信装置４０から音声データ通信装置１０への再送信のタイミングを示す図である。パケット長に合わせてデータ量が調整された圧縮時間単位の圧縮データファイル３０からパケット５０が生成され、同じタイミングで高速伝送網に送出される。受信側では、図５の処理フローと関連して述べたように、パケットが適正に受信されたかどうかを判断し、適正に受信されていれば、受信パケットから圧縮時間単位のデータファイル（図８では図示を省略）を再生して、そのまま伸張処理を行い、伸張後データ６０を生成する。パケットが適正に受信されていない場合、再送要求を送信側に送る。

再送要求は、送信側で次の圧縮後データファイル３０の生成が完了する前までの間、パケットが適正に受信されるまで何度でも行われる。本発明では、伝送路の伝送速度は音声データ通信装置の圧縮データ速度に比較して十分に速いため（実施形態では６倍の速度）、パケット受信から再送信要求の送信、パケットの再送信までの一連のフローは、非常に短時間で行われ、次の圧縮データファイルが生成される前に、再送信の試みを十分に行えるので、データ伝送の信頼性が格段に向上し、高い通信品質を実現することができる。

万が一、再送信がうまくいかずパケットが欠落した場合でも、パケット欠落の影響は圧縮時間単位のなかで完結するので、その影響を最小限に抑えることができる。

以上述べたように、本発明では、圧縮後データ速度よりも十分に速い伝送路と、圧縮時間単位で出力される圧縮データファイルを利用して、データ列生成のためのバッファリング遅延を解消した高速パケット通信を実現することができる。同時に、パケット再送信を確実に行い、パケット欠落の影響を最小にすることにより、高品質の音声データ通信が実現される。

３８４サンプルを圧縮単位とするＭＰＥＧ１オーディの場合、１６ｋＨｚサンプリングの信号で２４ｍＳが圧縮後データの単位となるが、従来の手法では、パケット生成前の圧縮に１０ｍＳ、パケット受け取り後の伸張に１０ｍＳ、圧縮／伸張のためのバッファに２４ｍＳ、さらに受信側で受信したパケットをデータ列化するための受信バッファとして最低限２４ｍＳ必要になり、パケットの伝送時間をゼロと仮定しても６８ｍＳを必要とする。

これと比較して本発明の手法では、圧縮と伸張の処理にそれぞれ１０ｍＳ、圧縮／伸張バッファに２４ｍＳを要する。伝送路の速度が圧縮後の信号の６倍の速度だとすると、理想状態での伝送路による遅延は４ｍＳとなり、合計４８ｍＳの遅延で済む。

このように、本発明ではネットワーク全体での遅延を大幅に低減することができる。パケット通信では、パケット量が同じであれば、その通信速度にかかわらず料金は同じなので、本発明の手法を用いることで、同じ料金で高速、高品質の音声データ通信を提供することが可能になる。

なお、本発明は、ＭＰＥＧ１オーディオとＦＯＭＡ（登録商標）網を例にとって説明したが、本発明はこの例に限定されない。パケット制御部で伝送網の伝送速度を検出し、伝送速度が圧縮後のデータ速度の４倍以上、好ましくは６倍以上になるようにターゲットの圧縮後データ速度を設定して圧縮アルゴリズムを構成することも可能である。

また、伝送網のパケット長を検出して、サンプリング周波数を調整し、圧縮後データファイルのデータ量を調整することも可能である。

上述した実施形態では、音声データ通信装置をハードウェアで構成する例をとって説明したが、音声データ通信装置をアプリケーションソフトウェアで実現することもできる。この場合、マシン読み取り可能なプログラムが音声データ通信装置にインストールされる。このプログラムは、音声データ通信装置に、入力された音声データを所定の圧縮単位で圧縮して、当該圧縮単位ごとの圧縮データファイルを生成する手順と、圧縮データファイルのデータ量をパケット長に基づいて調整する手順と、データ量が調整された個々の圧縮データファイルから直接パケットを生成する手順と、生成したパケットを圧縮データファイル単位で伝送路に送出する手順とを実行させる。

このようなプログラムがインストールされることによって、音声データ通信装置は、簡単な処理で高速、高品質のパケット通信を実行することができる。

従来の音声データ伝送方法を説明するための図である。本発明の音声データ伝送方法の原理を説明するための図である。従来の音声データ伝送手法と、本発明の音声データ伝送手法を比較する図である。本発明の一実施形態に係る音声データ伝送システムのネットワーク構成例を示す図である。本発明の一実地形態に係る音声データ伝送システムの音声データ伝送動作を示すフローチャートである。図４の音声データ通信装置における圧縮データファイルのデータ量調整を説明するための図である。図５のフローチャートに示す圧縮データファイルのデータ量調整ステップ（Ｓ１０３）を説明するフローチャートであり、図４の音声データ通信装置のデータ量調整部の処理フローを示す図である。再送信のタイミングを説明するための図である。

符号の説明

１圧縮前データ
３、３０ａ〜３０ｃ圧縮後データ
５、５０圧縮後データパケット
７、６０伸張後データ
１０音声データ通信装置
１１マイクロフォン
１２、４６増幅器
１３圧縮部（圧縮データ出力部）
２０圧縮データパケット生成ユニット
２１データ量調整部
２２パケット生成部
２３、４２パケット制御部
４３パケット再生部
４５伸張部
４７スピーカ
５５ヌルデータ

Claims

音声データを所定の圧縮単位で圧縮し、または外部から供給される音声圧縮データに基づき、圧縮単位ごとの圧縮データファイルを出力する圧縮データ出力部と、
前記圧縮データファイルのデータ量をパケット長に基づいて調整するデータ量調整部と、
前記データ量が調整された圧縮データファイルから直接パケットを生成するパケット生成部と、
生成されたパケットを所定のタイミングで伝送路に送信するパケット制御部と
を備える音声データ通信装置。
前記データ量調整部は、圧縮データファイルのデータ量がパケット長またはその整数倍となるように、前記圧縮データファイルのデータ量を調整することを特長とする請求項１に記載の音声データ通信装置。
前記データ量調整部は、圧縮データファイルのデータ量がパケット長またはその整数倍になるようにヌルデータを挿入することを特徴とする請求項２に記載の音声データ通信装置。
前記パケット制御部は、前記伝送路の伝送速度を検出し、前記圧縮部は、検出された伝送速度に基づいてターゲットとする圧縮データ速度を設定することを特徴とする請求項１に記載の音声データ通信装置。
前記パケット制御部は、前記伝送路で用いられるパケット長を検出し、前記データ量調整部は、検出されたパケット長に基づいて、前記圧縮データファイルのデータ量を調整することを特徴とする請求項１に記載の音声データ通信装置。
伝送路を介して音声データの送受信を行う送信装置と受信装置を含む音声データ伝送システムにおいて、
前記送信装置は、入力された音声データを所定の圧縮単位で圧縮して、当該圧縮単位ごとの圧縮データファイルを生成し、
圧縮データファイルのデータ量をパケット長に基づいて調整し、
データ量が調整された個々の圧縮データファイルから直接パケットを生成して、圧縮データファイル単位でパケットを前記伝送路に送出し、
前記受信装置は前記圧縮データファイル単位で送られたパケットを一度に受信して、圧縮データを再生することを特徴とする音声データ伝送システム。
前記送信装置は、次の圧縮単位の圧縮データファイルの作成を完了する前に、前記受信装置から再送信要求を受け取り、この再送信要求に応じて、前記パケットを前記受信装置に再送信することを特徴とする請求項６に記載の音声データ伝送システム。
前記受信装置は、前記圧縮データファイル単位で受信したパケットを、データ列化することなく伸張、復号することを特徴とする請求項６に記載の音声データ伝送システム。
音声データ通信装置にインストールされるプログラムであって、前記音声データ通信装置に、
入力された音声データを所定の圧縮単位で圧縮して、当該圧縮単位ごとの圧縮データファイルを生成する手順と、
圧縮データファイルのデータ量をパケット長に基づいて調整する手順と、
データ量が調整された個々の圧縮データファイルから、直接パケットを生成する手順と、
前記パケットを前記圧縮データファイル単位で伝送路に送出する手順と
を実行させるマシン読取可能のプログラム。