JP2005151082A - 音声データ通信装置および音声データ伝送システム - Google Patents

音声データ通信装置および音声データ伝送システム Download PDF

Info

Publication number
JP2005151082A
JP2005151082A JP2003384677A JP2003384677A JP2005151082A JP 2005151082 A JP2005151082 A JP 2005151082A JP 2003384677 A JP2003384677 A JP 2003384677A JP 2003384677 A JP2003384677 A JP 2003384677A JP 2005151082 A JP2005151082 A JP 2005151082A
Authority
JP
Japan
Prior art keywords
data
packet
compressed data
compressed
data file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003384677A
Other languages
English (en)
Inventor
Katsuhiko Hirozawa
克彦 廣澤
Takahiro Okai
隆弘 岡井
Takehito Yoshida
岳人 吉田
Masatoshi Takagi
誠利 高木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NIPPON CULTURAL BROADCASTING I
NIPPON CULTURAL BROADCASTING Inc
NTT Docomo Inc
Original Assignee
NIPPON CULTURAL BROADCASTING I
NIPPON CULTURAL BROADCASTING Inc
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NIPPON CULTURAL BROADCASTING I, NIPPON CULTURAL BROADCASTING Inc, NTT Docomo Inc filed Critical NIPPON CULTURAL BROADCASTING I
Priority to JP2003384677A priority Critical patent/JP2005151082A/ja
Publication of JP2005151082A publication Critical patent/JP2005151082A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Detection And Prevention Of Errors In Transmission (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

【課題】 ネットワークの遅延時間を効果的に低減するとともにパケット欠落などの影響を最小限にし、高速かつ高品質の音声データの伝送を実現する。
【解決手段】 高速伝送路を介して音声データの送受信を行う送信装置と受信装置を含む音声データ伝送システムにおいて、送信装置は、入力された音声データを所定の圧縮単位で圧縮して圧縮単位ごとの圧縮データファイルを生成し、圧縮データファイルのデータ量をパケット長に基づいて調整し、データ列を生成することなく個々の圧縮データファイルから直接パケットを生成する。圧縮データファイル単位で生成されたパケットは同じタイミングで伝送路に送出される。受信装置は、圧縮データファイル単位でパケットを受信し、直ちに圧縮データを再生し、伸張する。
【選択図】 図2

Description

本発明は、ディジタル音声伝送技術に関し、特に、音声データの圧縮時間単位に着目して、送信側での圧縮データのデータ列化を排除し、音声通信ネットワークでの遅延時間を最小限に抑えることのできる音声データ伝送技術に関する。
現在、ディジタル音声通信では、
(1)低速ではあるが、信頼性の高い一定速度の回線を利用した通信と、
(2)高速ではあるが、信頼性の低いベストエフォート型回線を利用した通信
のいずれかが用いられている。
前者は回線の信頼性がそのまま伝送の安定性につながる。このため、多少たりともデータが欠ける可能性のある回線では、この方法を利用して高音質のディジタル化音声信号を伝送することは困難になる。
後者は、信頼性の低さをデータの再送によって補っている。このため、大量のバッファが必要となり、結果的に長い遅延時間を生じさせている。
第3世代携帯電話のデータ通信などに用いられる回線は、多少の誤りが生じる可能性があるため、前者(通信サービス(1))には不向きである。また、後者(通信サービス(2))を利用した高音質の音声データ伝送は、大きな遅延を生じさせるため、会話など、双方向での良質な音声伝送を確保するには難点がある。
また、携帯電話におけるデータ通信では、誤りを生じる可能性のある無線回線と、高品質のバックボーン回線の双方を経由するが、無線回線に合わせてバッファが設定されている。このため、せっかくの高品質バックボーン回線が、遅延時間の低減に寄与しないという問題があり、無線ネットワークでの遅延の低減が望まれている。
ディジタル音声通信では、高品質の音を実現し、データ転送時の負荷を軽減するために、MEPG1などの圧縮アルゴリズムを用いて、音声データを圧縮する。このとき、送信側で音声信号を圧縮して得られる圧縮符号化データ列から伝送用のパケットを順次切り出して、回線あるいはネットワークに送出する。受信側では、パケットを伸張し復号することによって、音声信号を回復する。
図1は、従来の音声データ伝送手法を示す図である。音声信号は、時間方向にサンプリングされ、電圧方向に量子化されて、圧縮前データ列101が得られる。たとえば、16KHzサンプリングの16ビットであれば、毎秒256kbitの圧縮前データ1001が生成される。
この圧縮前データ1001を、圧縮アルゴリズムを用いて所定の圧縮レートで圧縮する。これにより、圧縮後データ1003が得られる。圧縮後データ1003は、ストリーミングのためにバッファリングされ、時系列で圧縮後データ列(コードストリーム)1005が生成される。1/4圧縮であれば、圧縮前256kbpsのデータは64kbpsの圧縮後データ列になる。
所定の圧縮レートで圧縮され、バッファリングされた圧縮後データ列1005は、所定のサイズのパケット1007にパケット化され(あるいは同期をとって)、伝送路の伝送速度に応じたタイミングでネットワークに送信される。
ネットワークを介して相手側に受信されたパケットは、順次受信バッファに格納されて、伝送後データ列1009が得られる。伝送後データ列1009から所定の伸張単位で圧縮後データ1011が取り出され、伸張プロセスを経て伸張後データ1013が得られる。この伸張後データ1013は、圧縮前データ1001に対応する状態である。
このような従来の手法では、圧縮後のデータ1003をいったんデータ列にしてから、伝送路の速度に合わせてパケットを切り出し、送出している。これは主として、従来は圧縮後データ列の速度に比較して十分に速い伝送網が確保されなかったことと、パケット通信に汎用性を持たせるため、という理由による。
図1に示す従来例では、圧縮後データ列1005から順次パケットを切り出し、順番に伝送網に送出する。たとえば、伝送網の速度が圧縮速度の3倍だとすると、1秒で圧縮後データのパケットを送信し、2秒待ってから、次の1秒で圧縮後データ列1005から次のパケットを切り出して送信し、また2秒待つ。
受信側では、パケットを順次バッファリングし、伸張単位分のデータに相当するパケットをすべてが受信されたならば、圧縮後データ1011を取出して伸張処理を行う。換言すると、伸張単位相当分のパケットの受信が完了するまで伸張処理は行われず、この時間分だけ遅延が生じる。
また、圧縮符号化データ列1005からパケット化する場合、パケットの切れ目と圧縮符号化フレーム(あるいはブロック)の切れ目が一致しないことが多い。このような場合、圧縮符号化フレームの途中でパケット化の境界が発生し、ひとつのフレームのデータが2つの別々のパケットとして送信されることになる。結果として、パケット単位で完結する復号が行われず、その前後のバケットにも影響し。音切れなどの通信品質劣化の原因となる。
パケット化の切れ目と圧縮符号化フレームの切れ目を一致させるために、パケットを1またはその整数倍の圧縮符号化フレーム(あるいはブロック)で構成する方法が提案されている(たとえば、特許文献1および2参照)。
特開2003−140698号公報 特開2003−224839号公報
しかし、上記いずれの文献においても、パケット化を行う前に、ある程度の圧縮符号化フレームをデータ列として蓄積しておかなければならない。このため、送信側で圧縮符号化列生成のためのバッファリング処理と、パケット化に先立つ読み出し処理が必須となる。
そこで本発明は、伝送路での遅延時間を効果的に低減するとともに、パケット欠落などの影響を最小限にし、高速かつ高品質の音声データの伝送を実現することを目的とする。
上記目的を達成するために、本発明は、音声データが一定時間単位で圧縮されることに着目し、その圧縮時間単位ごとに生成される圧縮データファイルを利用する。すなわち、圧縮データファイルを圧縮符号化データ列にすることなく、そのままパケット化して伝送路に送出する。受信側では圧縮単位でパケットを受け取るので、受信後、即座に伸張復号処理を開始できる。
この手法を採用すると、送信側で、圧縮符号化データ列生成のためのバッファリングプロセスを排除できるとともに、受信側では、伸張単位相当分のデータパケットが揃うまでの遅延を解消できる。これにより、ネットワーク全体の遅延時間を低減することができる。
さらに、圧縮単位でパケット化を行うので、音声データの先頭と終端が必ずそろっており、パケットの先頭に予測値との差分情報などの音声以外のデータが存在する場合に生じるディジタルノイズを低減することができる。伝送路でパケット欠落があったとしても、その影響は圧縮化の単位内で完結し、他へ影響しない。
これを実現する前提として、伝送路の伝送速度は、圧縮後の圧縮データ速度の4倍以上、好ましくは6倍以上とする。逆に言えば、伝送路の伝送速度を検出し、それに基づいてターゲットとする圧縮後データ速度を設定することで、圧縮時間単位の圧縮データファイルをそのままパケット化することができる。
より具体的には、本発明の第1の側面では、高速かつ高音質の音声データ通信装置を提供する。この音声データ通信装置は、音声データを所定の圧縮単位で圧縮し、または外部から供給される音声圧縮データに基づき、圧縮単位ごとの圧縮データファイルを出力する圧縮データ出力部と、圧縮データファイルのデータ量をパケット長に基づいて調整するデータ量調整部と、前記データ量が調整された圧縮データファイルから直接パケットを生成するパケット生成部と、生成されたパケットを所定のタイミングで伝送路に送信するパケット制御部とを備える。
このように、音声データが一定時間単位で圧縮されることに着目して、圧縮時間単位ごとの圧縮データファイルを、データ列を生成せずに直接パケット化することによって、送信側での圧縮データ列化のためのバッファリング処理を排除することができる。
ここで、「直接」パケット化するという文言は、データ列の生成を介することなく、という意味で用いられる。
データ量調整部は、圧縮データファイルのデータ量がパケット長またはその整数倍となるように、前記圧縮データファイルのデータ量を調整する。具体的には、圧縮データファイルのデータ量がパケット長またはその整数倍になるように、ヌルデータを挿入する。たとえば、圧縮データファイルのデータ量が、パケット長より小さい場合は、パケット長に一致するまでヌルデータを挿入する。圧縮データファイルのデータ量がパケット長よりも大きい場合は、パケット長で除算して、余剰部分についてパケット長に一致するまでヌルデータを挿入する。
このように圧縮データファイルのデータ量を調整することによって、ひとつの圧縮データファイルで完結するパケットが生成されるので、パケット欠落があっても、影響を最小限に抑えることができる。
好ましくは、パケット制御部は、伝送路の伝送速度を検出し、圧縮部は、検出された伝送速度に基づいてターゲットとする圧縮データ速度を設定する。伝送路の伝送速度は、圧縮データ速度の4倍以上、より好ましくは、6倍以上である。
このように圧縮後の圧縮データの速度と伝送路の伝送速度との関係を設定することで、ネットワーク全体の遅延低減効果が顕著になる。
本発明の第2の側面では、伝送路を介して音声データの送受信を行う送信装置と受信装置を含む音声データ伝送システムを提供する。このシステムにおいて、送信装置は、入力された音声データを所定の圧縮単位で圧縮して、当該圧縮単位ごとの圧縮データファイルを生成し、圧縮データファイルのデータ量をパケット長に基づいて調整し、データ量が調整された個々の圧縮データファイルから直接パケットを生成して、圧縮データファイルごとにパケットを前記伝送路に送出する。
受信装置は、圧縮データファイル単位で送られたパケットを一度に受信して、圧縮データを再生する。
この音声データ伝送システムでは、受信装置は、圧縮時間単位でパケットを受信するので、パケットをデータ列化することなく、パケット受信後、直ちに伸張、復号処理を開始できる。したがって、従来必要とされていた受信バッファに相当する分の遅延を解消することができる。
また、受信側ではデータの先頭と終端がそろった圧縮時間単位でパケットを受け取るので、ディジタルノイズを最小限にできる。
好ましくは、送信装置は、次の圧縮単位の圧縮データファイルの作成を完了する前に、受信装置から再送信要求を受け取り、この再送信要求に応じて、要求されたパケットを受信装置に再送信する。これにより、高品質の音声データ通信が実現される。
本発明のその他の特徴、効果は、以下で図面を参照して述べる詳細な説明により、いっそう明確になる。
ネットワーク全体の遅延時間を低減して高速の音声データパケット通信を実現するとともに、高品質の音声伝送を可能にする。
図2は、本発明の音声データ伝送手法を説明するための概略図である。
音声データは、サンプリングされ量子化されて、圧縮前データ列1が得られる。たとえば、16KHzサンプリングの16ビットであれば、毎秒256kbitの圧縮前データ列1が生成される。
この圧縮前データ1001を、圧縮アルゴリズムを用いて所定の圧縮率で圧縮する。本発明の一実施形態では、圧縮アルゴリズムとして、MPEG1オーディオを用いる。レイヤIの1/4圧縮であれば、圧縮前256kbpsのデータは、圧縮後64kbpsのデータとなる。
MPEG1オーディオでは、384サンプルを圧縮単位とするので、384サンプリングごとに、圧縮後データファイル3が得られる。圧縮後データファイル3は、圧縮データ列生成のためのバッファリング処理なしに、そのままパケット化されて高速伝送路に送出される。高速伝送路は、たとえば下り伝送速度が384kbpsのFOMA(登録商標)網である。
高速伝送路を介して相手側に受信された圧縮後データパケット5は、バッファでデータ列化されることなく、受信後直ちに、圧縮時間単位に対応する伸張単位で伸張され、伸張後データ列7が得られる。伸張後データ1、伸張後データ2、伸張後データ3は、それぞれ圧縮前データ1、圧縮前データ2、圧縮前データ3に対応するデータである。
図3は、本発明の音声データ伝送手法と、従来の手法をわかりやすく比較した図である。図3(a)に示すように、従来の手法では、たとえ圧縮の単位でパケット化するとしても、十分に早い伝送路が確保されていない、あるいは圧縮後の圧縮信号速度を伝送路の伝送速度に合わせて可変にする必要がある、などの理由により、いったん圧縮後データ列1005を生成するためのバッファリングを必要としていた。
これに比べ、本願発明は、圧縮時間単位ごとに出力される圧縮音声データファイル3をそのままパケット化して高速伝送路に送出しようとするものである。
図4は、本発明が適用されるネットワーク構成例を示す図であり、図2および3(b)に示した本発明のコンセプトを実現する音声データ通信装置10を含む図である。音声データ通信装置10は、増幅器12、圧縮部13、データ量調整部21、パケット生成部22、およびパケット制御部23を含む。データ量調整部21と、パケット生成部22と、パケット制御部23で、圧縮データパケット生成ユニット20を構成する。
マイクロフォン11で収集された音声は、増幅器12で増幅され、図示しないA/Dコンバータで時間方向にサンプリングされ、電圧方向に量子化されてディジタル音声データとなる。このディジタル音声データは、圧縮部13によって、所定の圧縮時間単位ごとに圧縮処理が施され、圧縮時間単位での圧縮データファイルが生成される。圧縮部13は任意の音声CODECで構成されるが、たとえば、MPEG1オーディオでは、384サンプルを圧縮単位としてデータ圧縮を行うので、16kHzサンプリングの信号では、24mSが圧縮音声信号(AAU)の単位となる。なお、圧縮部13は、ターゲットとする圧縮後データ列の速度を設定することによって、所望の信号速度の圧縮後データとなるように、圧縮アルゴリズムを構成するようにしてもよい。
所定の圧縮時間単位で圧縮された圧縮後データファイルは、圧縮データパケット生成ユニット20のデータ量調整部21に送られる。データ量調整部21は、伝送路で用いられるパケット長に適合するように、圧縮データファイルのデータ量を調整する。このデータ量の調整の詳細な手順については、後述する。
パケット生成部22は、データ量が調整された圧縮データファイルから、直接パケットを生成する。すなわち、圧縮データファイルをいったん圧縮データ列に再構成したものから順次パケットを切り出すのではなく、データ量調整後の圧縮データファイルをそのまま利用してパケット化する。圧縮データファイルのデータ量に応じて、1の圧縮データファイルから1のパケットが生成される場合もあれば、2以上のパケットが生成される場合もある。
パケット制御部23は、圧縮データファイルごとに生成されたパケットを、所定のタイミングで伝送路に送出する。パケット生成部22がひとつの圧縮データファイルから2以上のパケットを生成した場合は、これらのパケットを同時に伝送路へ送出する。
伝送路は、音声データ通信装置10の圧縮後データのデータ速度よりも十分に速い伝送速度を有し、好ましくは圧縮後データ速度の4倍以上、より好ましくは6倍以上の伝送速度を有する。図2を参照して述べた例では、音声データ通信装置10の圧縮後のデータ速度が64kbps、伝送路の速度は384kbpsであり、6倍の伝送速度になる。
受信側では、受信装置40のパケット制御部42は、伝送路を介してパケットを受信する。データ再生部43は、パケットから圧縮音声データを取り出して、圧縮後データファイルの状態に再生する。伸張部45は、再生されたデータファイルの単位で伸張処理を施す。伸張された伸張後データは、図示しないD/Aコンバータによりアナログ電気信号に変換され、増幅器46からスピーカ47に出力される。
データ再生部43は従来手法と異なり、順次到着するパケットから圧縮音声データを取り出してデータ列として再生するのではなく、圧縮単位相当の音声データファイルから生成されたパケットを一度に受け取り、圧縮データファイルを再生する。伸張部45は、圧縮単位相当の音声データファイルを受け取るので、対応する伸張単位でそのまま伸張することができる。したがって、受信したパケットのデータを蓄積してデータ列を生成するための受信バッファが不要になる。
図4の例では、音声データ通信装置10は、たとえば通信機能内蔵のパーソナルコンピュータ、取り外し可能な通信カードが挿入されたパーソナルコンピュータなどを想定しており、外部マイクロフォン11がケーブル等により接続されている。しかし、マイクロフォン内蔵型のパーソナルコンピュータであってもよいし、音声圧縮/伸張機能つきの携帯端末、サーバなどであってもよい。音声データ通信装置10は、圧縮部13で圧縮されたデータのみならず、所定の圧縮時間単位ごとに外部から供給される圧縮データに対しても、データ列を介することなくパケット化し、送信することができる。
受信装置40も同様に、伸張、復号された音声の出力先が遠隔のスピーカ47であるかわりに、スピーカ機能内蔵のパーソナルコンピュータや音響装置であってもよいし、音声圧縮/伸張機能つきの携帯端末であってもよい。
図5は、本発明の位置実施形態に係る音声データの伝送動作を示すフローチャートである。このフローチャートでは、図4に示す音声データ通信装置(送信装置)10と受信装置40の間のデータ伝送フローを示す。
まず、送信側で音声データ通信装置10の圧縮部13は、1フレーム(圧縮時間単位)分の圧縮音声データを作成する(S101)。上述したMPEG1オーディオを圧縮アルゴリズムとして用いる場合は、16kHzサンプリングで24mS分の圧縮音声データが得られる。
データ量調整部21は、伝送路のパケット長に適合するように、圧縮データのデータ量を調整し(S103)、パケット生成部22でデータ量が調整された圧縮データから直接パケットを生成する(S104)。パケット制御部23は、この圧縮単位から得られたパケットを同じタイミングで送出する(S107)。
受信側で、受信装置40のパケット制御部42はパケットを受信すると(S109)、正常に受信できているか否かを判断する(S111)。正常に受信されていれば、そのまま圧縮データファイルを再生し、伸張、復号を行う(S117)。同時に、受信証を発行する(S119)。送信側の音声データ通信装置10は、受信証を受領し(S121)、次の圧縮データを待ってデータ量調整およびパケット生成の処理に入る。
一方、パケットが正常に受信されていない場合は(S111でNO)、受信装置40のパケット制御部42は再送信要求を送信する(S113)。送信側で、音声データ通信装置10のパケット制御部23は、再送信要求を受け取ると、正常に受信されなかったパケットを再度、送信する(S107)。
図6は、パケットの生成と圧縮後データのデータ量との関係を説明するための図、図7は、図5のデータ量調節ステップ(S103)を詳しく説明するフローチャートである。
図6(a)に示すように、音声データ通信装置10の圧縮部13が出力した圧縮データファイル30aに含まれるデータ量が、伝送路で用いられるパケット長よりも大きい場合は、パケット生成部22は、複数のデータパケットを生成する。このとき、伝送路で用いるパケットのパケット長は、あらかじめパケット制御部23で検出されているものとする。データ量調整部21は、パケット長が分かっているので、圧縮データファイルのデータ量がパケット長の整数倍になるようにヌルデータを追加して、圧縮データファイルのデータ量を調整する。パケット生成部22は、データ量が調整された圧縮データファイルのデータをパケットに割り振る。
図6(a)の例では、圧縮データファイル30aから、2つのパケット50a−1、50a−2が生成される。各パケットは、ヘッダ領域51、データ領域55、誤り訂正等の領域53を有する。1つめのパケット50a−1のデータ領域55は、圧縮後データで満たされる。2つ目のパケット50a−2では、圧縮後データがデータ領域55のサイズに満たないので、残りはヌルデータで埋められる。
図6(b)に示すように、圧縮データファイル30bのデータ量と、パケット長が等しい場合は、データ量調整部21はヌルデータを追加することなく、圧縮後データファイル30bをパケット生成部22に送る。パケット生成部22は、圧縮データファイル30bをそのままパケット50bにパケット化する。
図6(c)に示すように、圧縮データファイル30cのデータ量がパケット長に満たない場合は、データ量調整部21は、パケット長になるまでヌルデータを追加して、圧縮データファイルをパケット生成部22に送る。パケット生成部22は、データ量が調整された圧縮データファイルをパケット50cにパケット化する。パケット50cのデータ領域55のデータの不足部分は、ヌルデータで埋められている。
図7は、データ量調整部21が行うデータ量調整動作のフローチャートである。まず、圧縮部13から1フレーム(圧縮時間単位)分の圧縮音声データを受け取る(S201)。データ量調整部21では、パケット制御部23から通知された伝送路のパケット長に基づいて、圧縮部13から出力された圧縮データファイルのデータ量が、パケット長あるいはその整数倍に等しいかを判断する(S203)。圧縮データファイルのデータ量がパケット長あるいはその整数倍に等しい場合は、圧縮データファイルのデータ量を調整することなく、パケット生成部22に出力する(S207)。これは図6(b)のパターンに該当する。
圧縮データファイルのデータ量がパケット長あるいはその整数倍と異なる場合は(S203でNO)、パケット長に不足する分のヌルデータを追加し(S205)、調整後の圧縮データファイルをパケット生成装置22に出力する(S207)。これは図6(a)および図6(c)のパターンに該当する。
このように、データ量調整部21は、簡単な除算と加算だけで、送信されるパケットが圧縮データファイル内で完結するように、圧縮データファイルのデータ量を調整する。パケット生成装置22は、受けとった圧縮データファイルを直接パケット化することができる。パケット数が複数にわたる場合であっても、ひとつの圧縮時間単位で定義される圧縮データファイルから生成されたパケットは、パケット制御部23により、同じタイミングで伝送路に送出される。
たとえば、圧縮部13が出力した圧縮ファイルが500バイトであり、パケット長(データ領域のサイズ)が120バイトであるとする。この場合、5パケットが一度に生成され、最後のパケットのデータ不足分はヌルデータで埋められる。5つのパケットはいっせいに送信され、受信装置は、圧縮時間単位で完結するデータを含んだパケットを一度に受信する。
この手法は、圧縮データを順次バッファリングして生成したデータ列からタイミングクロックに合わせて低速でデータを読み出し、順次パケットを切り出し、送信していた従来の手法と比較して、非常に簡単な構成で、迅速なパケット出力を可能にする。
受信側でも、圧縮単位(伸張単位)に相当する量のパケットがすべて送られてくるまで伸張処理を先延ばしにする必要がなく、音声復元を迅速に行うことができる。
このようなパケット生成/伝送方法は、伝送路の伝送速度が圧縮後データ速度の4倍以上、好ましくは6倍以上のときに、より顕著な効果を発揮する。
図8は、受信装置40から音声データ通信装置10への再送信のタイミングを示す図である。パケット長に合わせてデータ量が調整された圧縮時間単位の圧縮データファイル30からパケット50が生成され、同じタイミングで高速伝送網に送出される。受信側では、図5の処理フローと関連して述べたように、パケットが適正に受信されたかどうかを判断し、適正に受信されていれば、受信パケットから圧縮時間単位のデータファイル(図8では図示を省略)を再生して、そのまま伸張処理を行い、伸張後データ60を生成する。パケットが適正に受信されていない場合、再送要求を送信側に送る。
再送要求は、送信側で次の圧縮後データファイル30の生成が完了する前までの間、パケットが適正に受信されるまで何度でも行われる。本発明では、伝送路の伝送速度は音声データ通信装置の圧縮データ速度に比較して十分に速いため(実施形態では6倍の速度)、パケット受信から再送信要求の送信、パケットの再送信までの一連のフローは、非常に短時間で行われ、次の圧縮データファイルが生成される前に、再送信の試みを十分に行えるので、データ伝送の信頼性が格段に向上し、高い通信品質を実現することができる。
万が一、再送信がうまくいかずパケットが欠落した場合でも、パケット欠落の影響は圧縮時間単位のなかで完結するので、その影響を最小限に抑えることができる。
以上述べたように、本発明では、圧縮後データ速度よりも十分に速い伝送路と、圧縮時間単位で出力される圧縮データファイルを利用して、データ列生成のためのバッファリング遅延を解消した高速パケット通信を実現することができる。同時に、パケット再送信を確実に行い、パケット欠落の影響を最小にすることにより、高品質の音声データ通信が実現される。
384サンプルを圧縮単位とするMPEG1オーディの場合、16kHzサンプリングの信号で24mSが圧縮後データの単位となるが、従来の手法では、パケット生成前の圧縮に10mS、パケット受け取り後の伸張に10mS、圧縮/伸張のためのバッファに24mS、さらに受信側で受信したパケットをデータ列化するための受信バッファとして最低限24mS必要になり、パケットの伝送時間をゼロと仮定しても68mSを必要とする。
これと比較して本発明の手法では、圧縮と伸張の処理にそれぞれ10mS、圧縮/伸張バッファに24mSを要する。伝送路の速度が圧縮後の信号の6倍の速度だとすると、理想状態での伝送路による遅延は4mSとなり、合計48mSの遅延で済む。
このように、本発明ではネットワーク全体での遅延を大幅に低減することができる。パケット通信では、パケット量が同じであれば、その通信速度にかかわらず料金は同じなので、本発明の手法を用いることで、同じ料金で高速、高品質の音声データ通信を提供することが可能になる。
なお、本発明は、MPEG1オーディオとFOMA(登録商標)網を例にとって説明したが、本発明はこの例に限定されない。パケット制御部で伝送網の伝送速度を検出し、伝送速度が圧縮後のデータ速度の4倍以上、好ましくは6倍以上になるようにターゲットの圧縮後データ速度を設定して圧縮アルゴリズムを構成することも可能である。
また、伝送網のパケット長を検出して、サンプリング周波数を調整し、圧縮後データファイルのデータ量を調整することも可能である。
上述した実施形態では、音声データ通信装置をハードウェアで構成する例をとって説明したが、音声データ通信装置をアプリケーションソフトウェアで実現することもできる。この場合、マシン読み取り可能なプログラムが音声データ通信装置にインストールされる。このプログラムは、音声データ通信装置に、入力された音声データを所定の圧縮単位で圧縮して、当該圧縮単位ごとの圧縮データファイルを生成する手順と、圧縮データファイルのデータ量をパケット長に基づいて調整する手順と、データ量が調整された個々の圧縮データファイルから直接パケットを生成する手順と、生成したパケットを圧縮データファイル単位で伝送路に送出する手順とを実行させる。
このようなプログラムがインストールされることによって、音声データ通信装置は、簡単な処理で高速、高品質のパケット通信を実行することができる。
従来の音声データ伝送方法を説明するための図である。 本発明の音声データ伝送方法の原理を説明するための図である。 従来の音声データ伝送手法と、本発明の音声データ伝送手法を比較する図である。 本発明の一実施形態に係る音声データ伝送システムのネットワーク構成例を示す図である。 本発明の一実地形態に係る音声データ伝送システムの音声データ伝送動作を示すフローチャートである。 図4の音声データ通信装置における圧縮データファイルのデータ量調整を説明するための図である。 図5のフローチャートに示す圧縮データファイルのデータ量調整ステップ(S103)を説明するフローチャートであり、図4の音声データ通信装置のデータ量調整部の処理フローを示す図である。 再送信のタイミングを説明するための図である。
符号の説明
1 圧縮前データ
3、30a〜30c 圧縮後データ
5、50 圧縮後データパケット
7、60 伸張後データ
10 音声データ通信装置
11 マイクロフォン
12、46 増幅器
13 圧縮部(圧縮データ出力部)
20 圧縮データパケット生成ユニット
21 データ量調整部
22 パケット生成部
23、42 パケット制御部
43 パケット再生部
45 伸張部
47 スピーカ
55 ヌルデータ

Claims (9)

  1. 音声データを所定の圧縮単位で圧縮し、または外部から供給される音声圧縮データに基づき、圧縮単位ごとの圧縮データファイルを出力する圧縮データ出力部と、
    前記圧縮データファイルのデータ量をパケット長に基づいて調整するデータ量調整部と、
    前記データ量が調整された圧縮データファイルから直接パケットを生成するパケット生成部と、
    生成されたパケットを所定のタイミングで伝送路に送信するパケット制御部と
    を備える音声データ通信装置。
  2. 前記データ量調整部は、圧縮データファイルのデータ量がパケット長またはその整数倍となるように、前記圧縮データファイルのデータ量を調整することを特長とする請求項1に記載の音声データ通信装置。
  3. 前記データ量調整部は、圧縮データファイルのデータ量がパケット長またはその整数倍になるようにヌルデータを挿入することを特徴とする請求項2に記載の音声データ通信装置。
  4. 前記パケット制御部は、前記伝送路の伝送速度を検出し、前記圧縮部は、検出された伝送速度に基づいてターゲットとする圧縮データ速度を設定することを特徴とする請求項1に記載の音声データ通信装置。
  5. 前記パケット制御部は、前記伝送路で用いられるパケット長を検出し、前記データ量調整部は、検出されたパケット長に基づいて、前記圧縮データファイルのデータ量を調整することを特徴とする請求項1に記載の音声データ通信装置。
  6. 伝送路を介して音声データの送受信を行う送信装置と受信装置を含む音声データ伝送システムにおいて、
    前記送信装置は、入力された音声データを所定の圧縮単位で圧縮して、当該圧縮単位ごとの圧縮データファイルを生成し、
    圧縮データファイルのデータ量をパケット長に基づいて調整し、
    データ量が調整された個々の圧縮データファイルから直接パケットを生成して、圧縮データファイル単位でパケットを前記伝送路に送出し、
    前記受信装置は前記圧縮データファイル単位で送られたパケットを一度に受信して、圧縮データを再生することを特徴とする音声データ伝送システム。
  7. 前記送信装置は、次の圧縮単位の圧縮データファイルの作成を完了する前に、前記受信装置から再送信要求を受け取り、この再送信要求に応じて、前記パケットを前記受信装置に再送信することを特徴とする請求項6に記載の音声データ伝送システム。
  8. 前記受信装置は、前記圧縮データファイル単位で受信したパケットを、データ列化することなく伸張、復号することを特徴とする請求項6に記載の音声データ伝送システム。
  9. 音声データ通信装置にインストールされるプログラムであって、前記音声データ通信装置に、
    入力された音声データを所定の圧縮単位で圧縮して、当該圧縮単位ごとの圧縮データファイルを生成する手順と、
    圧縮データファイルのデータ量をパケット長に基づいて調整する手順と、
    データ量が調整された個々の圧縮データファイルから、直接パケットを生成する手順と、
    前記パケットを前記圧縮データファイル単位で伝送路に送出する手順と
    を実行させるマシン読取可能のプログラム。
JP2003384677A 2003-11-14 2003-11-14 音声データ通信装置および音声データ伝送システム Pending JP2005151082A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003384677A JP2005151082A (ja) 2003-11-14 2003-11-14 音声データ通信装置および音声データ伝送システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003384677A JP2005151082A (ja) 2003-11-14 2003-11-14 音声データ通信装置および音声データ伝送システム

Publications (1)

Publication Number Publication Date
JP2005151082A true JP2005151082A (ja) 2005-06-09

Family

ID=34692984

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003384677A Pending JP2005151082A (ja) 2003-11-14 2003-11-14 音声データ通信装置および音声データ伝送システム

Country Status (1)

Country Link
JP (1) JP2005151082A (ja)

Similar Documents

Publication Publication Date Title
US7907609B2 (en) Method and apparatus for enhancing RoHC performance when encountering silence suppression
CA2566125C (en) Header compression of multimedia data transmitted over a wireless communication system
JP4566488B2 (ja) リアルタイムパケット通信におけるタイムスタンプの推定
JP4504429B2 (ja) 端末間のボイスオーバインターネットプロトコルのメディアの待ち時間を管理する方法および装置
JP6523249B2 (ja) パケットヘッダを圧縮する方法及び装置
US8320391B2 (en) Acoustic signal packet communication method, transmission method, reception method, and device and program thereof
EP1742455A1 (en) Audio communication method and device
US20070211724A1 (en) Communication station and method providing flexible compression of data packets
JP2003502948A (ja) パケット通信におけるロバストヘッダ圧縮
KR20090001370A (ko) 코덱의 구성 설정 방법 및 이를 적용한 코덱
US7444281B2 (en) Method and communication apparatus generation packets after sample rate conversion of speech stream
KR100341391B1 (ko) 대화형 오디오 서비스를 위한 적응형 부가 전송 방법 및 패킷 손실 복구 방법과 이를 위한 멀티미디어 컴퓨터의 오디오 입출력 제어 장치
JP4218456B2 (ja) 通話装置、通話方法及び通話システム
JP2005151082A (ja) 音声データ通信装置および音声データ伝送システム
JP4050961B2 (ja) パケット型音声通信端末
JP3977784B2 (ja) リアルタイムパケット処理装置及びその方法
JP2006222663A (ja) 通信端末及び通信データ量制御方法
JP2018137614A (ja) 通信装置、通信システム、通信方法及びプログラム
JP2006115305A (ja) 異なるメディアデータにおけるパケット多重化フレームの生成タイミングを制御する送信方法、送信プログラム及び送信装置
JP3980592B2 (ja) 通信装置、符号化列送信装置、符号化列受信装置、これらの装置として機能させるプログラムとこれを記録した記録媒体、および符号列受信復号方法、通信装置の制御方法
JP4679502B2 (ja) クロック補正機能を有する音声パケット再生装置、通信端末及びプログラム
JP2009231939A (ja) 音声パケット通信方法および音声パケット通信装置
JP2006115304A (ja) 異なるメディアデータにおけるパケット多重化フレームのデータ構造、送受信装置及び送受信プログラム
JP2005045740A (ja) 通話装置、通話方法及び通話システム
JP2016158133A (ja) 通信装置、遅延回復方法および遅延回復プログラム