JP4454255B2 - Voice / fax communication system, voice / fax receiver, and fluctuation absorbing buffer amount control method - Google Patents
Voice / fax communication system, voice / fax receiver, and fluctuation absorbing buffer amount control method Download PDFInfo
- Publication number
- JP4454255B2 JP4454255B2 JP2003164573A JP2003164573A JP4454255B2 JP 4454255 B2 JP4454255 B2 JP 4454255B2 JP 2003164573 A JP2003164573 A JP 2003164573A JP 2003164573 A JP2003164573 A JP 2003164573A JP 4454255 B2 JP4454255 B2 JP 4454255B2
- Authority
- JP
- Japan
- Prior art keywords
- packet
- voice
- fax
- communication
- buffer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 239000000872 buffer Substances 0.000 title claims description 158
- 238000004891 communication Methods 0.000 title claims description 144
- 238000000034 method Methods 0.000 title claims description 30
- 230000005540 biological transmission Effects 0.000 claims description 34
- 238000010521 absorption reaction Methods 0.000 claims description 22
- 238000009825 accumulation Methods 0.000 claims description 7
- 230000005236 sound signal Effects 0.000 claims description 4
- 230000003247 decreasing effect Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 230000008054 signal transmission Effects 0.000 description 6
- 238000012544 monitoring process Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
Images
Description
【0001】
【発明の属する技術分野】
本発明は、音声信号あるいはファクシミリ(以下、FAXと略記する。)信号をパケット化して通信を行う音声/FAX通信システムおよびその通信制御方法に関する。本発明は、たとえばマルチメディアパケット交換システムやIP(Internet Protocol)ベースの音声通信サービスを提供するためのVoIP (Voice over IP) システム等に適用可能である。
【0002】
【従来の技術】
パケット通信網を通して音声データをリアルタイム伝送する場合、音声通信の品質がパケット遅延の大小によって大きな影響を受けることはよく知られている。このようなパケット遅延による通信品質の低下を回避するために、パケットの遅延ゆらぎを吸収する技術が種々提案されている。たとえば、特許文献1(特開2000−224225号公報)には、受信パケットの遅延ゆらぎを吸収するためのジッタバッファを設け、更に受信パケットのタイムスタンプ情報からパケット遅延を算出し、その遅延量に応じてパケットの復号タイミングを制御する技術が提案されている。
【0003】
しかしながら、音声通信では有音区間と無音区間とが混在するために、有音時にバッファ量を変動させると違和感が生じるという問題がある。たとえば、有音時にバッファ量を増やすと再生された音声が間延びして聞こえ、逆にバッファ量を減らすと音詰まりして聞こえる。そこで、特許文献2(特開2002−271391号公報)には、受信音声データを復号する前に、無音パターンを検出し、無音時に無音パターンの挿入あるいは消去を行い吸収バッファ量を変動させるダイナミックジッタバッファ制御方法が提案されている。
【0004】
【特許文献1】
特開2000−224225号公報(要約、明細書段落番号0085、図1、図4)
【特許文献2】
特開2002−271391号公報(明細書段落番号0041〜0042)。
【0005】
【発明が解決しようとする課題】
しかしながら、特許文献2に記載された技術では、無音パターンがシステム固有になるため、国際的に標準化された音声符号化技術が使用できない。国際的に標準化された音声符号化方式(例えば、G.728、G.729、G.723.1)に基づく音声通信制御方式の場合には、エンコーダ(送信側)において無音検出機能を持っているが、無音といっても実際には音が全くない状態ではなく背景雑音があるのが一般的である。従って、無音検出されても個々のエンコード結果はその時の背景雑音によって一定ではない。これを一定の無音パターンで置き換えると、デコーダ(受信側)で音声を再生した場合に違和感が生じる。特に有音と無音との切り変わり時に違和感が生じるために、あまり普及していない無音圧縮技術を使用したかのような違和感となる。
【0006】
さらに特許文献2に記載された技術では、揺らぎ吸収バッファの前に無音か有音かを判定する必要がある。すなわち、復号器で行われる無音検出がパケット分析部でも必要となり、同様の処理が二重に行われることになる。
【0007】
また、無音圧縮機能を持たないコーデックを用いた音声通信では、音声圧縮率の範囲内の通信速度でFAX通信を許容している。一般に、音声通信で通話路を確立した後、FAX通信に切り替わるが、場合によっては、音声通信とFAX通信とを交互に繰り返すこともある。
【0008】
周知のように、音声通信は多少品質が下がっても即時性(リアルタイム性)が重視されるために、遅延が生じたときにパケットを破棄することがある。これに対して、FAX通信では多少遅延が生じても確実性が重視されるために、遅延パケットもなるべく破棄しないように制御される。このような逆の特性を有する音声通信およびFAX通信が混在する場合でも、従来、音声通信の制御方法によりFAX通信が制御されていた。このためにFAX通信に必要なデータが抜けて再送処理が発生し通信時間が余計にかかったり、通信異常が発生してFAXを再度送り直さなければならない等の不都合が生じていた。
【0009】
そこで、本発明の目的は、音声/FAX信号をパケット化して通信する際に、ネットワーク内の遅延あるいは遅延揺らぎが生じても、連続した滑らかな信号として再生することを可能にする音声/FAX通信システム、音声/FAX受信装置およびその受信制御方法を提供することにある。
【0010】
更に、本発明の他の目的は、音声通信およびFAX通信が混在する場合でも手順エラーやFAX信号の再送が発生しないように信号を再生することを可能にする音声/FAX通信システムおよびその通信制御方法を提供することにある。
【0011】
【課題を解決するための手段】
本発明によれば、音声/FAXをパケット化して通信する際に、ネットワーク内の遅延あるいは遅延揺らぎに応じて揺らぎ吸収バッファ量を動的に調整する。また、音声通信(即時性重視)かFAX通信(確実性重視)かに応じて吸収バッファ量を制御する基準を変更する。
【0012】
本発明の第1の側面によれば、パケット通信網を介して音声/FAX信号を伝送する音声/FAX通信システムは、音声信号またはFAX信号を符号化するとともに符号化データが無音であるか否かを識別する符号化手段と、前記符号化データが無音である時に当該符号化データに無音フラグを設定して前記パケット通信網へ送信するパケットを生成するパケット生成手段と、を有する送信装置と、前記パケット通信網から受信したパケットの遅延変動を吸収する揺らぎ吸収バッファと、音声通信からFAX通信に切り替わった後に、前記無音フラグが設定された符号化データの無音区間で、前記揺らぎ吸収バッファの蓄積量を音声通信用基準からFAX通信用基準に変更し、前記符号化データの復号化周期ごとに前記揺らぎ吸収バッファ蓄積量を前記無音区間を利用して所定量ずつ増加させるバッファ量制御手段と、を有する受信装置と、を含むことを特徴とする。
【0013】
前記送信装置の前記パケット生成手段は、無音フラグをパケットヘッダに設定して送信し、前記受信装置の前記バッファ量制御手段は、受信パケットヘッダの無音フラグにより符号化データの無音区間を識別することが望ましい。
【0014】
本発明の第2の側面によれば、パケット通信網を介して、有音/無音が区別された符号化データを含むパケットを受信する音声/FAX受信装置は、前記パケット通信網から受信したパケットの遅延変動を吸収するための揺らぎ吸収バッファと、音声通信からFAX通信に切り替わった後に、受信パケットの符号化データが無音の区間で、前記揺らぎ吸収バッファの蓄積量を音声通信用基準からFAX通信用基準に変更し、前記符号化データの復号化周期ごとに前記揺らぎ吸収バッファ蓄積量を前記無音区間を利用して所定量ずつ増加させるバッファ量制御手段と、を有することを特徴とする。
【0015】
前記バッファ量制御手段は、音声通信に適した音声通信用の第1基準テーブルとFAX通信に適したFAX通信用の第2基準テーブルとを含み、受信した符号化データが音声信号およびFAX信号のいずれであるかに応じて、前記第1基準テーブルと第2基準テーブルとを切り替えることが望ましい。
【0016】
本発明の第3の側面によれば、パケット通信網を介して、有音/無音が区別された符号化データを含むパケットを受信する音声/FAX受信装置に設けられた揺らぎ吸収バッファのバッファ量制御方法は、受信パケットの符号化データの無音/有音を判定し、音声通信からFAX通信に切り替わった後に、受信パケットの符号化データが無音の区間で、前記揺らぎ吸収バッファの蓄積量を音声通信用基準からFAX通信用基準に変更し、前記符号化データの復号化周期ごとに前記揺らぎ吸収バッファ蓄積量を前記無音区間を利用して所定量ずつ増加させる、ことを特徴とする。
【0017】
特に、前記遅延が所定範囲を超えた場合、有音/無音に関係なく強制的に前記揺らぎ吸収バッファ量を変更することが望ましい。
【0018】
【発明の実施の形態】
図1は本発明の一実施形態による音声/FAX通信システムを示すブロック図である。図1に示す音声/FAX通信システムでは、複数の音声パケット通信装置(あるいはVoIPゲートウェイ装置)#1,#2・・・がパケット通信網を介して接続されており、各音声パケット通信装置にはアナログ音声信号を送受信する電話機/FAXが接続されている。ここでは、音声パケット通信装置1と音声パケット通信装置2とがパケット通信網の中継回線3を通して接続されており、音声パケット通信装置1には電話機/FAX41がアナログ信号線411を通して接続され、音声パケット通信装置2には電話機/FAX42がアナログ信号線421を通して接続されているものとする。
【0019】
以下、音声パケット通信装置1の構成について説明するが、音声パケット通信装置2の内部構成も基本的に同一である。電話機/FAX41が接続されたアナログ信号線411はPCMコーデック101に接続され、PCMコーデック101は送信系および受信系に接続されている。送信系は、符号器111、パケット生成器121および送信バッファ131からなり、受信系は、受信バッファ132、パケット分析器122、揺らぎ吸収バッファ123および復号器112からなる。WAN(中継部)141は、データバス133を通して送信バッファ131および受信バッファ132に接続され、送信バッファ131から受け取った送信パケットを中継回線3へ送出し、中継回線3から受信したパケットを受信バッファ132へ格納する。
【0020】
同様に、音声パケット通信装置2においても、電話機/FAX42が接続されたアナログ信号線421はPCMコーデック201に接続され、PCMコーデック201は送信系および受信系に接続されている。送信系は、符号器211、パケット生成器221および送信バッファ231からなり、受信系は、受信バッファ232、パケット分析器222、揺らぎ吸収バッファ223および復号器212からなる。WAN241は、データバス233を通して送信バッファ231および受信バッファ232に接続されている。
【0021】
なお、本実施形態におけるPCMコーデック101および201は、アナログ信号を64KのPCMコード(送信信号)1011および2011にそれぞれ変換する。また、符号器111および211は64KのPCMコードを圧縮し、あるいは、FAXモデム信号を抽出して音声と同じ帯域に調整して、符号化データ1112および2112をそれぞれ生成する。さらに、本実施形態における符号器111および211は、符号化データが有音区間か無音区間かを判別することができ、符号化データが無音の時に有効となる無音指示信号1111を生成する。
【0022】
復号器112および212は、受信した符号化データを元の64KPCMコード(再生信号)1012および2012へそれぞれ復号する。また、本実施形態における復号器112および212は、FAXモデム信号の復号を開始から終了までのあいだ有効にするFAX通信表示信号1121および2121をそれぞれ生成する。
【0023】
音声/FAX信号の送信側を音声パケット通信装置#1とすると、電話機/FAX端末機41から受信したアナログ信号411はPCMコーデック101により64KPCMコード1011に変換される。64KPCMコード1011は、符号化周期(例えば10ms)毎に符号器111により符号化され、符号化データ1112と、当該符号化データが無音か否かを示す無音表示フラグ1111とをパケット生成器121へ渡す。パケット生成器121は、後述するパケットヘッダに符号化データ1〜Nを付加してパケットを組み立て、更に、符号化データ1〜Nのそれぞれに対応したフレーム位置に無音表示フラグ1111を設定する。ここで生成されたパケット1211は送信バッファ131へ書き込まれ、WAN141へ送信要求する。WAN141はデータバス133を介して送信バッファ131からパケットを引き取り、伝送すべきパケットを生成して中継回線3へ送信する。音声/FAX信号送信制御の詳細は後述する。
【0024】
音声/FAX信号の受信側を音声パケット通信装置#2とすると、WAN241は中継回線3からパケットを受信し、データバス233を通して受信バッファ232へ格納するとともに、パケット分析器222へパケット受信を通知する。
【0025】
パケット分析器222は揺らぎ吸収バッファ量の制御手段として機能する。パケット分析器222は受信バッファ232からパケットヘッダ2221を読み出して正しいパケットであるかを検査する。正しくなければそのパケットを廃棄し、正しければ現在の揺らぎ吸収バッファ量が適正か否かを判定する。再生可能な受信範囲であれば、当該パケットが格納された受信バッファ232のアドレスと当該パケットの無音表示フラグとを揺らぎ吸収バッファ223へ格納する。
【0026】
復号化の主要処理自体は従来知られたものである。復号器212は復号化周期(例えば10ms)毎に復号化を行うが、揺らぎ吸収バッファ量の変動がある場合には、バッファ量を後述するように変更してから揺らぎ吸収バッファ223からデータを取り出して復号化する。このようにして復号化されたデータ2012は、PCMコーデック201でアナログ信号421に戻されて、受信側の電話機/FAX機42へと到達する。こうして再生されたフレームは受信バッファ232および揺らぎ吸収バッファ223から削除される。
【0027】
また、復号器112および212は、FAX信号を復号した場合、FAX通信表示信号2121を有効にする。このFAX通信表示信号2121の状態によって、パケット分析器122および222は、後述するように、揺らぎ吸収バッファ制御用パラメータの参照テーブルを切り替え、音声通信およびFAX通信の混在に対応することができる。
【0028】
以下、本実施形態による音声/FAX通信システムの具体的な動作例を図2〜図7を参照しながら詳細に説明する。
【0029】
音声/FAXパケット
図2は、本実施形態における音声パケット通信装置の送信/受信バッファに格納される音声/FAXパケットのフォーマット図である。ここでは、複数の符号化データ(フレーム)1〜Nがパケット化されているものとする。
【0030】
図2において、たとえば1つの送信バッファに格納される音声/FAXパケットは、次のバッファの先頭アドレスを示すポインタ13111、コマンド(ここではパケット送信)番号13112、パケット長13113、音声の符号化方式を示す音声タイプ13114、パケット化された符号データ(以降、フレームと称す)のそれぞれに対応して当該フレームの有音/無音の区別を示す無音表示フラグ13115、パケットの送信順を示す送信シーケンス番号13116、パケットの符号化時刻を示すタイムスタンプ(以下、TSと記す)13117、送信元識別子13118、および、符号化されたデータ(音声/FAX信号)13119からなる。なお、符号器111および211が無音区間を検出された時に、無音表示フラグ13115に「無音」を示す値が記録される。
【0031】
また、送信バッファ131および231は、次バッファの先頭アドレスを示すポインタチェーン方式で動作し、WANにより中継回線3へ送出されるパケットは音声タイプ13114〜符号化データ13119のパケットである。受信バッファ132および232の場合も同様であり、音声タイプ23114〜符号化データ23119のパケットを受信すると、ポインタ23111、コマンド(ここではパケット受信)番号23112、および、パケット長23113を付加して、受信バッファ132および232にそれぞれ格納される。
【0032】
コマンド13112/23112およびパケット長13113/23113は、音声/FAX信号処理部と中継処理部とのインタフェースパラメータとして用いられる。パケットフォーマット中で実際に伝送される部分は、パケットヘッダの音声タイプ13114〜送信元識別子13118と符号化データ13119とである。本発明に係る無音表示フラグ13115を除くパラメータについては、従来通りにVoIPで標準化されているRTP(Real-time Transport Protocol)に従って付与される。1つのパケットに、複数のフレーム1〜Nがパケット化されているので、フレームの数だけ無音表示フラグ1〜nが必要となる。
【0033】
揺らぎ吸収バッファ
図3は、本実施形態における揺らぎ吸収バッファの構成および動作を示す模式図である。揺らぎ吸収バッファ123および223は、音声/FAXフレームが格納されている受信バッファのアドレスを格納するバッファ3001と、当該音声/FAXフレームの各々が無音か否かを表示する無音表示フラグを格納するバッファ3002からなる。
【0034】
パケット分析器122および222は、次に再生されるフレーム位置を示す再生ポインタ3003、再生ポインタ位置のサンプリング時間を示す再生フレームタイムスタンプ(TS)3004、再生ポインタより遅れて到着したパケットの最大遅延(再生ポインタから一番離れた位置)を示す増加ポインタ3006、再生ポインタに遅れることなく到着したパケットの最大遅延(再生ポインタから一番近い位置)を示す変動ポインタ3007、および、揺らぎ吸収バッファ制御用パラメータテーブル3005を用いて、後述するように揺らぎ吸収バッファ123および223をそれぞれ制御する。なお、増加ポインタ3006および変動ポインタ3007の初期値はともに再生ポインタ3003と同じであり、後述する揺らぎ吸収バッファ量を変更した場合にはともに初期化される。
【0035】
吸収バッファ制御用パラメータテーブル3005には、揺らぎ吸収バッファを増加させるべき範囲を示す増加範囲パラメータ30051、揺らぎ吸収バッファを変動させない範囲を示す不感動範囲パラメータ30052、揺らぎ吸収バッファを減少させる範囲を示す減少範囲パラメータ30053が設けられている。各パラメータは、音声通信中あるいはFAX通信中であるかに応じて異なる2種類の値が予め定義されている。
【0036】
図3に示す例では、音声通信の場合に増加範囲、不感動範囲あるいは減少範囲に分類される0ms〜120msの範囲のものが、FAX通信中では等しく増加範囲として判定される。 これによって、音声通信からFAX通信への切り替えが発生しても、FAX通信では常に増加範囲に判定され、後述するように無音区間を利用してバッファ量を増加させることができる。逆に、FAX通信から音声通信に切り替わった場合は、たとえばFAX通信の不感動範囲は音声通信の強制減少範囲になり、無音区間を利用して、あるいは、切り替わりのタイミングで強制的にバッファ量を減少させることができる。このように、即時性重視および確実性重視の2つのパラメータテーブルを切り替えて適切な制御が可能となる。
【0037】
次ぎに、強制増加/増加/不感動/減少/強制減少範囲の動作について簡単に説明しておく。
【0038】
(a) 強制増加範囲:この範囲に一定数以上のパケットが到着すると、有音/無音区間にかかわらず強制的にバッファ量を増加する。この間に受信したパケットは再生タイミングを過ぎているため廃棄される。
【0039】
(b) 増加範囲:この範囲にパケットが到着すると、無音区間を利用して1フレーム分のバッファ量を増加させる。受信パケットは揺らぎ吸収バッファに積み込まれる。
【0040】
(c) 不感動範囲:この範囲にパケットが到着すると、バッファ量の変更はしない。受信パケットは揺らぎ吸収バッファに積み込まれる。
【0041】
(d) 減少範囲:この範囲にパケットが到着すると、無音区間を利用して、1フレーム分のバッファ量を減少させる。受信パケットは揺らぎ吸収バッファに積み込まれる。
【0042】
(e) 強制減少範囲:この範囲にパケットが到着すると、有音/無音区間にかかわらず強制的にバッファ量を減少させる。受信パケットは揺らぎ吸収バッファに積み込まれる。
【0043】
なお、揺らぎを吸収するためには遅延の大きい方へバッファ量をあわせる必要がある。またバッファ量増加→減少→増加のような不安定な動作が生じないようにすることも必要である。したがって、揺らぎ吸収バッファ量変動制御では増加方向の処理を優先する。
【0044】
音声/FAX信号送信制御
最初に、本実施形態における音声/FAX信号送信制御について、音声パケット通信装置#1を例にとって説明する。ここでは、1つのパケットがNフレームで構成され、フレームカウントによってフレームの位置および個数が指示されるものとする(図2参照)。
【0045】
図4は、本実施形態における音声/FAX信号送信制御を示すフローチャートである。先ず、所定の初期化を行った後、符号器111を符号化周期(例えば10ms)で起動し(ステップS101)、PCMコーデック101から出力された64KPCMコード1011を符号化する(ステップS102)。パケット生成器121は、符号器111から符号化データ1112と当該符号化データの無音表示フラグ1111とを受け取り、パケットに組み込む符号化データの数、すなわちフレームカウントが0であるか否かを判定する(ステップS103)。
【0046】
フレームカウントが0の場合は(ステップS103のYES)、新規パケットを生成するためにパケットヘッダを生成し(ステップS104)、フレームカウントを1だけ増加させる(ステップS105)。フレームカウントが0でなければ(ステップS103のNO)、パケットヘッダを生成することなく、フレームカウントを1だけ増加させる(ステップS105)。
【0047】
続いて、パケット生成器121は、符号化データ1112をフレームカウントに従ったフレーム位置に設定し(ステップS106)、同様に、無音表示フラグ1111をフレームカウントに従った位置に設定する(ステップS107)。そして、フレームカウントがNに等しいか否かを判定する(ステップS108)。フレームカウントがNに到達していなければ(ステップS108のNO)、ステップS101へ戻る。すなわち、フレームカウントがNになるまで、ステップS101〜S107を繰り返す。
【0048】
フレームカウントがNに等しくなると(ステップS108のYES)、N個の符号化データを載せたパケットが完成したことになるので、この送信パケット1211を送信バッファ131へ書き込み(ステップS109)、フレームカウントを0にリセットする(ステップS110)。そして、WAN141へ送信要求を出力し、上述したようにWAN141により中継回線3へ送信される(ステップS111)。以上のステップS101〜S111を繰り返すことで、送信パケットが順次送信される。
【0049】
音声/FAX信号受信制御
次に、音声/FAX信号受信制御について、音声パケット通信装置#2を例にとり、図3、図5〜図7を参照しながら詳細に説明する。
【0050】
図5は本実施形態における音声/FAX信号受信制御のパケット分析を示すフローチャートであり、図6は本実施形態における揺らぎ吸収バッファ量変動制御を示すフローチャートである。パケット分析器は、上述したようにFAX通信表示信号2121によって参照するパラメータテーブルを決定し、次に述べるように、パケット分析、揺らぎ吸収バッファへの積み込み、および、揺らぎ吸収バッファ量の変動制御を実行する。
【0051】
(1)パケット分析および揺らぎ吸収バッファへの積み込み
図5において、パケット通信装置#2のWAN241は、中継回線3からパケットを受信すると(ステップS201)、受信パケットをデータバス233を通して受信バッファ232へ格納し(図2参照)、パケット分析器222へパケット受信を通知する。パケット受信の通知を受けると、パケット分析器222は、受信バッファ232からパケットヘッダ2221を読み出して分析し、パケット長23113、音声タイプ23114、送信元識別子23118などから正しいパケットであるか否かを判定する(ステップS202)。上述したように、正しいパケットでない場合は当該パケットを廃棄し、正しいパケットであれば、次に述べるように現在の揺らぎ吸収バッファ量が適正か否かを判定する。
【0052】
まず、再生ポインタ3003、再生フレームTS3004および受信パケットタイムスタンプ(TS)23117を用いて、受信パケットの揺らぎ吸収バッファ積み込み位置を算出する(ステップS203)。
【0053】
たとえば、受信パケットTSの初期値=0、TSが64KPCMサンプリング単位で1フレーム当たり80だけ増加し、1パケットが3フレームで構成される場合には、通信の最初に受信したパケットのTSは「0」で、パケットのシーケンス番号が「1」上がるとTSは「80×3=240」だけ上がる。この場合、再生フレームTSをX、受信パケットTSをYとすると、積み込み位置は(Y−X)/80で算出できる。
【0054】
図3に示すバッファ構成では、X=2080、Y=2160とすると、積み込み位置は「1」になるから、再生ポインタ3003の位置を「0」に見て、受信バッファアドレス3001の#1〜#3に受信バッファアドレスおよび無音表示フラグが積み込まれる。図3における「音声通信中」であれば、「増加範囲」で受信したことになる。また、X=2080、Y=1840であれば、積み込み位置は「−3」になるから、受信バッファアドレス3001の#125〜#127に受信バッファアドレスが積み込まれる。この場合、「音声通信中」であれば、「強制増加範囲」、すなわち増加範囲外(再生不可範囲)で受信したことになる。
【0055】
なお、上述したように、 強制増加/増加/不感動/減少/強制減少範囲を判定するために参照される吸収バッファ制御用パラメータテーブルは、FAX通信表示信号2121が「音声通信中」あるいは「FAX通信中」のいずれを示すかによって決定される。
【0056】
このようにして、パケット分析器122および222は、算出された積み込み位置が強制増加範囲あるいはそれ以外の範囲のいずれになるかを判定する(ステップS204)。
【0057】
強制増加範囲で受信したパケットは既に再生時間が経過しているために再生されないが、この状態が長く継続すると音が再生されずに無音となるため、早い機会に揺らぎ吸収バッファを適応位置へ変更する必要がある。そこで、積み込み位置が強制増加範囲内になると(ステップS204)、パケット分析器は積み込み位置が増加ポインタ3006より小さいか否かを判定する(ステップS205)。積み込み位置が増加ポインタ3006より小さい、すなわち遅延が大きくなっていれば(ステップS205のYES)、増加ポインタ3006を今回算出した積み込み位置に更新し(ステップS206)、増加範囲外カウンタを1だけインクリメントして(ステップS207)、強制増加範囲に一定値以上のパケットが到着したか否かを判定する(ステップS208)。
【0058】
強制増加範囲に一定値以上のパケットが到着したと判定されると(S208)、強制増加フラグをオンに設定する(ステップS209)。これによって、後述するように有音/無音にかかわらず揺らぎ吸収バッファを増加させることができる。強制増加範囲以外で受信したパケットは再生時間に間に合っているので、揺らぎ吸収バッファを適応位置へ変動することに緊急性がない。この場合は、後述するように無音のタイミングでバッファ量を変動させるために、パケット分析器は、ステップS203で算出した積み込み位置が変動ポインタ3007より小さいか否かを判定する(ステップS210)。
【0059】
積み込み位置が変動ポインタ3007より小さい、すなわち遅延が大きくなっていれば(ステップS210のYES)、変動ポインタ3007を今回算出した積み込み位置に更新し(ステップS211)、再生するフレームが格納されている受信バッファのアドレスおよび当該フレームの無音表示フラグを揺らぎ吸収バッファに積み込む(ステップS212)。なお、増加ポインタ3006および変動ポインタ3007の初期値はともに再生ポインタ3003と同じで、揺らぎ吸収バッファ量を変更した場合には初期化される。
【0060】
(2)揺らぎ吸収バッファ量変動制御
パケット分析器は、上述したように、FAX通信表示信号2121に依存して決定されたパラメータテーブルを参照して、揺らぎ吸収バッファ量を制御する。より詳細な制御動作を図6に示す。
【0061】
図6において、復号器の復号化周期が起動すると(ステップS301)、パケット分析器は周期カウンタを1つ減少させ(ステップS302)、上述したステップS209において設定された強制増加フラグがオンであるか否かを判定する(ステップS303)。
【0062】
強制増加フラグがオンの場合には(ステップS303のYES)、増加範囲外監視カウンタが一定値を越えているので、強制的にバッファ量を増加する必要がある。そこで、再生ポインタ3003および変動ポインタ3007を増加ポインタ3006の値に変更し(ステップS304)、増加範囲外監視カウンタを0にリセットし(ステップS305)、周期カウンタを初期値Lにリセットして(ステップS306)、後述する受信パケット再生処理を実行する(図7参照)。なお、この間に受信したパケットは再生タイミングを過ぎているため廃棄する。
【0063】
強制増加フラグがオフの場合には(ステップS303)、周期カウンタが0であるか否かを判定し(ステップS307)、周期カウンタが0でなければ(ステップS307のNO)、後述する受信パケット再生処理を実行する(図7参照)。周期カウンタ=0であれば(ステップS307のYES)、変動ポインタ3007が強制減少範囲にあるか否かを判定する(ステップS308)。変動ポインタ3007が強制減少範囲より小さい場合(すなわち、減少範囲以下の場合)には、現時点の周期カウンタにより決定される揺らぎ吸収バッファのアドレスに対応する無音表示フラグを確認する(ステップS309)。
【0064】
当該対応する無音表示フラグが1(無音)の場合には、増加範囲外カウンタ=0であるか否か判定し(ステップS310)、増加範囲外カウンタ=0であれば(ステップS310のYES)、積み込み位置が強制増加範囲ではないから、変動ポインタ3007の存在範囲を決定する(ステップS311)。
【0065】
変動ポインタ3007が増加範囲にあった場合には、再生ポインタ3003を1つだけ減少させることで1フレーム分バッファ量を増加させ(ステップS312)、上述したステップS306へ移行する。したがって、無音区間だけで少しずつ(ここでは、1フレームずつ)バッファ量を増加させることができる。変動ポインタ3007が不感動範囲にあった場合も上述したステップS306へ移行する。また、変動ポインタ3007が減少範囲にあった場合には、後述するステップS314へ移行する。
【0066】
また、ステップS309において当該無音表示フラグが0(有音)の場合には、周期カウンタを1つだけインクリメントして(ステップS313)、後述する受信パケット再生処理を実行する(図7参照)。
【0067】
ステップS308において変動ポインタ3007が強制減少範囲内にある場合、あるいは、ステップS311において変動ポインタ3007が減少範囲にある場合には、パケット分析器は揺らぎ吸収バッファから1フレーム分の情報を取り出して(ステップS314)、対応する受信バッファおよび揺らぎ吸収バッファを解放する(ステップS315、S316)。そして、再生ポインタ3003を1つだけ増加させることで、1フレーム分バッファ量を減少させる。これらステップS314〜S317は、再生ポインタ3003が変動ポインタ3007に一致するまで繰り返される(ステップS318)。したがって、再生ポインタ3003と変動ポインタ3007との差分に対応するフレーム分のバッファ量を減少させることができる。再生ポインタ3003が変動ポインタ3007に一致すると、増加ポインタ3006を変動ポインタ3007の値にしてステップS306へ戻る。
【0068】
こうして、ステップS308において変動ポインタ3007が強制減少範囲内にある場合には強制的に、ステップS311において変動ポインタ3007が減少範囲にある場合には無音区間を利用して、バッファ量を減少させることができる。
【0069】
なお、周期監視中には、増加方向と減少方向の双方が監視対象になる場合も想定されるが、揺らぎを吸収するためには遅延の大きい方へバッファ量をあわせる必要があり、バッファ量増加→減少→増加のような不安定な処理を発生させないようにするためにも、増加方向の処理を優先し、バッファ量変動を実施した場合は、全ての監視をクリアにすることとする。
【0070】
また、揺らぎが不感動範囲で安定している状態で、音声通信から、FAX通信に切り替わった時は、参照するテーブルが切り替わるので、音声の不感動範囲はFAX通信の増加範囲となり、無音区間を利用して周期的にバッファ量を増加させることができる。これとは逆に、FAX通信から音声通信に切り替わった場合、FAX通信の不感動範囲は、音声通信における減少方向なので、バッファ量が少ない場合は、無音区間を利用して、あるいは、切り替わりの瞬間に強制的に、バッファ量を減少させることができる。
【0071】
(3)音声/FAXパケット再生制御
図7は本実施形態における音声/FAXパケット再生制御を示すフローチャートである。ただし、上述したように、図7のフローチャートにおける入口端子Cは、図6のフローチャートの接続端子Cにつながっている。
【0072】
音声パケット通信装置における復号化の主要処理は従来知られたものと略同様である。復号化周期(例えば10ms)毎に復号器212で復号化するが、上述したように、揺らぎ吸収バッファ量の変動がある場合には、復号化するデータを取り出す前に再生ポインタ3003を変更する。
【0073】
図7において、ます、パケット分析器は揺らぎ吸収バッファから1フレーム分の情報を取り出して(ステップS401)、復号器は対応する符号化データを復号化して再生する(ステップS402、S403)。再生されたフレームは受信バッファから削除され(受信バッファ開放:ステップS404)、また揺らぎ吸収バッファからも削除される(揺らぎ吸収バッファ開放:ステップS405)。続いて、再生ポインタを1つだけ増加させ(ステップS406)、再生フレームTSを80だけ増加させる(ステップS407)。このようにして復号化されたデータ2012は、PCMコーデック201でアナログ信号421に戻されて、受信側の電話機/FAX機:42へ送出される。
【0074】
上述したように、本実施例によれば、通話中に網内で遅延が発生してパケット受信間隔が揺らいでも滑らかな音声再生が得られる。また、送信側での無音検出が省略できるために、再生側での処理の効率化が図れる。また、パラメータテーブルをFAX通信表示信号に応じて切り替えることで、FAX通信中に網内で遅延が発生してパケット受信間隔が揺らいでも、手順エラーや画像信号の再送が発生しにくくなる。
【0075】
以上、実施の形態例により本発明を説明したが、実施の形態での音声パケット通信装置における具体的処理や数値は一例であって、本発明を規定するものではなく、目的とする機能を実現できれば異なる手順や異なるパラメータを採用しても良いことは勿論である。電話機/FAX端末(音声装置)を含み一体化した音声パケット通信装置とすることも可能である。
【0076】
【発明の効果】
本発明によれば、無音でも背景雑音を生かし無音区間で揺らぎ吸収バッファ量を変動させるようにしたために、通話中に網内で遅延が発生してパケット受信間隔が揺らいでも滑らかに音声が再生できるという効果を有する。
【0077】
また、FAX通信中であることを識別して、揺らぎ吸収バッファ量を音声通信時のバッファ量より増加させ、かつ、バッファ量の変更を無音区間を利用して周期的に少しずつ増やしていくことで、FAX通信中に網内で遅延が発生してパケット受信間隔が揺らいでも、FAX通信に必要な信号を壊すことなく連続的に再生可能となり、手順エラーや画像信号の再送が発生しにくくなる。
【図面の簡単な説明】
【図1】本発明の一実施形態による音声/FAX通信システムを示すブロック図である。
【図2】本実施形態における音声パケット通信装置の送信/受信バッファに格納される音声/FAXパケットのフォーマット図である。
【図3】本実施形態における揺らぎ吸収バッファの構成および動作を示す模式図である。
【図4】本実施形態における音声/FAX信号送信制御を示すフローチャートである。
【図5】本実施形態における音声/FAX信号受信制御のパケット分析を示すフローチャートである。
【図6】本実施形態における揺らぎ吸収バッファ量変動制御を示すフローチャートである。
【図7】本実施形態における音声/FAXパケット再生制御を示すフローチャートである。
【符号の説明】
1、2 音声パケット通信装置
3 中継回線
41、42 電話機/FAX端末
101,201 PCMコーデック制御部
111,211 符号器
112,212 復号器
121,221 パケット生成器
122,222 パケット分析器
123,223 揺らぎ吸収バッファ
131,231 送信バッファ
132,232 受信バッファ
133,233 データバス
141,241 中継部(WAN)[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a voice / FAX communication system that performs communication by packetizing a voice signal or a facsimile (hereinafter abbreviated as FAX) signal and a communication control method thereof. The present invention is applicable to, for example, a multimedia packet switching system, a VoIP (Voice over IP) system for providing an IP (Internet Protocol) based voice communication service, and the like.
[0002]
[Prior art]
When voice data is transmitted in real time through a packet communication network, it is well known that the quality of voice communication is greatly influenced by the magnitude of packet delay. In order to avoid such deterioration in communication quality due to packet delay, various techniques for absorbing packet delay fluctuation have been proposed. For example, in Patent Document 1 (Japanese Patent Laid-Open No. 2000-224225), a jitter buffer for absorbing delay fluctuations of a received packet is provided, and a packet delay is calculated from time stamp information of the received packet, and the amount of delay is calculated. Accordingly, a technique for controlling the packet decoding timing has been proposed.
[0003]
However, there is a problem in that a sense of incongruity occurs when the buffer amount is varied during sound because the voice communication includes a voiced section and a silent section. For example, when the buffer amount is increased when there is sound, the reproduced sound is heard with a delay, and conversely when the buffer amount is decreased, the sound is clogged. Therefore, Patent Document 2 (Japanese Patent Application Laid-Open No. 2002-271391) discloses dynamic jitter that detects a silence pattern before decoding received audio data, and inserts or deletes the silence pattern during silence to vary the absorption buffer amount. Buffer control methods have been proposed.
[0004]
[Patent Document 1]
Japanese Unexamined Patent Publication No. 2000-224225 (abstract, description, paragraph number 0085, FIG. 1, FIG. 4)
[Patent Document 2]
JP 2002-271391 (paragraph numbers 0041-0042).
[0005]
[Problems to be solved by the invention]
However, in the technique described in
[0006]
Furthermore, in the technique described in
[0007]
Further, in voice communication using a codec that does not have a silence compression function, FAX communication is permitted at a communication speed within the range of the voice compression rate. In general, after establishing a communication path by voice communication, the communication is switched to FAX communication. However, in some cases, voice communication and FAX communication may be alternately repeated.
[0008]
As is well known, since voice communication emphasizes immediacy (real-time performance) even if the quality is somewhat degraded, packets may be discarded when a delay occurs. On the other hand, in FAX communication, since certainty is emphasized even if a slight delay occurs, control is performed so that delayed packets are not discarded as much as possible. Even when voice communication and FAX communication having such reverse characteristics coexist, FAX communication has been conventionally controlled by the control method of voice communication. For this reason, data necessary for FAX communication has been lost and retransmission processing has occurred, resulting in unnecessary communication time, or a communication error has occurred and the FAX has to be sent again.
[0009]
SUMMARY OF THE INVENTION Accordingly, an object of the present invention is to provide voice / fax communication that enables reproduction as a continuous smooth signal even when delay or fluctuation in the network occurs when voice / fax signals are packetized and communicated. A system, a voice / fax receiving apparatus, and a reception control method thereof are provided.
[0010]
Furthermore, another object of the present invention is to provide a voice / FAX communication system and its communication control that can reproduce a signal so that a procedure error and a FAX signal are not retransmitted even when voice communication and FAX communication are mixed. It is to provide a method.
[0011]
[Means for Solving the Problems]
According to the present invention, when voice / fax is packetized and communicated, the amount of fluctuation absorbing buffer is dynamically adjusted according to delay or delay fluctuation in the network. Further, the reference for controlling the absorption buffer amount is changed according to whether the voice communication (immediate importance) or the FAX communication (certainty).
[0012]
According to the first aspect of the present invention, an audio / FAX communication system that transmits an audio / FAX signal via a packet communication network encodes an audio signal or FAX signal and whether encoded data is silent. A transmission device comprising: an encoding means for identifying the packet; and a packet generation means for generating a packet to be transmitted to the packet communication network by setting a silence flag in the encoded data when the encoded data is silent. , A fluctuation absorbing buffer that absorbs delay variation of packets received from the packet communication network, and after switching from voice communication to FAX communication, the encoded data in which the silence flag is setSilenceIn the section, the accumulated amount of the fluctuation absorbing buffer is changed from the standard for voice communication to the standard for FAX communication.And increasing the fluctuation absorption buffer accumulation amount by a predetermined amount using the silent period for each decoding cycle of the encoded data.And a reception device having a buffer amount control means.
[0013]
The packet generation means of the transmission device sets a silence flag in a packet header and transmits the packet header, and the buffer amount control means of the reception device identifies a silence section of the encoded data by the silence flag of the reception packet header.It is desirable.
[0014]
According to the second aspect of the present invention, there is provided a voice / fax receiving device that receives a packet including encoded data in which voice / silence is distinguished via a packet communication network. Fluctuation absorption buffer for absorbing delay fluctuations of the received packet, and after switching from voice communication to FAX communication, the amount of fluctuation stored in the fluctuation absorption buffer is determined based on the voice communication reference when the encoded data of the received packet is silent. Change to standardAnd increasing the fluctuation absorption buffer accumulation amount by a predetermined amount using the silent period for each decoding cycle of the encoded data.And a buffer amount control means.
[0015]
The buffer amount control means includesSuitable for voice communicationFor voice communicationSuitable for the first reference table and FAX communicationFor FAX communicationIncluding the second reference table,It is desirable to switch between the first reference table and the second reference table depending on whether the received encoded data is an audio signal or a FAX signal.
[0016]
According to the third aspect of the present invention, the buffer amount of the fluctuation absorbing buffer provided in the voice / fax receiving apparatus that receives a packet including encoded data in which voiced / silent is distinguished via a packet communication network The control method determines the silence / sound of the encoded data of the received packet, and after switching from voice communication to FAX communication, the amount of accumulation in the fluctuation absorbing buffer is calculated in the interval where the encoded data of the received packet is silent. Change from communication standard to FAX communication standardAnd increasing the fluctuation absorption buffer accumulation amount by a predetermined amount using the silent period for each decoding cycle of the encoded data.It is characterized by that.
[0017]
In particular, when the delay exceeds a predetermined range, it is desirable to forcibly change the amount of fluctuation absorbing buffer regardless of the presence / absence of sound.
[0018]
DETAILED DESCRIPTION OF THE INVENTION
FIG. 1 is a block diagram showing a voice / fax communication system according to an embodiment of the present invention. In the voice / FAX communication system shown in FIG. 1, a plurality of voice packet communication devices (or VoIP gateway devices) # 1, # 2,... Are connected via a packet communication network. A telephone / fax that transmits and receives analog audio signals is connected. Here, the voice
[0019]
Hereinafter, the configuration of the voice
[0020]
Similarly, in the voice
[0021]
The PCM codecs 101 and 201 in the present embodiment convert analog signals into 64K PCM codes (transmission signals) 1011 and 2011, respectively. Also, the
[0022]
[0023]
Assuming that the voice / fax signal transmission side is the voice packet
[0024]
Assuming that the voice / FAX signal receiving side is the voice packet
[0025]
The
[0026]
The main process of decoding itself is conventionally known. The
[0027]
Also, the
[0028]
Hereinafter, specific operation examples of the voice / fax communication system according to the present embodiment will be described in detail with reference to FIGS.
[0029]
Voice / FAX packet
FIG. 2 is a format diagram of a voice / FAX packet stored in the transmission / reception buffer of the voice packet communication apparatus according to the present embodiment. Here, it is assumed that a plurality of encoded data (frames) 1 to N are packetized.
[0030]
In FIG. 2, for example, a voice / FAX packet stored in one transmission buffer has a pointer 13111 indicating the start address of the next buffer, a command (packet transmission) number 13112, a
[0031]
The transmission buffers 131 and 231 operate in a pointer chain system indicating the head address of the next buffer, and packets sent to the
[0032]
The command 13112/23112 and the
[0033]
Fluctuation absorption buffer
FIG. 3 is a schematic diagram showing the configuration and operation of the fluctuation absorbing buffer in the present embodiment. The
[0034]
The
[0035]
The absorption buffer control parameter table 3005 includes an
[0036]
In the example shown in FIG. 3, a range of 0 ms to 120 ms that is classified into an increase range, a dead range, or a decrease range in the case of voice communication is equally determined as an increase range during FAX communication. Thus, even when switching from voice communication to FAX communication occurs, it is always determined that the range is increased in FAX communication, and the buffer amount can be increased using a silent section as will be described later. Conversely, when switching from FAX communication to voice communication, for example, the insensitive range of FAX communication becomes the forcible decrease range of voice communication, and the buffer amount is forcibly used by using a silent section or at the timing of switching. Can be reduced. In this way, appropriate control can be performed by switching between the two parameter tables for immediacy and certainty.
[0037]
Next, the operation in the forced increase / increase / insensitive / decrease / forced decrease range will be briefly described.
[0038]
(a) Forced increase range: When a certain number of packets arrive in this range, the buffer amount is forcibly increased regardless of the voiced / silent period. Packets received during this time are discarded because the reproduction timing has passed.
[0039]
(b) Increase range: When a packet arrives within this range, the buffer amount for one frame is increased using a silent period. The received packet is loaded into the fluctuation absorbing buffer.
[0040]
(c) Insensitive range: When a packet arrives within this range, the buffer amount is not changed. The received packet is loaded into the fluctuation absorbing buffer.
[0041]
(d) Decreasing range: When a packet arrives within this range, the buffer amount for one frame is decreased using a silent period. The received packet is loaded into the fluctuation absorbing buffer.
[0042]
(e) Forced decrease range: When a packet arrives within this range, the buffer amount is forcibly decreased regardless of the voiced / silent period. The received packet is loaded into the fluctuation absorbing buffer.
[0043]
In order to absorb fluctuations, it is necessary to adjust the buffer amount toward a larger delay. It is also necessary to prevent an unstable operation such as increase in buffer amount → decrease → increase. Therefore, priority is given to processing in the increasing direction in the fluctuation absorption buffer amount fluctuation control.
[0044]
Voice / FAX signal transmission control
First, voice / fax signal transmission control in this embodiment will be described by taking voice packet
[0045]
FIG. 4 is a flowchart showing voice / FAX signal transmission control in the present embodiment. First, after performing predetermined initialization, the
[0046]
If the frame count is 0 (YES in step S103), a packet header is generated to generate a new packet (step S104), and the frame count is increased by 1 (step S105). If the frame count is not 0 (NO in step S103), the frame count is increased by 1 without generating a packet header (step S105).
[0047]
Subsequently, the
[0048]
When the frame count is equal to N (YES in step S108), a packet carrying N encoded data is completed, so this
[0049]
Voice / FAX signal reception control
Next, voice / fax signal reception control will be described in detail with reference to FIGS. 3 and 5 to 7, taking voice packet
[0050]
FIG. 5 is a flowchart showing packet analysis of voice / fax signal reception control in this embodiment, and FIG. 6 is a flowchart showing fluctuation absorption buffer amount fluctuation control in this embodiment. The packet analyzer determines the parameter table to be referred to by the FAX communication display signal 2121 as described above, and performs packet analysis, loading into the fluctuation absorbing buffer, and fluctuation control of the fluctuation absorbing buffer amount as described below. To do.
[0051]
(1) Packet analysis and loading into fluctuation absorbing buffer
In FIG. 5, when the
[0052]
First, using the
[0053]
For example, when the initial value of the received packet TS is 0, the TS is increased by 80 per frame in 64 KPCM sampling units, and one packet is composed of 3 frames, the TS of the packet received at the beginning of communication is “0”. , When the packet sequence number increases by “1”, the TS increases by “80 × 3 = 240”. In this case, if the reproduction frame TS is X and the reception packet TS is Y, the loading position can be calculated by (Y−X) / 80.
[0054]
In the buffer configuration shown in FIG. 3, when X = 2080 and Y = 2160, the loading position is “1”. 3 is loaded with a reception buffer address and a silence display flag. If it is “during voice communication” in FIG. 3, it is received in “increase range”. If X = 2080 and Y = 1840, the loading position is “−3”, so that the reception buffer address is loaded into # 125 to # 127 of the
[0055]
As described above, the absorption buffer control parameter table referred to for determining the forced increase / increase / insensitivity / decrease / forced decrease range is that the FAX communication display signal 2121 is “voice communication in progress” or “FAX communication”. It is determined depending on which of “in communication” is indicated.
[0056]
In this way, the
[0057]
Packets received in the forced increase range will not be played because the playback time has already passed, but if this state continues for a long time, the sound will not be played and the sound will be silenced, so the fluctuation absorbing buffer will be changed to the adaptive position at an early opportunity There is a need to. Therefore, when the loading position falls within the forced increase range (step S204), the packet analyzer determines whether or not the loading position is smaller than the increase pointer 3006 (step S205). If the loading position is smaller than the
[0058]
If it is determined that a packet of a certain value or more has arrived in the forced increase range (S208), the forced increase flag is set to ON (step S209). As a result, as will be described later, the fluctuation absorbing buffer can be increased regardless of sound / silence. Since a packet received outside the forced increase range is in time for the playback time, there is no urgency in changing the fluctuation absorbing buffer to the adaptive position. In this case, the packet analyzer determines whether the loading position calculated in step S203 is smaller than the variation pointer 3007 in order to vary the buffer amount at a silent timing as described later (step S210).
[0059]
If the loading position is smaller than the fluctuation pointer 3007, that is, if the delay is larger (YES in step S210), the fluctuation pointer 3007 is updated to the currently calculated loading position (step S211), and the reception in which the frame to be reproduced is stored is received. The buffer address and the silence display flag of the frame are loaded into the fluctuation absorbing buffer (step S212). Note that the initial values of the
[0060]
(2) Fluctuation absorption buffer amount fluctuation control
As described above, the packet analyzer refers to the parameter table determined depending on the FAX communication display signal 2121 and controls the fluctuation absorbing buffer amount. A more detailed control operation is shown in FIG.
[0061]
In FIG. 6, when the decoding cycle of the decoder starts (step S301), the packet analyzer decrements the cycle counter by 1 (step S302), and whether the forced increase flag set in step S209 described above is on. It is determined whether or not (step S303).
[0062]
If the forced increase flag is on (YES in step S303), the out-of-range monitoring counter exceeds a certain value, so it is necessary to forcibly increase the buffer amount. Therefore, the
[0063]
If the forced increase flag is off (step S303), it is determined whether or not the period counter is 0 (step S307). If the period counter is not 0 (NO in step S307), the received packet reproduction described later The process is executed (see FIG. 7). If the cycle counter = 0 (YES in step S307), it is determined whether or not the fluctuation pointer 3007 is in the forced decrease range (step S308). If the fluctuation pointer 3007 is smaller than the forced decrease range (that is, less than the decrease range), the silence display flag corresponding to the address of the fluctuation absorbing buffer determined by the current period counter is checked (step S309).
[0064]
If the corresponding silence display flag is 1 (silence), it is determined whether or not the counter outside the increase range = 0 (step S310). If the counter outside the increase range = 0 (YES in step S310), Since the loading position is not within the forced increase range, the existence range of the variation pointer 3007 is determined (step S311).
[0065]
If the variable pointer 3007 is in the increase range, the buffer amount is increased by one frame by decreasing the
[0066]
If the silence display flag is 0 (sound) in step S309, the period counter is incremented by one (step S313), and a received packet reproduction process described later is executed (see FIG. 7).
[0067]
If the variation pointer 3007 is within the forced decrease range in step S308, or if the variation pointer 3007 is in the decrease range in step S311, the packet analyzer extracts information for one frame from the fluctuation absorbing buffer (step S311). In step S314, the corresponding reception buffer and fluctuation absorbing buffer are released (steps S315 and S316). Then, the buffer amount is decreased by one frame by increasing the
[0068]
In this way, the buffer amount is forcibly reduced when the variable pointer 3007 is within the forced decrease range in step S308, and the silent section is used when the variable pointer 3007 is within the decrease range in step S311. it can.
[0069]
During periodic monitoring, it is assumed that both the increasing direction and decreasing direction may be monitored, but in order to absorb fluctuations, it is necessary to adjust the buffer amount to the larger delay, and the buffer amount increases. In order not to generate unstable processing such as → decrease → increase, priority is given to processing in the increasing direction, and when the buffer amount is changed, all monitoring is cleared.
[0070]
In addition, when the fluctuation is stable in the insensitive range, when switching from voice communication to FAX communication, the table to be referenced changes, so the insensitive range of voice becomes the increase range of FAX communication, and the silent section is It is possible to periodically increase the buffer amount by using it. On the contrary, when switching from FAX communication to voice communication, the insensitive range of FAX communication is decreasing in voice communication, so if the buffer amount is small, use the silent section or the moment of switching Forcibly, the buffer amount can be reduced.
[0071]
(3) Voice / FAX packet playback control
FIG. 7 is a flowchart showing the voice / fax packet reproduction control in this embodiment. However, as described above, the inlet terminal C in the flowchart of FIG. 7 is connected to the connection terminal C in the flowchart of FIG.
[0072]
The main processing of decoding in the voice packet communication apparatus is substantially the same as that conventionally known. Decoding is performed by the
[0073]
In FIG. 7, the packet analyzer first extracts information for one frame from the fluctuation absorbing buffer (step S401), and the decoder decodes and reproduces the corresponding encoded data (steps S402 and S403). The reproduced frame is deleted from the reception buffer (reception buffer release: step S404), and is also deleted from the fluctuation absorption buffer (fluctuation absorption buffer release: step S405). Subsequently, the playback pointer is increased by one (step S406), and the playback frame TS is increased by 80 (step S407). The data 2012 decoded in this manner is returned to the
[0074]
As described above, according to this embodiment, smooth voice reproduction can be obtained even when a delay occurs in the network during a call and the packet reception interval fluctuates. Further, since silence detection on the transmission side can be omitted, the processing on the reproduction side can be made more efficient. In addition, by switching the parameter table according to the FAX communication display signal, a procedure error and retransmission of the image signal are less likely to occur even if a delay occurs in the network during the FAX communication and the packet reception interval fluctuates.
[0075]
Although the present invention has been described above with reference to the embodiments, the specific processing and numerical values in the voice packet communication device according to the embodiments are merely examples and do not define the present invention, and realize the intended function. Of course, different procedures and different parameters may be adopted if possible. An integrated voice packet communication device including a telephone / fax terminal (voice device) may be used.
[0076]
【The invention's effect】
According to the present invention, even if there is no sound, the background noise is utilized and the fluctuation absorbing buffer amount is changed in the silent period. Therefore, even if a delay occurs in the network during a call and the packet reception interval fluctuates, the voice can be smoothly reproduced. It has the effect.
[0077]
Also, by identifying that the FAX communication is being performed, the fluctuation absorbing buffer amount is increased from the buffer amount at the time of voice communication, and the change of the buffer amount is periodically increased little by little using a silent period. Therefore, even if a delay occurs in the network during FAX communication and the packet reception interval fluctuates, it becomes possible to continuously reproduce without destroying the signal necessary for FAX communication, and it is difficult for procedure errors and retransmission of image signals to occur. .
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating a voice / fax communication system according to an embodiment of the present invention.
FIG. 2 is a format diagram of a voice / FAX packet stored in a transmission / reception buffer of the voice packet communication device according to the present embodiment.
FIG. 3 is a schematic diagram showing the configuration and operation of a fluctuation absorbing buffer in the present embodiment.
FIG. 4 is a flowchart showing voice / FAX signal transmission control in the present embodiment.
FIG. 5 is a flowchart showing packet analysis of voice / fax signal reception control in the present embodiment.
FIG. 6 is a flowchart showing fluctuation absorption buffer amount variation control in the present embodiment.
FIG. 7 is a flowchart showing voice / fax packet reproduction control in the present embodiment.
[Explanation of symbols]
1, 2 Voice packet communication equipment
3 trunk lines
41, 42 Telephone / FAX terminal
101, 201 PCM codec controller
111,211 encoder
112,212 decoder
121,221 packet generator
122,222 packet analyzer
123, 223 Fluctuation absorption buffer
131, 231 Transmission buffer
132,232 receive buffer
133,233 Data bus
141,241 Relay Unit (WAN)
Claims (7)
音声信号またはFAX信号を符号化するとともに符号化データが無音であるか否かを識別する符号化手段と、前記符号化データが無音である時に当該符号化データに無音フラグを設定して前記パケット通信網へ送信するパケットを生成するパケット生成手段と、を有する送信装置と、
前記パケット通信網から受信したパケットの遅延変動を吸収する揺らぎ吸収バッファと、音声通信からFAX通信に切り替わった後に、前記無音フラグが設定された符号化データの無音区間で、前記揺らぎ吸収バッファの蓄積量を音声通信用基準からFAX通信用基準に変更し、前記符号化データの復号化周期ごとに前記揺らぎ吸収バッファ蓄積量を前記無音区間を利用して所定量ずつ増加させるバッファ量制御手段と、を有する受信装置と、
を含むことを特徴とする音声/FAX通信システム。In a voice / fax communication system that transmits voice / fax signals via a packet communication network,
An encoding means for encoding an audio signal or a FAX signal and identifying whether the encoded data is silent; and when the encoded data is silent, a silence flag is set in the encoded data and the packet A packet generation means for generating a packet to be transmitted to the communication network,
A fluctuation absorbing buffer that absorbs delay variation of packets received from the packet communication network, and accumulation of the fluctuation absorbing buffer in a silent section of encoded data in which the silence flag is set after switching from voice communication to FAX communication A buffer amount control means for changing the amount from a voice communication reference to a FAX communication reference, and increasing the fluctuation absorption buffer storage amount by a predetermined amount using the silent period for each decoding cycle of the encoded data ; A receiving device comprising:
A voice / fax communication system comprising:
前記パケット通信網から受信したパケットの遅延変動を吸収するための揺らぎ吸収バッファと、
音声通信からFAX通信に切り替わった後に、受信パケットの符号化データが無音の区間で、前記揺らぎ吸収バッファの蓄積量を音声通信用基準からFAX通信用基準に変更し、前記符号化データの復号化周期ごとに前記揺らぎ吸収バッファ蓄積量を前記無音区間を利用して所定量ずつ増加させるバッファ量制御手段と、
を有することを特徴とする音声/FAX受信装置。In a voice / fax receiving apparatus that receives a packet including encoded data in which voice / silence is distinguished via a packet communication network,
A fluctuation absorbing buffer for absorbing delay variation of the packet received from the packet communication network;
After the voice communication is switched to the FAX communication, the amount of fluctuation stored in the fluctuation absorbing buffer is changed from the voice communication reference to the FAX communication reference when the encoded data of the received packet is silent, and the encoded data is decoded. A buffer amount control means for increasing the fluctuation absorbing buffer accumulation amount by a predetermined amount using the silent section for each period ;
A voice / fax receiving apparatus comprising:
受信パケットの符号化データの無音/有音を判定し、
音声通信からFAX通信に切り替わった後に、受信パケットの符号化データが無音の区間で、前記揺らぎ吸収バッファの蓄積量を音声通信用基準からFAX通信用基準に変更し、前記符号化データの復号化周期ごとに前記揺らぎ吸収バッファ蓄積量を前記無音区間を利用して所定量ずつ増加させる、
ことを特徴とする揺らぎ吸収バッファ量制御方法。In a buffer amount control method of a fluctuation absorbing buffer provided in a voice / FAX receiving apparatus that receives a packet including encoded data in which voiced / silent is distinguished via a packet communication network,
Determine the silence / sound of the encoded data of the received packet,
After the voice communication is switched to the FAX communication, the amount of fluctuation stored in the fluctuation absorbing buffer is changed from the voice communication reference to the FAX communication reference when the encoded data of the received packet is silent, and the encoded data is decoded. Increasing the fluctuation absorption buffer accumulation amount by a predetermined amount using the silent period for each period ,
A fluctuation absorbing buffer amount control method characterized by the above.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003164573A JP4454255B2 (en) | 2003-06-10 | 2003-06-10 | Voice / fax communication system, voice / fax receiver, and fluctuation absorbing buffer amount control method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003164573A JP4454255B2 (en) | 2003-06-10 | 2003-06-10 | Voice / fax communication system, voice / fax receiver, and fluctuation absorbing buffer amount control method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005005825A JP2005005825A (en) | 2005-01-06 |
JP4454255B2 true JP4454255B2 (en) | 2010-04-21 |
Family
ID=34091306
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003164573A Expired - Fee Related JP4454255B2 (en) | 2003-06-10 | 2003-06-10 | Voice / fax communication system, voice / fax receiver, and fluctuation absorbing buffer amount control method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4454255B2 (en) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007288342A (en) * | 2006-04-13 | 2007-11-01 | Nec Corp | Media stream relay device and method |
CN101155095B (en) * | 2006-09-29 | 2010-09-08 | 华为技术有限公司 | Method, system and gateway for negotiation of data signal detector ability |
JP4892399B2 (en) * | 2007-04-23 | 2012-03-07 | 株式会社富士通エフサス | Modem communication stabilization system and modem communication stabilization method |
JP2016158133A (en) * | 2015-02-25 | 2016-09-01 | 沖電気工業株式会社 | Communication device, delay recovery method and delay recovery program |
CN110570881B (en) * | 2019-08-05 | 2022-07-22 | 深圳震有科技股份有限公司 | Method, apparatus, device and medium for switching back to voice mode in facsimile transparent transmission mode |
-
2003
- 2003-06-10 JP JP2003164573A patent/JP4454255B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005005825A (en) | 2005-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1423930B1 (en) | Method and apparatus for reducing synchronization delay in packet-based voice terminals by resynchronizing during talk spurts | |
US7433822B2 (en) | Method and apparatus for encoding and decoding pause information | |
JP4367657B2 (en) | Voice communication method and apparatus | |
US7450601B2 (en) | Method and communication apparatus for controlling a jitter buffer | |
US20020026310A1 (en) | Real-time information receiving apparatus | |
JP2006238445A (en) | Method and apparatus for handling network jitter in voice-over ip communication network using virtual jitter buffer and time scale modification | |
JP4842075B2 (en) | Audio transmission device | |
US20070263672A1 (en) | Adaptive jitter management control in decoder | |
US20080117906A1 (en) | Payload header compression in an rtp session | |
CA2584818A1 (en) | Method and apparatus for managing end-to-end voice over internet protocol media latency | |
JP3891755B2 (en) | Packet receiver | |
TW200917764A (en) | System and method for providing AMR-WB DTX synchronization | |
US20030046711A1 (en) | Formatting a file for encoded frames and the formatter | |
US7110416B2 (en) | Method and apparatus for reducing synchronization delay in packet-based voice terminals | |
JP4454255B2 (en) | Voice / fax communication system, voice / fax receiver, and fluctuation absorbing buffer amount control method | |
JPH11215182A (en) | Method and device for transmitting and receiving voice packet | |
JP4050961B2 (en) | Packet-type voice communication terminal | |
US7170855B1 (en) | Devices, softwares and methods for selectively discarding indicated ones of voice data packets received in a jitter buffer | |
JP3977784B2 (en) | Real-time packet processing apparatus and method | |
JP2001308919A (en) | Communication unit | |
JPH04357735A (en) | Voice packet communication equipment | |
JP3669660B2 (en) | Call system | |
JP4667811B2 (en) | Voice communication apparatus and voice communication method | |
JP2002185498A (en) | Processing method for reproduction queue of voice packet, and absorbing apparatus of transmission-delay fluctuation in voice packet | |
JP3813046B2 (en) | Packet receiver |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060516 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20070309 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080508 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081216 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090216 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090610 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090907 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20090918 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091021 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091119 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100119 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100202 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130212 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4454255 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130212 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140212 Year of fee payment: 4 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |