JP6123315B2 - 音声受信再生装置 - Google Patents

音声受信再生装置 Download PDF

Info

Publication number
JP6123315B2
JP6123315B2 JP2013018158A JP2013018158A JP6123315B2 JP 6123315 B2 JP6123315 B2 JP 6123315B2 JP 2013018158 A JP2013018158 A JP 2013018158A JP 2013018158 A JP2013018158 A JP 2013018158A JP 6123315 B2 JP6123315 B2 JP 6123315B2
Authority
JP
Japan
Prior art keywords
audio data
unit
audio
underflow
buffer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013018158A
Other languages
English (en)
Other versions
JP2014150413A (ja
Inventor
平野 正樹
正樹 平野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2013018158A priority Critical patent/JP6123315B2/ja
Publication of JP2014150413A publication Critical patent/JP2014150413A/ja
Application granted granted Critical
Publication of JP6123315B2 publication Critical patent/JP6123315B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、音声パケットを受信して音声再生する音声受信再生装置に関する。
VoIP(Voice over Internet Protocol)等の音声パケット通信を行なう通信装置の多くは、通信ネットワークの輻輳等によって生じる伝送遅延時間の揺らぎを吸収するために音声パケットに含まれる音声データを一時的に蓄積するジッタバッファを備えている。ジッタバッファは、到来したパケットを蓄積しつつ蓄積済みの音声データを順次出力するのであるが、音声パケットの到来が大幅に遅れた場合には出力すべき音声データが無くなる。このようないわゆるアンダーフロー状態になると、音声再生が途切れてしまうという問題がある。かかる問題を解決するための技術として、例えば特許文献1には、バッファ内に蓄積されている音声データが少なくなった場合に無音を繰り返し再生する音声補間機能を有する揺らぎ吸収バッファ装置が開示されている。
特開2007−235221号公報
しかしながら、特許文献1に開示されている装置においては、アンダーフロー状態になる直前にのみ音声補間処理を行なうので、例えば音声パケットストリームの受信中にパケット伝送路の切替えや輻輳が生じたことによってパケット遅延やパケットロスが発生した場合には、補間音が連続する区間が増加して違和感のある再生音となってしまうという問題があった。
本発明は上記した如き問題点に鑑みてなされたものであって、音声パケットストリーム受信中にパケット遅延やパケットロスが発生した場合にも違和感の無い音声再生を可能とする音声受信再生装置を提供することを目的とする。
本発明による音声受信再生装置は、通信網を介して順次到来する音声パケットのストリームを受信するパケット受信部と、前記音声パケットに含まれる音声データ片を順次蓄積してバッファ内音声データとして保持するジッタバッファと、前記バッファ内音声データに含まれる音声データ片を読出間隔毎に順次読み出す音声データ読出部と、前記音声データ読出部によって読み出された音声データ片に基づいて音声再生する音声再生部とを含む音声受信再生装置であって、前記バッファ内音声データの蓄積量に応じて、前記バッファ内音声データに含まれる無音部分の長さを長くする無音長調整手段、前記バッファ内音声データによって示される音声波形内の同一波長継続箇所に相当する部分に補間音声データを挿入する類似音補間手段、前記読出間隔の長さを変更する読出間隔変更指令を前記音声データ読出部に与える読出間隔変更手段、及び前記バッファ内音声データに対して間欠的に現れる無音部を形成する音声調整手段のうちの1つを選択して当該選択した1の手段によって前記バッファ内音声データの蓄積量を調整するアンダーフロー回避部を含むことを特徴とする。
本発明による音声受信再生装置によれば、音声パケットストリーム受信中にパケット遅延やパケットロスが発生した場合にも違和感の無い音声再生が可能となる。
本発明の実施例である音声受信再生装置の構成を示すブロック図である。 図1の設定部によるアンダーフロー回避用設定処理を示すフローチャートである。 図1の回避手段選択部によるバッファ内音声データ蓄積量判別処理を示すフローチャートである。 図1の回避手段選択部による回避手段選択処理を示すフローチャートである。 図1の無音長調整部による第1アンダーフロー回避処理を示すフローチャートである。 図1の類似音補間部による第2アンダーフロー回避処理を示すフローチャートである。 図1の読出間隔変更部による第3アンダーフロー回避処理を示すフローチャートである。 図1の音声調整部による第4アンダーフロー回避処理を示すフローチャートである。 アンダーフロー回避処理前後の再生音声波形のタイムチャートである。 図3のパケット読出判定処理の変形例を示すフローチャートである。
以下、本発明に係る実施例について添付の図面を参照しつつ詳細に説明する。
図1には、本発明の実施例である音声受信再生装置10の構成が示されている。
パケット受信部11は、インターネット等の通信網30を介して音声パケットストリームを受信する。すなわち、パケット受信部11は、不定期的に到来する音声パケットを順次受信する。
ジッタバッファ12は、パケット受信部11によって順次受信された音声パケットに含まれる音声データ片を順次蓄積してバッファ内音声データとして保持する。
音声データ読出部13は、バッファ内音声データに含まれる音声データ片を一定の読出間隔で読み出す。この際、音声データ読出部13は、古い順すなわちジッタバッファ12に蓄積された順に音声データ片を読み出す。なお、読出間隔は、後述の読出間隔変更部24からの読出間隔変更指令に応じて変更され得る。
音声再生部14は、音声データ読出部13によって読み出された音声データに基づいて音声再生する。
アンダーフロー回避部20は、ジッタバッファ12のアンダーフローを回避するための処理を行なう。アンダーフロー回避部20は、音声データ読出部13によって音声データが読み出される度にアンダーフロー回避処理を行なう。
回避手段選択部21は、音声データ読出部13による音声データ読出し後のバッファ内音声データの蓄積量を判別し、当該蓄積量と所定閾値との比較に基づいて複数のアンダーフロー回避手段のうちの1つを選択する。以下、アンダーフロー回避手段が第1から第4までの4つ存在する場合について説明する。なお、アンダーフロー回避手段の選択の詳細については後述する(図3)。
無音長調整部22は、第1アンダーフロー回避手段が選択された場合に、バッファ内音声データから無音部分を検出し、当該検出した無音部分の直後に無音データを挿入して無音部の長さを長くする。
類似音補間部23は、第2アンダーフロー回避手段が選択された場合に、バッファ内音声データによって示される音声波形から同一波長が所定時間以上継続する箇所を検出して、当該箇所に相当する部分に補間音声データを挿入する。
読出間隔変更部24は、第3アンダーフロー回避手段が選択された場合に、音声データ読出部13によるバッファ内音声データに含まれる音声データ片の読出間隔を変更する読出間隔変更指令を音声データ読出部13に与える。
音声調整部25は、第4アンダーフロー回避手段が選択された場合に、バッファ内音声データに対して例えば一定間隔毎など間欠的に無音データを挿入する。すなわち、バッファ内音声データ中に無音部が間欠的に現れるようにする。
設定部26は、アンダーフロー回避処理に先立って、回避手段選択部21による比較処理のための閾値、及び/又は無音データや補間音声データの挿入/補間間隔を設定する。
以下、図2を参照しつつ、設定部26による設定処理について説明する。閾値及び/又は音声データ挿入/補間間隔については、自動変動設定及び事前固定設定のいずれかを選択できる。設定部26は、自動変動設定が選択されている場合にはパケット受信部11によってパケットが受信される度に当該設定処理を行い、事前固定設定が選択されている場合には例えば音声受信再生装置10の起動直後などの所定時点において当該設定処理を行なう。
設定部26は、パケットが受信されたときに自動設定を行なう(ステップS11)。詳細には、閾値を自動設定にした場合における閾値の算出処理や、無音データの挿入間隔を自動設定にした場合における挿入間隔算出処理が行なわれる。なお、受信パケットは、ジッタバッファ12内に順次蓄積される。
以下、図3を参照しつつ、回避手段選択部21によるバッファ内音声データの蓄積量判別処理について説明する。回避手段選択部21は、音声データ読出部13によってジッタバッファ12から音声データが読み出される度に当該処理ルーチンを実行する。
先ず、回避手段選択部21は、蓄積量Xが第1閾値T1よりも大きいか否かを判別する(ステップS21)。回避手段選択部21は、蓄積量Xが第1閾値T1よりも大きいと判別した場合には、バッファ内音声データの中から最も古い音声データを読み出すことを音声データ読出部13に指示する(ステップS22)。音声データ読出部13は、当該指示に応じてジッタバッファ12から最も古い音声データを読み出す。すなわち、アンダーフロー回避処理を行なわず、通常のパケット読み出しを行なう。
回避手段選択部21は、蓄積量Xが第1閾値T1以下であると判別した場合には、更に、蓄積量Xが”0”より大きいか否かを判別する(ステップS21及びS23)。回避手段選択部21は、蓄積量Xが”0”より大きく且つ第1閾値T1以下であると判別した場合には、アンダーフロー回避手段選択処理に移行する(ステップS24)。当該選択処理の詳細については後述する(図4)。選択したアンダーフロー回避手段によるアンダーフロー回避処理を行なった後、ステップS22に進む。
回避手段選択部21は、蓄積量Xが”0”であると判別した場合すなわちジッタバッファ12が空であると判別した場合には(ステップS25)、ジッタバッファ12にアンダーフローが生じていると判定し、音声再生部14に対して無音の再生を指示する(ステップS26)。すなわち、音声再生部14に対して強制的に無音再生させつつ、その間にジッタバッファ12に音声パケットが蓄積されることにより、アンダーフロー状態から回復させる。
以下、図4を参照しつつ、回避手段選択部21によるアンダーフロー回避手段の選択処理について説明する。回避手段選択部21は、図3のステップS24に進んだ場合に当該選択処理を実行する。
先ず、回避手段選択部21は、蓄積量Xが第1閾値T1以下であり且つ第2閾値T2よりも大きいと判別した場合、第1アンダーフロー回避手段を選択する(ステップS31及びS32)。第1〜第4閾値T1〜T4には、T4≦T3≦T2≦T1の大小関係がある。
回避手段選択部21は、蓄積量Xが第2閾値T2以下であり且つ第3閾値T3よりも大きいと判別した場合、第2アンダーフロー回避手段を選択する(ステップS33及びS34)。
回避手段選択部21は、蓄積量Xが第3閾値T3以下であり且つ第4閾値T4よりも大きいと判別した場合、第3アンダーフロー回避手段を選択する(ステップS35及びS36)。
回避手段選択部21は、蓄積量Xが第4閾値T4以下であり且つ0よりも大きいと判別した場合、第4アンダーフロー回避手段を選択する(ステップS37及びS38)。
上記選択処理により、ジッタバッファ12の蓄積量Xが少なくなるにつれて、第1、第2、第3、第4の順に選択対象が変化する。
なお、第1〜第4閾値T1〜T4の設定によって、第1〜第4アンダーフロー回避手段のうちの少なくとも1つを無効とすることもできる。例えばT3=T2とする閾値設定をした場合、ステップS33において蓄積量XがT3よりも大きく且つT2以下であるという判別結果とはなり得ないので、ステップS34に進むことはなくなる。すなわち、第2アンダーフロー回避手段は選択されなくなる。同様に、T2=T1とした場合には第1アンダーフロー回避手段が無効となり、T4=T3とした場合には第3アンダーフロー回避手段が無効となり、0=T4とした場合には第4アンダーフロー回避手段が無効となる。このように、第1〜第4閾値T1〜T4の設定によって、特定のアンダーフロー回避手段の有効/無効を切り替えることができる。
以下、図5を参照しつつ、無音長調整部22による第1アンダーフロー回避処理について説明する。無音長調整部22は、回避手段選択部21によって第1アンダーフロー回避手段が選択されたときに当該ルーチンを実行する。
先ず、無音長調整部22は、バッファ内音声データから無音部分を検出する(ステップS41)。次に、無音長調整部22は、検出した無音部分の直後に無音データを挿入する(ステップS42)。当該挿入によってバッファ内音声データの量が増加する。
当該回避処理においては、無音長調整部22は音量レベルの大小判定のみによって無音部分を検出できるので、処理負荷が小さいという利点がある。また、挿入される音声データは無音なので、再生音声にノイズが乗ることもない。また、バッファ内音声データの量が少なくなると無音部分が存在する確率が減少するところ、当該回避処理はバッファ内音声データに無音部分が存在する場合に限って実行できるので、バッファ内音声データの量が多いときに当該回避処理を実行することが好ましい。かかる利点を考慮して、最初に選択される回避手段とした。バッファ内音声データに無音部分が存在しない場合には、第1アンダーフロー回避手段による回避処理は行なわれず、その結果、ジッタバッファ12内の蓄積量が減少する。この場合、第2アンダーフロー回避手段による回避処理に移行することとなる。
なお、無音長調整部22は、上記ステップS41に相当する無音部分検出処理を、パケット受信部11によって音声パケットが受信されたときに行うこともできる。すなわち、無音長調整部22は、音声パケットが受信される度に、当該受信音声パケットに含まれる音声データ片が有音であるか無音であるかを判別し、無音の音声データ片を示す情報(以下、マーキング情報と称する)を保持しておく。そして、無音長調整部22は、音声データ読出部13によって音声データ片が読み出されるときに、ステップS42の無音データ挿入処理を行なう。すなわち、無音長調整部22は、保持してあるマーキング情報によって示される無音音声データ片の直後に無音データを挿入する。このように、無音部分検出処理を音声データ蓄積時に行い、ステップS42の無音データ挿入処理を音声データ読み出し時に行なうことによって処理負荷が分散され、読み出し時に処理負荷が集中することを防止することができる。
以下、図6を参照しつつ、類似音補間部23による第2アンダーフロー回避処理について説明する。類似音補間部23は、回避手段選択部21によって第2アンダーフロー回避手段が選択されたときに当該ルーチンを実行する。
先ず、類似音補間部23は、バッファ内音声データによって示される音声波形を判別する(ステップS51)。次に、類似音補間部23は、音声波形から同一波長が所定時間以上継続する箇所を検出して(ステップS52)、当該箇所に補間音声データを挿入する(ステップS53)。この際、類似音補間部23は、当該箇所の前後の音声に類似する音声を表す音声データを生成してこれを補間音声データとする。当該挿入によってバッファ内音声データの量が増加する。類似音補間部23は、音声波形から同一波長が所定時間以上継続する箇所を検出できない場合には、当該処理ルーチンを終了する(ステップS52)。
当該回避処理においては、補間音声として同一波長継続箇所の前後の音声に類似する音声を生成し挿入するので、通話時の違和感がないという利点がある。例えば、一般的に母音発音部には同一波長が比較的長い時間継続する箇所が見られる。日本語においては他言語に比較して母音の割合が多いとされているので、当該回避処理が有効である。また、バッファ内音声データの量が少なくなると同一波長継続箇所が存在する確率が減少するところ、当該回避処理はバッファ内音声データに同一波長継続箇所が存在する場合に限って実行できるので、バッファ内音声データの量が多いときに当該回避処理を実行することが好ましい。当該回避処理は、第1アンダーフロー回避手段による回避処理に比較して処理負荷が大きいので、2番目に選択される回避手段とした。
なお、類似音補間部23は、上記ステップS51及びS52に相当する同一波長継続箇所検出処理を、パケット受信部11によって音声パケットが受信されたときに、行うこともできる。すなわち、類似音補間部23は、音声パケットが受信される度に、当該受信音声パケットに含まれる音声データ片の波長が直前の音声データ片の波長と同一であるか否かを判別し、同一波長である音声データ片群の箇所を示す情報(以下、マーキング情報と称する)を保持しておく。そして、類似音補間部23は、音声データ読出部13によって音声データ片が読み出されるときに、ステップS53の補間音声データ挿入処理を行なう。すなわち、類似音補間部23は、保持してあるマーキング情報によって示される箇所に補間音声データを挿入する。このように、ステップS51及びS52の処理を音声データ蓄積時に行い、ステップS53の処理を音声データ読み出し時に行なうことによって処理負荷が分散され、読み出し時に処理負荷が集中することを防止することができる。
以下、図7を参照しつつ、読出間隔変更部24による第3アンダーフロー回避処理について説明する。読出間隔変更部24は、回避手段選択部21によって第3アンダーフロー回避手段が選択されたときに当該ルーチンを実行する。
読出間隔変更部24は、音声データ読出部13によるバッファ内音声データ読み出しの間隔を広げるための読出間隔変更指令を音声データ読出部13に与える(ステップS61)。音声データ読出部13は、当該指令に応じてジッタバッファ12からの音声データ読出間隔を広げるので、読み出しによるバッファ内音声データの減少速度が緩やかになる。これにより、音声再生速度が遅くなるが、ユーザーが速度変化に気付かない程度の拡張量とすることが望ましい。例えば、読出間隔変更部24は、音声再生速度が数%だけ遅くなるように読出間隔を拡張する。
当該回避処理においては、読出間隔の拡張により再生速度を遅くするが、音声データの挿入を行なわないので、再生音声にノイズが乗らないという利点がある。また、対向側パケット送信装置(図示せず)のクロック周期ズレによってパケット送信間隔が長くなった場合においても、当該回避処理によってバッファ内音声データの減少速度を遅くすることにより、アンダーフローの発生を回避できるという利点もある。当該回避処理を行なっているにもかかわらずバッファ内音声データが減少するということは、バッファ内音声データの蓄積量が急減していることを意味しており、音声再生速度の変化に気付かない程度に読出間隔を拡張する当該処理では対応しきれない。そこで、バッファ内音声データが所定閾値以下となった場合には第4アンダーフロー回避処理を実行する。
以下、図8を参照しつつ、音声調整部25による第4アンダーフロー回避処理について説明する。音声調整部25は、回避手段選択部21によって第4アンダーフロー回避手段が選択されたときに当該ルーチンを実行する。
音声調整部25は、バッファ内音声データに対して所定時間間隔毎に無音データを挿入する(ステップS71)。すなわち、バッファ内音声データに対して複数の無音データが挿入される。1つの無音データの時間は数ミリ秒程度とすることが望ましい。当該挿入によってバッファ内音声データの量が増加する。
当該回避処理においては、所定時間間隔毎に無音データを強制的に挿入するので、バッファ内音声データの音声内容を判別する必要がなく、処理負荷が非常に軽いという利点がある。無音データの挿入箇所によってはトリガノイズが生じ得るので、当該回避処理を第4の回避処理すなわち最後に選択される回避処理とした。無音データの音圧レベルは、0レベルのほか、挿入箇所直前の音圧レベルと同一レベル、又は、挿入箇所前後の音圧レベルの中間レベルとすることができる。また、無音データの代わりに、挿入箇所前後の音声から補間音を生成してこれを挿入することもできる。この場合、処理負荷が比較的大きくなるが、より不自然さの少ない再生音声が得られる。
以下、図9を参照しつつ、アンダーフロー回避処理の効果について説明する。
図9(A)は、回避処理実行前の再生音声波形である。区間a1では、音声データ波形が途切れている。すなわち、ジッタバッファ12内に音声データが無くなり、アンダーフローが生じている。
図9(B)は、第1アンダーフロー回避処理実行後の再生音声波形である。無音を示す波形の直後に補間無音波形b1及びb2が続いている。これは、バッファ内音声データから検出された無音部分の直後に無音データを挿入したことによる。図9(A)の区間a1に相当する部分にも音声データ波形が存在している。これは、無音データの挿入によってジッタバッファ12内のデータ蓄積量が増加して、アンダーフローを回避できていることを示している。
図9(C)は、第2アンダーフロー回避処理実行後の再生音声波形である。同一波長が一定時間継続している箇所に補間音声波形c1、c2及びc3が存在している。これは、バッファ内音声データから検出された同一波長継続箇所に補間音声データを挿入したことによる。図9(A)の区間a1に相当する部分にも音声データ波形が存在しており、アンダーフローを回避できている。また、当該箇所の前後の音声に類似する音声を表す補間音声データを生成して挿入しているので、連続的な波形となっている。それ故、不連続波形によるノイズも生じない。
図9(D)は、第3アンダーフロー回避処理実行後の再生音声波形である。再生音声波形が全体的に引き伸ばされている。これは、音声データの内容にかかわらず、読み出し間隔を広げて再生速度を遅くしたことによる。図9(A)の区間a1に相当する部分にも音声データ波形が存在しており、アンダーフローを回避できている。波形が引き伸ばされているが、不連続波形となっておらず、ノイズも生じない。
図9(E)は、第4アンダーフロー回避処理において、挿入箇所直前の音圧レベルと同一レベルの音声を表す補間音声データを挿入した場合の再生音声波形である。一定時間間隔TPで補間音声波形e1〜e5が存在している。これは、バッファ内音声データの音声内容にかかわらず、無音データを一定時間間隔TPで挿入したことによる。図9(A)の区間a1に相当する部分にも音声データ波形が存在しており、アンダーフローを回避できている。無音データを強制的に挿入するので、ジッタバッファ12の蓄積量が確実に増加する。
図9(F)は、第4アンダーフロー回避処理において、0レベルの音声を表す補間音声データを挿入した場合の再生音声波形である。一定時間間隔TPで補間音声波形f1〜f5が存在している。補間音声波形f1〜f5の各々の音圧レベルは”0”である。この場合にも同様にアンダーフローを回避できている。挿入箇所直前の音圧レベルを判別しないので、処理負荷が小さいという利点がある。
上記したように、本実施例の音声受信再生装置10においては、ジッタバッファ12内のバッファ内音声データの蓄積量に応じて、処理内容の異なる複数のアンダーフロー回避処理の1つを選択して実行する。換言すれば、アンダーフロー回避部20は、バッファ内音声データの蓄積量に応じて複数のアンダーフロー回避処理を段階的に切り替える。蓄積量に比較的余裕がある場合には、ノイズが生じ難く且つ処理負荷の軽い回避処理を行ない、蓄積量が少なくなったときには、確実にアンダーフローを回避できる回避処理に移行する。
本発明においては、蓄積量に余裕がある状態から回避処理を行なうので、バッファ内音声データの蓄積量が少なくなり難く、アンダーフローが生じ難くなる。しかも、蓄積量に余裕がある状態においては、ノイズが生じ難く且つ処理負荷の軽い回避処理を行なうので、音声品質低下及びリソース圧迫の問題も生じない。一方、蓄積量が少なくなったときには無音データを強制的に挿入して蓄積量を増加させるので、確実にアンダーフローを回避できる。
上記実施例は、アンダーフロー回避手段が4つの場合の例であるがこれに限られない。処理内容の異なるアンダーフロー回避手段が2つ以上であれば良い。また、上記実施例は、蓄積量が減少するに従って第1、第2、第3、第4の順に回避処理を実行する場合の例であるが、これに限られない。例えば、第1の回避手段と第2の回避手段とを入れ替えるなど任意の順番で実行できる。
<変形例>
以下、図10を参照しつつ、図3のパケット読出判定処理の変形例について説明する。回避手段選択部21は、音声データ読出部13によってジッタバッファ12から音声データが読み出される度に当該処理ルーチンを実行する。
先ず、回避手段選択部21は、蓄積量Xが第1閾値T1よりも大きいか否かを判別する(ステップS81)。回避手段選択部21は、蓄積量Xが第1閾値T1よりも大きいと判別した場合には、バッファ内音声データの中から最も古い音声データを読み出すことを音声データ読出部13に指示する(ステップS82)。音声データ読出部13は、当該指示に応じてジッタバッファ12から最も古い音声データを読み出す。すなわち、アンダーフロー回避処理を行なわず、通常のパケット読み出しを行なう。
回避手段選択部21は、蓄積量Xが第1閾値T1以下であると判別した場合には、更に、蓄積量Xが”1”より大きいか否かを判別する(ステップS81及びS83)。”1”は、音声データ読出部13による1回分の所定読み出しデータ量である。回避手段選択部21は、蓄積量Xが”1”より大きく且つ第1閾値T1以下であると判別した場合には、アンダーフロー回避手段選択処理に移行する(ステップS84)。当該選択処理は上記実施例と同様である。選択したアンダーフロー回避手段によるアンダーフロー回避処理を行なった後、ステップS82に進む。
回避手段選択部21は、蓄積量Xが”1”であると判別した場合すなわちジッタバッファ12に1回分の読み出しデータ量しか蓄積されていないと判別した場合には(ステップS85)、アンダーフロー回避処理を実行する。ここでの回避処理は、図6又は図8に示される無音補間処理である。
上記したように変形例の音声受信再生装置10においては、アンダーフロー状態に陥る前に無音補間によるアンダーフロー回避処理を実行して、バッファ内音声データの蓄積量を増加させる。かかる動作により、アンダーフローの発生を確実に回避することができる。なお、音声受信再生装置10の構成及びパケット読出判定処理以外の処理は上記実施例と同様である。
上記実施例は、バッファ内音声データの蓄積量が1回分の読み出しデータ量に相当する場合にアンダーフロー回避処理を実行する場合の例であるがこれに限られない。アンダーフロー回避処理は、バッファ内音声データの蓄積量が読み出しデータ量の例えば2回分など任意の読み出し回数分に相当する場合に実行することができる。
10 音声受信再生装置
11 パケット受信部
12 ジッタバッファ
13 音声データ読出部
14 音声再生部
20 アンダーフロー回避部
21 回避手段選択部
22 無音長調整部
23 類似音補間部
24 読出間隔変更部
25 音声調整部
26 設定部
30 通信網

Claims (6)

  1. 通信網を介して順次到来する音声パケットのストリームを受信するパケット受信部と、前記音声パケットに含まれる音声データ片を順次蓄積してバッファ内音声データとして保持するジッタバッファと、前記バッファ内音声データに含まれる音声データ片を読出間隔毎に順次読み出す音声データ読出部と、前記音声データ読出部によって読み出された音声データ片に基づいて音声再生する音声再生部とを含む音声受信再生装置であって、
    前記バッファ内音声データの蓄積量に応じて、前記バッファ内音声データに含まれる無音部分の長さを長くする無音長調整手段、前記バッファ内音声データによって示される音声波形内の同一波長継続箇所に相当する部分に補間音声データを挿入する類似音補間手段、前記読出間隔の長さを変更する読出間隔変更指令を前記音声データ読出部に与える読出間隔変更手段、及び前記バッファ内音声データに対して間欠的に現れる無音部を形成する音声調整手段のうちの1つを選択して当該選択した1の手段によって前記バッファ内音声データの蓄積量を調整するアンダーフロー回避部を含むことを特徴とする音声受信再生装置。
  2. 前記アンダーフロー回避部は、前記バッファ内音声データの蓄積量が第1閾値以下であり且つ第2閾値よりも大きい場合に前記無音長調整手段を選択し、
    前記バッファ内音声データの蓄積量が前記第2閾値以下であり且つ第3閾値よりも大きい場合に前記類似音補間手段を選択し、
    前記バッファ内音声データの蓄積量が前記第3閾値以下であり且つ第4閾値よりも大きい場合に前記読出間隔変更手段を選択し、
    前記バッファ内音声データの蓄積量が前記第4閾値以下であり且つ0よりも大きい場合に前記音声調整手段を選択することを特徴とする請求項1に記載の音声受信再生装置。
  3. 前記アンダーフロー回避部は、前記音声データ読出部による前記音声データ片の読み出しがなされる度に前記手段の選択を行なうことを特徴とする請求項1又は2に記載の音声受信再生装置。
  4. 前記読出間隔変更手段が選択された場合、前記音声データ読出部は、前記読出間隔変更指令に応じて変更した読出間隔毎に前記音声データ片を読み出すことを特徴とする請求項1又は2に記載の音声受信再生装置。
  5. 前記アンダーフロー回避部は、前記ジッタバッファに前記バッファ内音声データが保持されていないと判別した場合には前記音声再生部に対して無音再生指令を発し、
    前記音声再生部は、前記無音再生指令に応じて無音再生をすることを特徴とする請求項1又は2に記載の音声受信再生装置。
  6. 前記アンダーフロー回避部は、前記バッファ内音声データの蓄積量が前記音声データ読出部による1回分の読み出し量に相当すると判別した場合に、前記無音調整手段、前記類似音補間手段、前記読出間隔変更手段、及び前記音声調整手段のうちの1つを選択することを特徴とする請求項1又は2に記載の音声受信再生装置。
JP2013018158A 2013-02-01 2013-02-01 音声受信再生装置 Active JP6123315B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013018158A JP6123315B2 (ja) 2013-02-01 2013-02-01 音声受信再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013018158A JP6123315B2 (ja) 2013-02-01 2013-02-01 音声受信再生装置

Publications (2)

Publication Number Publication Date
JP2014150413A JP2014150413A (ja) 2014-08-21
JP6123315B2 true JP6123315B2 (ja) 2017-05-10

Family

ID=51573066

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013018158A Active JP6123315B2 (ja) 2013-02-01 2013-02-01 音声受信再生装置

Country Status (1)

Country Link
JP (1) JP6123315B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016119588A (ja) * 2014-12-22 2016-06-30 アイシン・エィ・ダブリュ株式会社 音声情報修正システム、音声情報修正方法、及び音声情報修正プログラム
KR102050911B1 (ko) * 2018-08-20 2019-12-02 주식회사 썬즈 양방향 음성 송수신 시스템의 음성 출력 지연 제거방법

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004264497A (ja) * 2003-02-28 2004-09-24 Mitsubishi Electric Corp 音声復号装置
JP4146489B2 (ja) * 2004-05-26 2008-09-10 日本電信電話株式会社 音声パケット再生方法、音声パケット再生装置、音声パケット再生プログラム、記録媒体
JP4699947B2 (ja) * 2006-06-26 2011-06-15 Kddi株式会社 通信端末装置

Also Published As

Publication number Publication date
JP2014150413A (ja) 2014-08-21

Similar Documents

Publication Publication Date Title
JP4146489B2 (ja) 音声パケット再生方法、音声パケット再生装置、音声パケット再生プログラム、記録媒体
KR100964437B1 (ko) V o I P 용 적응성 디-지터 버퍼
KR101953613B1 (ko) 지터 버퍼 제어부, 오디오 디코더, 방법 및 컴퓨터 프로그램
KR101952192B1 (ko) 품질 제어를 이용하는 오디오 디코더, 방법 및 컴퓨터 프로그램
WO2009039783A1 (fr) Procédé et dispositif de traitement pour caractère de temps de retard de réseau
CN105119755B (zh) 一种抖动缓冲区调整方法及装置
JP6123315B2 (ja) 音声受信再生装置
KR20140067512A (ko) 신호 처리 장치 및 그 신호 처리 방법
CN101379556B (zh) 控制音频信号的时间缩放
CN103856415B (zh) 网络接收缓冲器缓冲大小确定设备和方法及网络会话系统
EP1826959B1 (en) Apparatus for absorbing fluctuations in the packet transmission rate of a communications network
TWI521985B (zh) 無線通訊系統以及在無線通訊系統中調整緩衝單元之使用深度的方法
JP6071944B2 (ja) 話者速度変換システムおよびその方法ならびに速度変換装置
JP4561301B2 (ja) 音声の再生及び停止を制御する音声再生装置及びプログラム
JP4580297B2 (ja) 音声再生装置、音声録音再生装置、およびそれらの方法、記録媒体、集積回路
JP4376165B2 (ja) 受信装置,クロック調整方法および放送システム
CN116095395A (zh) 一种调整缓冲区长度的方法、装置、电子设备和存储介质
JP4959935B2 (ja) 復号装置
JP5691721B2 (ja) 音声データ処理装置
JP5604919B2 (ja) パケット転送装置およびパケット転送方法
JP5091290B2 (ja) オーディオデータストリーム中のクリック音の除去
JP2002271397A (ja) パケット損失復旧器、及び、パケット損失復旧方法
JP2008199361A (ja) ストリームデータ受信再生装置
JP2008048060A (ja) 移動無線端末装置
JP2004289683A (ja) データ受信装置、データ受信方法、データ受信プログラム、並びにそれを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151117

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160905

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160927

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170307

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170320

R150 Certificate of patent or registration of utility model

Ref document number: 6123315

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150