JP2007235221A - 揺らぎ吸収バッファ装置 - Google Patents

揺らぎ吸収バッファ装置 Download PDF

Info

Publication number
JP2007235221A
JP2007235221A JP2006050789A JP2006050789A JP2007235221A JP 2007235221 A JP2007235221 A JP 2007235221A JP 2006050789 A JP2006050789 A JP 2006050789A JP 2006050789 A JP2006050789 A JP 2006050789A JP 2007235221 A JP2007235221 A JP 2007235221A
Authority
JP
Japan
Prior art keywords
packet
voice
buffer device
reproduction
absorbing buffer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006050789A
Other languages
English (en)
Inventor
Masakiyo Tanaka
正清 田中
Takeshi Otani
猛 大谷
Masanao Suzuki
政直 鈴木
Takashi Makiuchi
孝志 牧内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2006050789A priority Critical patent/JP2007235221A/ja
Priority to US11/411,991 priority patent/US20070201498A1/en
Priority to EP20060008873 priority patent/EP1826959B1/en
Priority to DE200660006284 priority patent/DE602006006284D1/de
Publication of JP2007235221A publication Critical patent/JP2007235221A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/24Traffic characterised by specific attributes, e.g. priority or QoS
    • H04L47/2416Real-time traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/28Flow control; Congestion control in relation to timing considerations
    • H04L47/283Flow control; Congestion control in relation to timing considerations in response to processing delays, e.g. caused by jitter or round trip time [RTT]

Abstract

【課題】本発明は、不自然な補間による音質劣化を生じさせず、突発的な遅延が生じた際にも音切れを生じさせることなく、遅延の揺らぎを吸収することができる揺らぎ吸収バッファ装置を提供することを目的とする。
【解決手段】音声パケット通信システムで発生する伝送遅延時間の揺らぎを再生バッファ10により吸収する揺らぎ吸収バッファ装置において、再生バッファに蓄積された音声パケットのパケット数が減少した場合にパケット数の減少を通知するパケット状態通知手段と、再生バッファに蓄積された音声パケットの有音無音判定を行う音声パケット調査手段14と、パケット状態通知手段から減少が通知された場合に、有音無音判定結果から無音と判定された音声パケットを繰り返して再生させる音声再生制御手段16,18を有する。
【選択図】図4

Description

本発明は、音声パケット通信システムに関し、音声パケット通信で生じる伝送遅延の揺らぎを吸収するためのバッファを制御する揺らぎ吸収バッファ装置に関する。
近年、ADSL、光通信等の定額制ブロードバンド回線の普及を背景に、インターネット網を用いて、音声をパケット化して伝送するVoIP(Voice over Internet Protocol)が安価な通話料金を実現する手段として急速に普及している。
VoIPのような音声パケット通信システムは従来の固定電話等と異なり、音声用の専用帯域が確保されているわけではないため、ネットワークの輻輳等によって音声パケットの伝送遅延時間に揺らぎが生じる場合がある。伝送遅延が揺らぎ音声パケットが不定期に到着すると、受信側で再生する音声がなくなって音が途切れる可能性がある。
このため、図1に示すように、VoIPでは受信した音声パケットを一旦蓄積する「再生バッファ」を設け、規定量の音声パケットが蓄積されてから再生を開始する方法が一般的である。なお、本明細書では上記蓄積規定量のことを「再生基準値」と呼ぶ。
再生基準値より小さい伝送遅延の揺らぎであれば、再生する音声がなくなる(バッファが枯渇する)ことを原因とする音切れは生じない。即ち、再生基準値が大きいほど揺らぎへの耐性は強化される。
しかし、再生基準値を大きくすると遅延が増加するため、通話のリアルタイム性を考慮した場合、再生基準値は一定以上大きくできない。即ち、ネットワーク状況が悪く、伝送遅延が再生基準値以上に揺らぐ場合に対しては、再生バッファでは揺らぎを吸収できずにバッファが枯渇し、音が途切れる。このような伝送遅延の揺らぎに対する改善技術として、以下にあげる技術などがある。
再生基準値を超えた揺らぎが生じ、バッファが枯渇した場合の音質改善技術として、例えば特許文献1等に開示されている、Packet Loss Concealment(パケットロス隠蔽:PLC)技術を適用する方法がある。この技術は、音声が周期性を持つことを利用し、過去に再生した音声からピッチ(周期性)を抽出し、抽出したピッチに基づいて過去の音声を繰り返すことにより、違和感なく音声を補間する。この技術を再生バッファが枯渇した場合に適用することにより、再生基準値を超えた揺らぎが生じても音切れを生じさせず、音質劣化を軽減させることができる。
また、特許文献2には、伝送遅延時間の揺らぎによって再生基準値を動的に変動させることで、遅延揺らぎを吸収する技術が開示されている。まず、パケットが到着した際に伝送遅延時間の揺らぎ、及び音声の性質(有音か無音か)を調査する。伝送遅延時間の揺らぎは、パケットに付加されている送信時刻とデータを受信した受信時刻から求める等の方法がある。
次に、求めた揺らぎをあらかじめ定められた閾値と比較し、揺らぎが閾値より大きければ、再生バッファ内の無音パケットを繰り返し再生し、音質に影響がないように再生基準値を増加させ、揺らぎ吸収耐性を強化させる。
なお、上記では無音パケットを繰り返すようにしているが、周期性の強い有音パケットを繰り返しても良いし、揺らぎが非常に大きい場合は音声の性質に関係なくパケットを繰り返しても良い。また、逆に揺らぎが小さい場合は無音パケットを削除し、再生基準値を減少させて遅延を小さくすることで、通話のリアルタイム性を高めることもできる。
米国特許60/130,016号公報 特許第3397191号公報
特許文献1の方法は、周期性の強い母音などでは有効であるが、子音など周期性の弱い部分では、図2に示すように、不自然なピッチを抽出して繰り返し、異音が生じる場合があるという問題がある。
特許文献2の方法は、受信したパケットの伝送遅延時間の揺らぎを基に、再生基準値の増加を判定する。即ち、パケットが到着しないと再生基準値の増加処理を行うことはできない。例えば図3のように、突然大きな遅延が生じた場合は、再生バッファが枯渇し、音切れが生じるという問題がある。
本発明は、上記の点に鑑みなされたものであり、不自然な補間による音質劣化を生じさせず、突発的な遅延が生じた際にも音切れを生じさせることなく、遅延の揺らぎを吸収することができる揺らぎ吸収バッファ装置を提供することを目的とする。
本発明の一実施態様の揺らぎ吸収バッファ装置は、音声パケット通信システムで発生する伝送遅延時間の揺らぎを再生バッファにより吸収する揺らぎ吸収バッファ装置において、
前記再生バッファに蓄積された音声パケットのパケット数が減少した場合に減少通知を行うパケット状態通知手段と、
前記再生バッファに蓄積された音声パケットの有音無音判定を行う音声パケット調査手段と、
前記パケット状態通知手段から減少が通知された場合に、前記有音無音判定結果から無音と判定された音声パケットを繰り返して再生させる音声再生制御手段を
有することにより、不自然な補間による音質劣化を生じさせず、突発的な遅延が生じた際にも音切れを生じさせることなく、遅延の揺らぎを吸収することができる。
また、前記揺らぎ吸収バッファ装置において、
前記音声再生制御手段は、前記無音パケットを前記パケット状態通知手段から減少が通知されている期間繰り返すことができる。
また、前記揺らぎ吸収バッファ装置において、
前記音声再生制御手段は、前記無音と判定された音声パケットの後に無音パケットを挿入することができる。
また、前記揺らぎ吸収バッファ装置において、
前記パケット状態通知手段は、前記再生バッファに蓄積された音声パケットのパケット数が所定の閾値以下に減少した場合に減少通知を行うことができる。
また、前記揺らぎ吸収バッファ装置において、
前記音声パケット調査手段は、前記音声パケットのパワーが基準値以下の場合を無音と判定することができる。
また、前記揺らぎ吸収バッファ装置において、
前記音声パケット調査手段は、前記音声パケットの有音無音判定を行うと共に、前記音声パケットの定常度が所定の閾値以上の音声パケットを判定し、
前記音声再生制御手段は、無音と判定されたパケット、あるいは前記定常度が所定の閾値以上の音声パケットを繰り返すことができる。
また、前記揺らぎ吸収バッファ装置において、
前記音声パケット調査手段は、前記音声パケットの有音無音判定を行うと共に、前記音声パケットの定常度が最大の音声パケットを判定し、
前記音声再生制御手段は、無音と判定されたパケット、あるいは前記定常度が最大の音声パケットを繰り返すことができる。
また、前記揺らぎ吸収バッファ装置において、
前記音声再生制御手段は、無音と判定されたパケットがない場合に、前期定常度が所定の閾値以上、あるいは最大となる音声パケットを繰り返すことができる。
また、前記揺らぎ吸収バッファ装置において、
前記音声再生制御手段は、前期定常度が所定の閾値以上、あるいは最大となる音声パケットの後にPacket Loss Concealmentアルゴリズムによって生成された補間音声を挿入することができる。
また、前記揺らぎ吸収バッファ装置において、
前記音声パケット調査手段は、前記音声パケットの定常度として前記音声パケットの自己相関関数の最大値を用いることができる。
また、前記揺らぎ吸収バッファ装置において、
前記音声パケット調査手段は、前記音声パケットの定常度として前記音声パケットのピッチゲインの大きさを用いることができる。
また、前記揺らぎ吸収バッファ装置において、
前記パケット状態通知手段は、前記再生バッファに蓄積された音声パケットのパケット数が減少した場合に減少通知を行い、前記パケット数が増加した場合にバッファ増減フラグを減少指示とし、
前記音声再生制御手段は、前記バッファ増減フラグが増加指示の場合に増加通知を行い、
前記音声再生制御手段は、前記パケット状態通知手段からの通知が減少の場合は無音パケットの繰り返し、あるいは無音パケット挿入を行い、前記パケット状態通知手段からの通知が増加の場合は前記有音無音判定結果から無音と判定された音声パケットを削除することができる。
また、前記パケット状態通知手段は、前記パケット数が一定期間以上変化がない場合にパケット数の無変化を通知し、前記音声再生制御手段はパケット数の無変化が通知された場合に無音と判定された音声パケットを削除することができる。
本発明によれば、不自然な補間による音質劣化を生じさせず、突発的な遅延が生じた際にも音切れを生じさせることなく、遅延の揺らぎを吸収することができる。
以下、図面に基づいて本発明の実施形態について説明する。
<第1実施形態>
図4は、本発明の揺らぎ吸収バッファ装置の第1実施形態の構成図を示す。同図中、再生バッファ10は、一端10aに供給される音声パケットを蓄積し、他端10bから音声パケットを出力するFIFO構成のメモリである。
フラグ生成部12は、パケット選択部18から1パケット再生を完了したことを知らせる再生完了通知メッセージmsgを受け取ると、再生バッファ10のパケット数Nの値を調査する。フラグ生成部12は前回音声パケット数N(−)を保持しており、今回の音声パケット数Nと前回音声パケット数N(−)との差から再生バッファ10に蓄積されている音声パケット数が減少傾向にあるか否かを判定する。この判定結果から、減少傾向にあると判定した場合は、再生制御フラグF1をオンにし、音声再生制御部16に通知する。また、音声パケット数が増加もしくは変化なしと判定した場合には再生制御フラグF1をオフとする。
再生バッファ10内に蓄積されている全ての音声パケットp(n)について、音声パケット調査部14で有音か無音かの調査を行って有音無音判定結果uv(n)を音声再生制御部16に通知する。調査方法は例えば音声パケットのパワーが基準値以下の場合を無音と判定する。
音声再生制御部16では、再生制御フラグF1がオンだった場合、有音無音判定結果uv(n)を基に、再生バッファ10が枯渇しないように再生を制御する。即ち、無音と判定された場合は、無音と判定された音声パケットmが再生バッファ10から出力された後に、無音パケットを挿入するようにパケット選択部18に制御情報を送信することによって、再生バッファ10の枯渇を防ぐよう再生を制御する。
また、再生制御フラグがオフの場合は、通常の再生を行うよう、制御情報をパケット選択部18に送信する。上記無音パケットの挿入は再生制御フラグF1がオンである期間繰り返される。
パケット選択部18では、音声再生制御部16からの制御情報をもとに、通常の再生を行う場合は、再生バッファ内の音声パケットを取り出して出力し、無音を挿入する場合はは無音パケットを生成して出力する。パケットの出力が完了した後、再生完了通知メッセージmsgをフラグ生成部12に通知する。
図5に第1実施形態における制御の様子を示す。図5(A)に示すように、時刻tでは再生バッファ10に音声パケット#1,#2が蓄積された状態で再生バッファ10の音声パケット数が減少傾向にあれば、音声パケット#1,#2それぞれが有音か無音かを調査する。
そして、図5(B)に示すように、時刻t+1で無音パケット#1が出力された後、図5(C)に示すように、時刻t+2で無音パケットを出力し、また、図5(D)に示すように、遅れていた音声パケット#3が到着する時刻t+3でも無音パケットを出力する。
次の時刻t+4では音声パケット#3が到着して再生制御フラグがオフとなったために、図5(E)に示すように、有音の音声パケット#2が出力される。
これにより、遅延揺らぎが大きく、音声パケットが到着しない場合でも、バッファ枯渇前に再生を制御し、バッファ枯渇による音切れを防止できる。
<第2実施形態>
図6は、本発明の揺らぎ吸収バッファ装置の第2実施形態の構成図を示す。同図中、再生バッファ10は、一端10aに供給される音声パケットを蓄積し、他端10bから音声パケットを出力するFIFO構成のメモリである。
フラグ生成部22は、パケット選択部18から1パケット再生を完了したことを知らせる再生完了通知メッセージmsgを受け取ると、再生バッファ10のパケット数Nの値を調査して、パケット数Nが閾値以下であれば再生制御フラグF1をオンにし、パケット数Nが閾値を超えていると再生制御フラグF1をオフにして音声再生制御部16に送る。なお、閾値の設定方法は例えば再生基準値よりも2個少ない値にする。
音声パケット調査部24は、再生バッファ10内の音声パケットp(n)が有音か無音かを判定し、有音無音判定結果uv(n)を音声再生制御部26に通知する。調査方法は例えば音声パケットのパワーが基準値以下の場合を無音と判定する。
音声再生制御部26は、再生制御フラグF1がオンだった場合は有音無音判定結果uv(n)を基に、無音と判定された音声パケットmの後に無音パケットを挿入して再生するよう、制御情報をパケット選択部18に送信する。
また、再生制御フラグF1がオフだった場合は通常の再生を行うよう、制御情報をパケット選択部18に送信する。上記無音パケットの挿入は再生制御フラグF1がオンである期間繰り返される。
パケット選択部18では、音声再生制御部26からの制御情報をもとに、通常の再生を行う場合は、再生バッファ内の音声パケットを取り出して出力し、無音を挿入する場合はは無音パケットを生成して出力する。パケットの出力が完了した後、再生完了通知メッセージmsgをフラグ生成部22に通知する。
なお、音声再生制御部26は無音と判定された音声パケットmの後ではなく、前に無音を挿入するように制御しても良く、また、新規に無音パケットを作成するのではなく、無音と判定された音声パケットmを繰り返し再生するようにしても良い。
本実施形態によれば、再生バッファ10が枯渇する前に再生を制御できるため、バッファが枯渇することによる音切れが生じない。また、無音パケット部分で音声を補間するため、音質が劣化しない。
<第3実施形態>
図7は、本発明の揺らぎ吸収バッファ装置の第3実施形態の構成図を示す。同図中、再生バッファ10は、一端10aに供給される音声パケットを蓄積し、他端10bから音声パケットを出力するFIFO構成のメモリである。
フラグ生成部32は、パケット選択部18から1パケット再生を完了したことを知らせる再生完了通知メッセージmsgを受け取ると、再生バッファ10のパケット数Nの値を調査して、Nが閾値以下であれば再生制御フラグF1をオンにし、Nが閾値を超えている場合は再生制御フラグF1をオフにして音声再生制御部36に送る。なお、閾値の設定方法は例えば再生基準値よりも2個少ない値にする。
音声パケット調査部34は、再生バッファ10内の音声パケットp(n)が有音か無音かを判定し、有音無音判定結果uv(n)を音声再生制御部36に通知する。調査方法は例えば音声パケットのパワーが基準値以下の場合を無音と判定する。更に、音声パケット調査部34は各音声パケットについて、定常度u(n)を算出して音声再生制御部36に通知する。定常度u(n)の算出方法は、例えば音声パケットの自己相関関数の最大値を定常度とする。例えば、自己相関関数を定常度として用いる場合であれば、式(1)で与えられるフレームnにおける自己相関関数φn(l)の最大値を定常度u(n)とする。
Figure 2007235221
式(1)において、x(k)は音声信号であり、Kは自己相関関数の算出範囲、Lは自己相関関数最大値の探索範囲をそれぞれ表す。
また、音声通信に利用されている音声Codecによっては、音声パケット(符号化ストリーム)中に、定常度を表すパラメータが含まれている場合においては、その定常度を表すパラメータを用いることにより、定常度を算出する演算量を削減できる。例えば、ITU−T
G.729などのCELP系Codecであれば、符号化ストリーム中のピッチゲイン(音声の周期性の強さ)を定常度u(n)として利用することができる。
音声再生制御部36は、再生制御フラグF1がオンだった場合は、有音無音判定結果uv(n)及び定常度u(n)を基に、無音と判定された音声パケットmがある場合は、無音と判定された音声パケットmの後に無音パケットを挿入して再生を行うよう、制御情報をパケット選択部18に送信する。また、無音と判定された音声パケットがない場合は、定常度u(n)が所定の閾値以上の音声パケットを繰り返して再生するよう制御、制御情報をパケット選択部18に送信する。あるいは定常度u(n)が所定の閾値以上の音声パケットの後に、PLCアルゴリズムを用いて補間音声パケットを生成して挿入して再生するよう制御する。
一方、再生制御フラグF1がオフだった場合は、音声再生制御部36は通常の再生を行うよう、制御情報をパケット選択部18に送信する。上記無音パケットの挿入または定常度u(n)が閾値以上の音声パケットの繰り返し再生または補間音声パケットの挿入は、再生制御フラグF1がオンである期間繰り返される。
パケット選択部18では、音声再生制御部36からの制御情報をもとに、通常の再生を行う場合は、再生バッファ内の音声パケットを取り出して出力し、無音を挿入する場合はは無音パケットを生成して出力する。パケットの出力が完了した後、再生完了通知メッセージmsgをフラグ生成部32に通知する。
なお、上記実施形態では、無音パケットを用いた補間を優先しているが、補間の優先順位は任意であり、例えば順序を逆にしても良いし、また、補間可能なパケットのうち、最も早く到着したパケットで補間するといった方法を用いても良い。また、定常度u(n)に閾値を設けず、最大の定常度u(n)をとる音声パケットを繰り返す、あるいは最大の定常度u(n)をとる音声パケットの後にPLCによって補間するようにしても良い。
本実施形態によれば、再生バッファ10内に無音パケットがない場合でも音声を補間することができる。また、有音部分で補間するにあたって、定常性の強い音声パケットを選択するため、音質劣化を最小限に抑えることができる。
<第4実施形態>
図8は、本発明の揺らぎ吸収バッファ装置の第4実施形態の構成図を示す。同図中、再生バッファ10は、一端10aに供給される音声パケットを蓄積し、他端10bから音声パケットを出力するFIFO構成のメモリである。
フラグ生成部42は、パケット選択部18から、1パケット再生を完了したことを知らせる再生完了通知メッセージmsgを受け取ると、再生バッファ10のパケット数Nの値を調査し、パケット数Nが閾値TH1以下であればバッファ増減フラグF2を値11(増加指示)とし、パケット数Nが閾値TH2(TH1≦TH2)以上である場合はバッファ増減フラグF2を値00(減少指示)として音声再生制御部46に送る。
なお、閾値TH1,TH2の設定方法は、例えば再生基準値よりも2個少ない値を閾値TH1とし、再生基準値よりも2個多い値を閾値TH2とする。また、パケット数Nの増加/減少数を求めて、パケット数Nが所定値以上増加(または減少)していたらバッファ増減フラグF2を値00(または値11)としても良いし、パケット数Nの値が一定期間以上変化がなかった場合にバッファ増減フラグF2を値00(減少指示)としても良い。
音声パケット調査部44は、再生バッファ10内の音声パケットp(n)が有音か無音かを判定し、有音無音判定結果uv(n)を音声再生制御部46に通知する。調査方法は例えば音声パケットのパワーが基準値以下の場合を無音と判定する。
音声再生制御部46は、バッファ増減フラグF2が値11(増加指示)だった場合は、再生制御フラグがオンとみなし、有音無音判定結果uv(n)を基に、無音と判定された音声パケットmの後に無音パケットを挿入して再生するよう、バッファ制御情報をパケット選択部18に送信する。なお、無音パケットmの後ではなく、前に無音パケットを挿入するようにしても良いし、新規に無音パケットを作成するのではなく、無音と判定された音声パケットmを繰り返し再生するようにしても良い。
一方、バッファ増減フラグF2が値00(減少指示)だった場合は、有音無音判定結果uv(n)を基に、無音と判定された音声パケットmの削除を再生バッファに要求した後、通常の再生を行うよう、バッファ制御情報をパケット選択部18に送信する。バッファ増減フラグF2が値00もしくは11以外で増加指示でも減少指示でもない場合は通常の再生を行うよう、制御情報をパケット選択部18に送信する。上記無音パケットの挿入は、バッファ増減フラグF2が値11(増加指示)である期間繰り返される。
パケット選択部18では、音声再生制御部46からの制御情報をもとに、通常の再生を行う場合は、再生バッファ内の音声パケットを取り出して出力し、無音を挿入する場合はは無音パケットを生成して出力する。パケットの出力が完了した後、再生完了通知メッセージmsgをフラグ生成部42に通知する。
本実施形態によれば、減少指示によって無音パケットを削減することにより、再生バッファ10が安定した場合に遅延を削減し、通話のリアルタイム性を高めることができる。
<第5実施形態>
図9は、本発明の揺らぎ吸収バッファ装置の第5実施形態の構成図を示す。同図中、再生バッファ10は、一端10aに供給される音声パケットを蓄積し、他端10bから音声パケットを出力するFIFO構成のメモリである。
フラグ生成部52は、パケット選択部18から、1パケット再生を完了したことを知らせる再生完了通知メッセージmsgを受け取ると、再生バッファ10のパケット数Nの値を調査し、パケット数Nが閾値TH1以下であればバッファ増減フラグF2を値11(増加指示)とし、パケット数Nが閾値TH2(TH1≦TH2)以上である場合はバッファ増減フラグF2を値00(減少指示)として音声再生制御部56に送る。
なお、閾値TH1,TH2の設定方法は、例えば再生基準値よりも2個少ない値を閾値TH1とし、再生基準値よりも2個多い値を閾値TH2とする。また、パケット数Nの増加/減少数を求めて、パケット数Nが所定値以上増加(または減少)していたらバッファ増減フラグF2を値00(または値11)としても良いし、パケット数Nの値が一定期間以上変化がなかった場合にバッファ増減フラグF2を値00(減少指示)としても良い。
音声パケット調査部54は、再生バッファ10内の音声パケットp(n)が有音か無音かを判定し、有音無音判定結果uv(n)を音声再生制御部56に通知する。調査方法は例えば音声パケットのパワーが基準値以下の場合を無音と判定する。更に、音声パケット調査部54は各音声パケットについて、定常度u(n)を算出して音声再生制御部56に通知する。定常度u(n)の算出方法は例えば音声パケットの自己相関関数の最大値やピッチゲインの大きさを定常度とする。
音声再生制御部56は、バッファ増減フラグF2が値11(増加指示)だった場合は、再生制御フラグがオンとみなし、有音無音判定結果uv(n)及び定常度u(n)を基に、無音と判定された音声パケットmがある場合は、無音と判定された音声パケットmの後に無音パケットを挿入して再生を行うよう、制御情報をパケット選択部18に送信する。また、無音と判定された音声パケットがない場合は、定常度u(n)が所定の閾値以上の音声パケットを繰り返して再生するよう、制御情報をパケット選択部18に送信する。あるいは定常度u(n)が所定の閾値以上の音声パケットの後に、PLCアルゴリズムを用いて補間音声パケットを生成して挿入して再生するよう制御する。
一方、バッファ増減フラグF2が値00(減少指示)だった場合は、有音無音判定結果uv(n)を基に、無音と判定された音声パケットmの削除を再生バッファに要求した後、通常の再生を行うよう、制御情報をパケット選択部18に送信する。また、無音と判定された音声パケットがないときは、定常度u(n)が所定の閾値以上の音声パケットの削除を再生バッファに要求した後、通常の再生を行うよう、制御情報をパケット選択部18に送信する。
バッファ増減フラグF2が値00または11以外で増加指示でも減少指示でもない場合は通常の再生を行うよう、制御情報をパケット選択部18に送信する。上記無音パケットの挿入または定常度u(n)が閾値以上の音声パケットの繰り返し再生または補間音声パケットの挿入は、バッファ増減フラグF2が値11(増加指示)である期間繰り返される。
パケット選択部18では、音声再生制御部56からの制御情報をもとに、通常の再生を行う場合は、再生バッファ内の音声パケットを取り出して出力し、無音を挿入する場合はは無音パケットを生成して出力する。パケットの出力が完了した後、再生完了通知メッセージmsgをフラグ生成部52に通知する。
なお、上記実施形態では、無音パケットを用いた補間を優先しているが、補間の優先順序は任意であり、例えば順序を逆にしても良いし、また、補間可能なパケットのうち、最も早く到着したパケットで補間するといった方法を用いても良い。また、定常度u(n)に閾値を設けず、最大の定常度u(n)をとる音声パケットを繰り返す、あるいは最大の定常度u(n)をとる音声パケットの後にPLCによって補間するようにしても良い。
<パケット音声通信装置>
図10は、本発明の揺らぎ吸収バッファ装置を用いたパケット音声通信装置の受信部分の一実施形態の構成図である。同図中、パケット受信部60はネットワーク61に接続されており、ネットワーク61から自装置宛に送信された音声パケットを受信して揺らぎ吸収バッファ装置62に供給する。
揺らぎ吸収バッファ装置62は、図4,図6〜図9に示す揺らぎ吸収バッファ装置であり、パケット受信部60から供給される音声パケットの揺らぎを吸収する。揺らぎ吸収バッファ装置62の出力する音声パケットは復号部63にて復号され、音声信号とされて出力される。
なお、フラグ生成部12,22,32,42,52が請求項記載のパケット状態通知手段に相当し、音声パケット調査部14,24,34,44,54が音声パケット調査手段に相当し、音声再生制御部16,26,36,46,56,パケット選択部18が音声再生制御手段に相当する。
(付記1)
音声パケット通信システムで発生する伝送遅延時間の揺らぎを再生バッファにより吸収する揺らぎ吸収バッファ装置において、
前記再生バッファに蓄積された音声パケットのパケット数が減少した場合に減少通知を行うパケット状態通知手段と、
前記再生バッファに蓄積された音声パケットの有音無音判定を行う音声パケット調査手段と、
前記パケット状態通知手段から減少が通知された場合に、前記有音無音判定結果から無音と判定された音声パケットを繰り返して再生させる音声再生制御手段を
有することを特徴とする揺らぎ吸収バッファ装置。
(付記2)
付記1記載の揺らぎ吸収バッファ装置において、
前記音声再生制御手段は、前記無音パケットを前記パケット状態通知手段から減少が通知されている期間繰り返すことを特徴とする揺らぎ吸収バッファ装置。
(付記3)
付記1記載の揺らぎ吸収バッファ装置において、
前記音声再生制御手段は、前記無音と判定された音声パケットの後に無音パケットを挿入することを特徴とする揺らぎ吸収バッファ装置。
(付記4)
付記1乃至3のいずれか1項記載の揺らぎ吸収バッファ装置において、
前記パケット状態通知手段は、前記再生バッファに蓄積された音声パケットのパケット数が所定の閾値以下に減少した場合に減少通知を行うことを特徴とする揺らぎ吸収バッファ装置。
(付記5)
付記1乃至4のいずれか1項記載の揺らぎ吸収バッファ装置において、
前記音声パケット調査手段は、前記音声パケットのパワーが基準値以下の場合を無音と判定することを特徴とする揺らぎ吸収バッファ装置。
(付記6)
付記1乃至5のいずれか1項記載の揺らぎ吸収バッファ装置において、
前記音声パケット調査手段は、前記音声パケットの有音無音判定を行うと共に、前記音声パケットの定常度が所定の閾値以上の音声パケットを判定し、
前記音声再生制御手段は、無音と判定されたパケット、あるいは前記定常度が所定の閾値以上の音声パケットを繰り返すことを特徴とする揺らぎ吸収バッファ装置。
(付記7)
付記1乃至5のいずれか1項記載の揺らぎ吸収バッファ装置において、
前記音声パケット調査手段は、前記音声パケットの有音無音判定を行うと共に、前記音声パケットの定常度が最大の音声パケットを判定し、
前記音声再生制御手段は、無音と判定されたパケット、あるいは前記定常度が最大の音声パケットを繰り返すことを特徴とする揺らぎ吸収バッファ装置。
(付記8)
付記6または7記載の揺らぎ吸収バッファ装置において、
前記音声再生制御手段は、無音と判定されたパケットがない場合に、前期定常度が所定の閾値以上、あるいは最大となる音声パケットを繰り返すことを特徴とする揺らぎ吸収バッファ装置。
(付記9)
付記6乃至8のいずれか1項記載の揺らぎ吸収バッファ装置において、
前記音声再生制御手段は、前期定常度が所定の閾値以上、あるいは最大となる音声パケットの後にPacket Loss Concealmentアルゴリズムによって生成された補間音声を挿入することを特徴とする揺らぎ吸収バッファ装置。
(付記10)
付記6乃至9のいずれか1項記載の揺らぎ吸収バッファ装置において、
前記音声パケット調査手段は、前記音声パケットの定常度として前記音声パケットの自己相関関数の最大値を用いることを特徴とする揺らぎ吸収バッファ装置。
(付記11)
付記6乃至9のいずれか1項記載の揺らぎ吸収バッファ装置において、
前記音声パケット調査手段は、前記音声パケットの定常度として前記音声パケットのピッチゲインの大きさを用いることを特徴とする揺らぎ吸収バッファ装置。
(付記12)
付記1乃至11のいずれか1項記載の揺らぎ吸収バッファ装置において、
前記パケット状態通知手段は、前記再生バッファに蓄積された音声パケットのパケット数が減少した場合に減少通知を行い、前記パケット数が増加した場合に増加通知を行い、
前記音声再生制御手段は、前記パケット状態通知手段からの通知が減少の場合は無音パケットの繰り返し、あるいは無音パケット挿入を行い、前記パケット状態通知手段からの通知が増加の場合は前記有音無音判定結果から無音と判定された音声パケットを削除することを特徴とする揺らぎ吸収バッファ装置。
置。
(付記13)
付記12記載の揺らぎ吸収バッファ装置において、
前記音声再生制御手段は、前記パケット状態通知手段から減少が通知されている場合に前記無音と判定された音声パケットがないときは前記定常度が所定の閾値以上の音声パケットを削除することを特徴とする揺らぎ吸収バッファ装置。
(付記14)
付記12記載の揺らぎ吸収バッファ装置において、
前記パケット状態通知手段は、前記再生バッファに蓄積された音声パケットのパケット数が第1の閾値以下に減少した場合に減少を通知し、前記パケット数が第1の閾値より大きな第2の閾値以上に増加した場合に増加を通知することを特徴とする揺らぎ吸収バッファ装置。
(付記15)
付記12記載の揺らぎ吸収バッファ装置において、
前記パケット状態通知手段は、前記再生バッファに蓄積された音声パケットのパケット数が一定期間以上変化がない場合にパケット数の無変化を通知し、前記音声再生制御手段はパケット数の無変化が通知された場合に無音と判定された音声パケットを削除することを特徴とする揺らぎ吸収バッファ装置。
(付記16)
付記1乃至15のいずれか1項記載の揺らぎ吸収バッファ装置を有するパケット音声通信装置であって、
ネットワークから受信した音声パケットを前記揺らぎ吸収バッファ装置に供給し、
前記前記揺らぎ吸収バッファ装置から出力される音声パケットを復調することを特徴とするパケット音声通信装置。
再生バッファを説明するための図である。 従来技術による音声の補間を説明するための波形図である。 再生バッファの枯渇による音切れの発生を説明するための図である。 本発明の揺らぎ吸収バッファ装置の第1実施形態の構成図である。 第1実施形態における制御の様子を示す図である。 本発明の揺らぎ吸収バッファ装置の第2実施形態の構成図である。 本発明の揺らぎ吸収バッファ装置の第3実施形態の構成図である。 本発明の揺らぎ吸収バッファ装置の第4実施形態の構成図である。 本発明の揺らぎ吸収バッファ装置の第5実施形態の構成図である。 本発明の揺らぎ吸収バッファ装置を用いたパケット音声通信装置の受信部分の一実施形態の構成図である。
符号の説明
10 再生バッファ
12,22,32,42,52 フラグ生成部
14,24,34,44,54 音声パケット調査部
16,26,36,46,56 音声再生制御部
18 パケット選択部
60 パケット受信部
61 ネットワーク
62 揺らぎ吸収バッファ装置
63 復号部

Claims (12)

  1. 音声パケット通信システムで発生する伝送遅延時間の揺らぎを再生バッファにより吸収する揺らぎ吸収バッファ装置において、
    前記再生バッファに蓄積された音声パケットのパケット数が減少した場合に減少通知を行うパケット状態通知手段と、
    前記再生バッファに蓄積された音声パケットの有音無音判定を行う音声パケット調査手段と、
    前記パケット状態通知手段から減少が通知された場合に、前記有音無音判定結果から無音と判定された音声パケットを繰り返して再生させる音声再生制御手段を
    有することを特徴とする揺らぎ吸収バッファ装置。
  2. 請求項1記載の揺らぎ吸収バッファ装置において、
    前記音声再生制御手段は、前記無音パケットを前記パケット状態通知手段から減少が通知されている期間繰り返すことを特徴とする揺らぎ吸収バッファ装置。
  3. 請求項1記載の揺らぎ吸収バッファ装置において、
    前記音声再生制御手段は、前記無音と判定された音声パケットの後に無音パケットを挿入することを特徴とする揺らぎ吸収バッファ装置。
  4. 請求項1乃至3のいずれか1項記載の揺らぎ吸収バッファ装置において、
    前記パケット状態通知手段は、前記再生バッファに蓄積された音声パケットのパケット数が所定の閾値以下に減少した場合に減少通知を行うことを特徴とする揺らぎ吸収バッファ装置。
  5. 請求項1乃至4のいずれか1項記載の揺らぎ吸収バッファ装置において、
    前記音声パケット調査手段は、前記音声パケットのパワーが基準値以下の場合を無音と判定することを特徴とする揺らぎ吸収バッファ装置。
  6. 請求項1乃至5のいずれか1項記載の揺らぎ吸収バッファ装置において、
    前記音声パケット調査手段は、前記音声パケットの有音無音判定を行うと共に、前記音声パケットの定常度が所定の閾値以上の音声パケットを判定し、
    前記音声再生制御手段は、無音と判定されたパケット、あるいは前記定常度が所定の閾値以上の音声パケットを繰り返すことを特徴とする揺らぎ吸収バッファ装置。
  7. 請求項1乃至5のいずれか1項記載の揺らぎ吸収バッファ装置において、
    前記音声パケット調査手段は、前記音声パケットの有音無音判定を行うと共に、前記音声パケットの定常度が最大の音声パケットを判定し、
    前記音声再生制御手段は、無音と判定されたパケット、あるいは前記定常度が最大の音声パケットを繰り返すことを特徴とする揺らぎ吸収バッファ装置。
  8. 請求項6または7記載の揺らぎ吸収バッファ装置において、
    前記音声再生制御手段は、無音と判定されたパケットがない場合に、前期定常度が所定の閾値以上、あるいは最大となる音声パケットを繰り返すことを特徴とする揺らぎ吸収バッファ装置。
  9. 請求項6乃至8のいずれか1項記載の揺らぎ吸収バッファ装置において、
    前記音声再生制御手段は、前期定常度が所定の閾値以上、あるいは最大となる音声パケットの後にPacket Loss Concealmentアルゴリズムによって生成された補間音声を挿入することを特徴とする揺らぎ吸収バッファ装置。
  10. 請求項6乃至9のいずれか1項記載の揺らぎ吸収バッファ装置において、
    前記音声パケット調査手段は、前記音声パケットの定常度として前記音声パケットの自己相関関数の最大値を用いることを特徴とする揺らぎ吸収バッファ装置。
  11. 請求項6乃至9のいずれか1項記載の揺らぎ吸収バッファ装置において、
    前記音声パケット調査手段は、前記音声パケットの定常度として前記音声パケットのピッチゲインの大きさを用いることを特徴とする揺らぎ吸収バッファ装置。
  12. 請求項1乃至11のいずれか1項記載の揺らぎ吸収バッファ装置において、
    前記パケット状態通知手段は、前記再生バッファに蓄積された音声パケットのパケット数が減少した場合に減少通知を行い、前記パケット数が増加した場合に増加通知を行い、
    前記音声再生制御手段は、前記パケット状態通知手段からの通知が減少の場合は無音パケットの繰り返し、あるいは無音パケット挿入を行い、前記パケット状態通知手段からの通知が増加の場合は前記有音無音判定結果から無音と判定された音声パケットを削除することを特徴とする揺らぎ吸収バッファ装置。
JP2006050789A 2006-02-27 2006-02-27 揺らぎ吸収バッファ装置 Pending JP2007235221A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2006050789A JP2007235221A (ja) 2006-02-27 2006-02-27 揺らぎ吸収バッファ装置
US11/411,991 US20070201498A1 (en) 2006-02-27 2006-04-26 Fluctuation absorbing buffer apparatus and packet voice communication apparatus
EP20060008873 EP1826959B1 (en) 2006-02-27 2006-04-28 Apparatus for absorbing fluctuations in the packet transmission rate of a communications network
DE200660006284 DE602006006284D1 (de) 2006-02-27 2006-04-28 Vorrichtung zur Absorption von Schwankungen in der Paketübertragungsrate in einem Kommunikationsnetzwerk

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006050789A JP2007235221A (ja) 2006-02-27 2006-02-27 揺らぎ吸収バッファ装置

Publications (1)

Publication Number Publication Date
JP2007235221A true JP2007235221A (ja) 2007-09-13

Family

ID=36588920

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006050789A Pending JP2007235221A (ja) 2006-02-27 2006-02-27 揺らぎ吸収バッファ装置

Country Status (4)

Country Link
US (1) US20070201498A1 (ja)
EP (1) EP1826959B1 (ja)
JP (1) JP2007235221A (ja)
DE (1) DE602006006284D1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010103855A1 (ja) 2009-03-13 2010-09-16 パナソニック株式会社 音声復号装置及び音声復号方法
JP2010539739A (ja) * 2007-08-31 2010-12-16 インターナショナル・ビジネス・マシーンズ・コーポレーション データ・フローを同期化する方法
JP2012205066A (ja) * 2011-03-25 2012-10-22 Mitsubishi Electric Corp 音声データ処理装置
JP2016119588A (ja) * 2014-12-22 2016-06-30 アイシン・エィ・ダブリュ株式会社 音声情報修正システム、音声情報修正方法、及び音声情報修正プログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5517381B1 (ja) * 2013-09-30 2014-06-11 レゾネッツ合同会社 揺らぎ吸収装置、通信装置、及び制御プログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61156949A (ja) * 1984-12-27 1986-07-16 Matsushita Electric Ind Co Ltd 音声パケツト通信方式
JP2001160826A (ja) * 1999-12-03 2001-06-12 Nec Corp 遅延ゆらぎ吸収装置、遅延ゆらぎ吸収方法
JP2002057708A (ja) * 2000-08-10 2002-02-22 Fujitsu Ltd パケットゆらぎ吸収方法及びその装置
JP2004356898A (ja) * 2003-05-28 2004-12-16 Nippon Telegr & Teleph Corp <Ntt> 音声パケット送信装置とその方法並びに音声パケット受信装置及び音声パケット通信システム

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57159192A (en) * 1981-03-27 1982-10-01 Hitachi Ltd Audio packet exchange system
US5611018A (en) * 1993-09-18 1997-03-11 Sanyo Electric Co., Ltd. System for controlling voice speed of an input signal
US6961697B1 (en) * 1999-04-19 2005-11-01 At&T Corp. Method and apparatus for performing packet loss or frame erasure concealment
US6973425B1 (en) * 1999-04-19 2005-12-06 At&T Corp. Method and apparatus for performing packet loss or Frame Erasure Concealment
US6952668B1 (en) * 1999-04-19 2005-10-04 At&T Corp. Method and apparatus for performing packet loss or frame erasure concealment
US6658027B1 (en) * 1999-08-16 2003-12-02 Nortel Networks Limited Jitter buffer management
WO2002013185A1 (en) * 2000-08-09 2002-02-14 Thomson Licensing S.A. Method and system for enabling audio speed conversion
JP2002077233A (ja) * 2000-08-25 2002-03-15 Matsushita Electric Ind Co Ltd リアルタイム情報受信装置
JP2002271389A (ja) * 2001-03-07 2002-09-20 Hitachi Telecom Technol Ltd パケット処理装置およびパケット処理方法
US7453897B2 (en) * 2001-10-03 2008-11-18 Global Ip Solutions, Inc. Network media playout
JP3825007B2 (ja) * 2003-03-11 2006-09-20 沖電気工業株式会社 ジッタバッファの制御方法
JP2005057504A (ja) * 2003-08-05 2005-03-03 Matsushita Electric Ind Co Ltd データ通信装置及びデータ通信方法
KR100552519B1 (ko) * 2004-01-19 2006-02-14 삼성전자주식회사 브이오아이피를 이용한 유엠에스 서비스 제공 시스템 및그 방법
JP4462996B2 (ja) * 2004-04-27 2010-05-12 富士通株式会社 パケット受信方法及びパケット受信装置
CN1926824B (zh) * 2004-05-26 2011-07-13 日本电信电话株式会社 声音分组再现方法、声音分组再现装置
US20070019931A1 (en) * 2005-07-19 2007-01-25 Texas Instruments Incorporated Systems and methods for re-synchronizing video and audio data

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61156949A (ja) * 1984-12-27 1986-07-16 Matsushita Electric Ind Co Ltd 音声パケツト通信方式
JP2001160826A (ja) * 1999-12-03 2001-06-12 Nec Corp 遅延ゆらぎ吸収装置、遅延ゆらぎ吸収方法
JP2002057708A (ja) * 2000-08-10 2002-02-22 Fujitsu Ltd パケットゆらぎ吸収方法及びその装置
JP2004356898A (ja) * 2003-05-28 2004-12-16 Nippon Telegr & Teleph Corp <Ntt> 音声パケット送信装置とその方法並びに音声パケット受信装置及び音声パケット通信システム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010539739A (ja) * 2007-08-31 2010-12-16 インターナショナル・ビジネス・マシーンズ・コーポレーション データ・フローを同期化する方法
WO2010103855A1 (ja) 2009-03-13 2010-09-16 パナソニック株式会社 音声復号装置及び音声復号方法
JP2012205066A (ja) * 2011-03-25 2012-10-22 Mitsubishi Electric Corp 音声データ処理装置
JP2016119588A (ja) * 2014-12-22 2016-06-30 アイシン・エィ・ダブリュ株式会社 音声情報修正システム、音声情報修正方法、及び音声情報修正プログラム
WO2016104462A1 (ja) * 2014-12-22 2016-06-30 アイシン・エィ・ダブリュ株式会社 音声情報修正システム、音声情報修正方法、及び音声情報修正プログラム

Also Published As

Publication number Publication date
US20070201498A1 (en) 2007-08-30
EP1826959B1 (en) 2009-04-15
EP1826959A1 (en) 2007-08-29
DE602006006284D1 (de) 2009-05-28

Similar Documents

Publication Publication Date Title
US8937963B1 (en) Integrated adaptive jitter buffer
JP4933605B2 (ja) 適応デジッタバッファの方法及び装置
JP4744332B2 (ja) ゆらぎ吸収バッファ制御装置
ES2287133T3 (es) Configuracion y metodo relativo a la comunicacion del habla.
JP4842075B2 (ja) 音声伝送装置
TW200849842A (en) Method of regulating the transmission jitter within a reception terminal
JP2007235221A (ja) 揺らぎ吸収バッファ装置
Kim et al. Enhancing VoIP speech quality using combined playout control and signal reconstruction
US7793202B2 (en) Loss compensation device, loss compensation method and loss compensation program
JP4561301B2 (ja) 音声の再生及び停止を制御する音声再生装置及びプログラム
JP5074749B2 (ja) 音声信号受信装置、それに使用される音声パケット消失補償方法、その方法を実施するプログラム、及びそのプログラムを記録した記録媒体
JP4050961B2 (ja) パケット型音声通信端末
JP5330183B2 (ja) パケット挿入削除方法及び通話システム
JP6031752B2 (ja) 音声通信装置及びプログラム
JP4117301B2 (ja) 音声データ補間装置と音声データ補間方法
JP5691721B2 (ja) 音声データ処理装置
Janicki et al. Packet Loss Concealment Algorithm for VoIP Transmission in Unreliable Networks.
JP3813046B2 (ja) パケット受信装置
Gong et al. Improved quality for conversational VoIP using path diversity
JP4869882B2 (ja) 音声復号装置
JP6529473B2 (ja) 無線通信装置、無線通信システム、及びノイズ軽減方法
JP2005142856A (ja) 受信装置および方法
JP4534582B2 (ja) 音声ストリーム再生装置及び音声ストリーム再生方法
Kim Enhanced timing recovery using active jitter estimation for voice-over IP networks
CN115527544A (zh) 语音数据传输方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081117

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100908

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100914

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110203

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110222