JP2005006050A - パケット処理装置 - Google Patents
パケット処理装置 Download PDFInfo
- Publication number
- JP2005006050A JP2005006050A JP2003167335A JP2003167335A JP2005006050A JP 2005006050 A JP2005006050 A JP 2005006050A JP 2003167335 A JP2003167335 A JP 2003167335A JP 2003167335 A JP2003167335 A JP 2003167335A JP 2005006050 A JP2005006050 A JP 2005006050A
- Authority
- JP
- Japan
- Prior art keywords
- packet
- priority
- unit
- voice
- packet processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 38
- 238000001514 detection method Methods 0.000 claims abstract description 8
- 238000000034 method Methods 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims 2
- 230000006870 function Effects 0.000 description 17
- 238000004891 communication Methods 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 8
- 239000006185 dispersion Substances 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 101100172132 Mus musculus Eif3a gene Proteins 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000003139 buffering effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Abstract
【解決手段】時間的に連続して供給される音声データの系列を部分系列に分割し、部分系列ごとに所定のパケットに収容して送信するパケット処理装置において、前記音声データの値の時間変化が示す音声波形の周期を検出する周期検出部と、当該周期検出部が周期を検出し始めたときの前記部分系列には高い優先度を付与し、この周期に応じた相似波形を持つ後続の部分系列には低い優先度を付与する優先度付与部と、当該優先度付与部により高い優先度を付与された部分系列を収容するパケットのヘッダ部分には高い優先度に応じた優先度情報を記述し、低い優先度を付与された部分系列を収容するパケットのヘッダ部分には低い優先度に応じた優先度情報を記述するヘッダ生成部とを備える。
【選択図】 図1
Description
【発明の属する技術分野】
本発明はパケット処理装置に関し、例えば、VoIP(Voice over IP)のためのIPパケットを処理する場合などに適用して好適なものである。
【0002】
【従来の技術】
VoIPでは、コーデックで数値化された音声データを10〜200バイト毎に分割し、分割後の音声データにUDPヘッダおよびIPヘッダを付加して構成される「音声パケット」によりIPネットワーク上で音声を伝送する。ここでの10〜200バイトという分割サイズの幅は使用機器や設定に依存して決まるものであり、リアルタイム性を重視する場合は小さいサイズでの分割を選択し、伝送路の使用効率を重視する場合は大きいサイズでの分割を選択する。通常、運用中においてはこの分割サイズは固定である。
【0003】
IPネットワーク上では音声以外のデータも、音声と同じネットワーク機器(ルータなど)で中継され、音声と同じ伝送路を利用して伝送されるため、回線の容量に対してトラヒックが多い場合にはルータ上での待ち時間が発生する。この待ち時間はトラヒックの状況によって刻々と変動するため、送信側では一定周期でパケットを送出していても受信側にパケットが到着する周期は一定とならない現象、すなわち伝送遅延の「ゆらぎ」が発生する。受信側では、ゆらぎ吸収バッファにある程度の音声データを一旦バッファリングすることで音声の再生が一定の速度で行えるようにしている。
【0004】
【非特許文献1】
「日経コミュニケーション」2000年6月5日号(71頁〜89頁)
【0005】
【発明が解決しようとする課題】
ところで、前記ゆらぎ吸収バッファに音声パケットが書き込まれる速度と読み出される速度がほぼ等しければ、図4に示すように、通話の継続中には、ゆらぎ吸収バッファにおける音声パケットの蓄積量はほぼ一定量を維持し高い音声品質を維持することができるが、VoIPでは、遅延ゆらぎ(ジッタ)の大きさがゆらぎ吸収バッファの容量を超えることがある。
【0006】
この場合、図2(A)に示すように、パケットのオーバーフローが発生して、本来、時系列に受信されるはずの音声パケットのうち一部の音声パケットが喪失する(破棄される)。ルータ上で設定された帯域を音声データが超えてしまった場合(キュー則がLLQの時)等にも、同様な音声パケットの喪失が発生する。このような音声パケットの喪失が発生すると、受信・再生側では、音声データが欠損し、音声が「ブツブツ」と途切れて聴取され、音声品質が低下する。
【0007】
ゆらぎ吸収バッファの容量を大きくすれば、オーバーフローを防止でき、途切れを防止することができるものの、バッファでの遅延量が長くなってしまう。会話音声などでは、リアルタイム性が重要であるため、この遅延量に起因する音声品質の低下も問題であり、ゆらぎ吸収バッファの容量を無闇に大きくすることも好ましくない。
【0008】
また、一旦ゆらぎ吸収バッファ内にバッファリングした音声パケットが枯渇(アンダーフロー)してしまうと、図2(B)に示すようにその後パケットの受信速度が回復した時にバッファリングしているデータ量の平均値が高くなってしまい、オーバーフローが発生し易い状態になる。この状態ではまた、バッファでの遅延量も通常より大きくなってしまう。
【0009】
これは、到着が遅れて前記アンダーフローを招いた音声パケットが、そのあと短時間のうちに次々と到着し、アンダーフロー直後の単位時間における受信パケット数が、通常よりも多くなるためである。
【0010】
【課題を解決するための手段】
かかる課題を解決するために、第1の発明では、時間的に連続して供給される音声データの系列を部分系列に分割し、部分系列ごとに所定のパケットに収容して送信するパケット処理装置において、(1)前記音声データの値の時間変化が示す音声波形の周期を検出する周期検出部と、(2)当該周期検出部が周期を検出し始めたときの前記部分系列には高い優先度を付与し、この周期に応じた相似波形を持つ後続の部分系列には低い優先度を付与する優先度付与部と、(3)当該優先度付与部により高い優先度を付与された部分系列を収容するパケットのヘッダ部分には高い優先度に応じた優先度情報を記述し、低い優先度を付与された部分系列を収容するパケットのヘッダ部分には低い優先度に応じた優先度情報を記述するヘッダ生成部とを備えたことを特徴とする。
【0011】
また、第2の発明では、請求項1のパケット処理装置から送信されたパケットを受信又は中継する側のパケット処理装置において、受信した前記パケットを一時的に記憶するバッファ部と、当該バッファ部に記憶しているパケットを廃棄するときには、当該パケットのヘッダ部分に記述されている優先度情報の示す優先度が低いパケットから先に廃棄するパケット廃棄制御部とを備えたことを特徴とする。
【0012】
これにより、音声データの部分系列を収容したパケット相互間で優先制御を行うことができる。
【0013】
【発明の実施の形態】
(A)実施形態
以下、本発明にかかるパケット処理装置の実施形態について説明する。
【0014】
本実施形態は、音声の母音成分が受信側で合成可能である点に着目して、オーバーフローの発生そのものを制御するとともに、オーバーフロー発生時の音声品質低下を抑制することを特徴とする。
【0015】
人間の発する音声は一般に、子音成分と母音成分が時間軸方向に結合されたものであり、この点は、どの国(あるいは、どの民族)の言語でも同じであると考えられるが、特に日本語は母音の割合が多い言語の一つである。例えば、「東京」を「TOKYO」と、「青(あお)」を「AO」などとローマ字で表記すれば明らかなように、日本語では母音の直後に母音がつづくことはあっても、英語などに多くみられるように子音の直後に子音がつづくことはほとんど無く、子音のあとには通常、母音がつづくからである。
【0016】
(A−1)実施形態の構成
本実施形態の通信システム10の全体構成例を図10に示す。
【0017】
図10において、当該通信システム10は、IP網11と、IP電話機12,13とを備えている。
【0018】
このうちIP網11は、OSI参照モデルのネットワーク層のプロトコルとしてIPプロトコルを使用するネットワークであればどのようなネットワークであってもよく、例えば、インターネットなどにも置換可能であるが、ここでは特定の通信事業者が構築、運営して、ユーザに提供するネットワークであるものとする。このようなIP網はIPプロトコルを用いた通信を行う点でインターネットと同じであるが、通信事業者の用意する設備などに応じて、通信品質を保証することができる点が相違する。
【0019】
当該IP網11は、必要に応じて、インターネットと接続したり、既存の加入電話網と接続することもできる。
【0020】
このIP網11を介してIP電話機12と13が接続されている。IP電話機12,13はVoIPに対応した機能を内蔵した電話機である。
【0021】
IP電話機は、通常、通信事業者が提供するIP電話サービスを利用するユーザ企業の拠点内に設置され、その各拠点が通信事業者の提供するIP網11によって接続される形になる。当該拠点のLAN(ローカルエリアネットワーク)内には、ルータや、DNSサーバなどの図示しない各種のサーバやネットワーク機器が設置され、IP電話機はこれらの機能を利用して通信を行う構成となるのが普通である。
【0022】
同一拠点(すなわち、同一LAN)内に配置されたIP電話機間で通話を行うこともあり得るが、ここでは、IP電話機12と13は別個の拠点に配置されているものとする。
【0023】
IP電話機の外観には様々なものがあり、一般電話機と同様な外観を持つもの、パーソナルコンピュータにスピーカやマイクなどを装着してIP電話機として機能できるようにしたもの、PDA端末のような外観を持つもの等がある。
【0024】
IP電話機が通信する音声データ(やビデオデータ)は、ダウンロードしながら再生するストリーム型データに属する。
【0025】
IP網11を介して接続されたIP電話機12、13は、例えば、IP電話機12を操作するユーザU2とIP電話機13を操作するユーザが会話を行うために利用される。したがって、IP電話機12と13は音声データを収容したIPパケット(すなわち、音声パケット)を双方向にやり取りすることが必要で、それぞれ、送信機能と受信機能を搭載しているが、以下では、主として、IP電話機12を操作するユーザU2が発話し、IP電話機13を操作するユーザU3がその音声を聴取する場合について説明する。これは、ユーザU2の発話に基づく音声データを収容した音声パケットPKがIP電話機12から送信され、当該音声パケットPKが、IP網11経由でIP電話機13に受信される場合である。
【0026】
このうち送信側のIP電話機12の内部構成例を図1に示す。
【0027】
(A−1−1)送信側IP電話機の内部構成例
図1において、当該IP電話機12は、LANインタフェース部20と、パケット化処理部21と、コーデック(CODEC)部22と、マイク(送話器)23と、データ分割部24と、無音判定部25とを備えている。
【0028】
このうちLANインタフェース部20は、OSI参照モデルの物理層からデータリンク層に関するプロトコルを処理する部分で、具体的には、LANカード(LANアダプタ)などに相当する。本実施形態では、物理層のプロトコルは特に限定する必要はない。必要に応じて、電気信号を利用したり光信号を利用することも可能であり、無線伝送路を利用することも有線伝送路を利用することも可能である。同様に、データリンク層のプロトコルについても限定する必要はないが、CSMA/CDなどに対応するイーサネット(登録商標)が利用されることが多い。
【0029】
パケット化処理部21は、前記データ分割部24から供給される各分割音声データDA1に対し、1つずつIPヘッダ(ここでは、IPv4ヘッダ)を付加して音声パケットPKを生成する部分である。
【0030】
ただし音声パケットPKは、基本的に、IPヘッダと、音声データのみから構成されるものではない。VoIPでは、再生の同期を取ったり、遅延の大きなパケットを廃棄したりするために、通常、OSI参照モデルのトランスポート層のプロトコルとしてUDPやRTPを使用するが、その場合には、UDPヘッダや、RTPヘッダなどが、前記音声データに付加されたものに対し、さらに上述したIPヘッダが付加されて、前記音声パケットPKが構成されることになるためである(もっとも、IP網11上で中継処理などに利用されるのは、IPヘッダだけである)。
【0031】
このようにして構成された音声パケットPKは、当該パケット化処理部21から前記LANインタフェース部20に渡され、LANインタフェース部20からIP網11へ送出される。データリンク層でCSMA/CDを用いる場合には、当該LANインタフェース部20において、音声パケットPKにMACヘッダが付加されてMACフレームとして送信されることになる。
【0032】
もっとも、MACヘッダの内容はルータを越えて伝送されることはないから、他の拠点に存在する受信側のIP電話機13までは届かない。
【0033】
前記マイク23は、ユーザU2が発声した音声を集音し、アナログの電気信号(音声信号)MA1に変換する部分である。
【0034】
コーデック部22は、当該音声信号MA1を所定のサンプリング周波数でサンプリングして符号化を行い、符号化音声信号(音声データ)CA1を生成する部分で、生成した当該音声データCA1はデータ分割部24と無音判定部25に供給する。音声信号MA1の符号化方式としては、通常、PCM方式が用いられる。
【0035】
通常、電話で使われるCODECでは、サンプリング周波数として、8KHzを使用するが、後述する相似形検索の精度を高めるために、(前段に4KHz以上をカットするLPF(ローパスフィルタ)を置いた上で)48KHzサンプリングのCODEC(オーディオ用途)を使用しても良い。
【0036】
なお、必要に応じて、音声データを圧縮(圧縮符号化)して伝送するデータ量を削減することも可能であるが、圧縮すると一般に音声データCA1が示す波形が分からなくなりデータ分割部24で実行する相似形検索の実行が困難となるため、圧縮符号化を行う場合には、データ分割部24とパケット化処理部21のあいだで行うようにするとよい。
【0037】
無音判定部25は、供給を受けた音声データCA1が、有効な音声データを有する有音区間に対応するものであるか、有効な音声データを有しない無音区間に対応するものであるかを判定する部分で、判定結果を示す無音判定信号DS1は、前記データ分割部24に供給する。無音判定部25が行う判定には音声信号の特性を利用した既存のアルゴリズムを使用可能であるが、基本的に、無音判定信号DS1が有音区間を示すとき、音声データCA1には主にユーザU2が発声した音声が十分に大きな振幅(音声レベル)で含まれており、無音判定信号DS1が無音区間を示すときには、音声データCA1には小さな振幅の雑音などが含まれているだけである。
【0038】
データ分割部24は、受信側のIP電話機13でオーバーフローの発生頻度を低減したり、オーバーフロー発生時の音声品質低下を抑制するために中心的な役割を果たす部分で、前記相似形検索を実行し、当該相似形検索の結果を利用して前記分割音声データDA1を生成する。
【0039】
分割音声データDA1は、時間軸上で分割されている点を除き、前記音声データCA1と同じである。当該分割音声データDA1は、母音成分だけを含む場合と、母音成分以外の音声データだけを含む場合に分けることができる。このうち母音成分以外の音声データとしては、有効な子音成分のほか、雑音など(前記無音区間に対応)もあり得る。もちろん、必要ならば、子音成分と母音成分を同じ分割音声データDA1に収容することも可能である。
【0040】
受信側のIP電話機13で行う再生の際の音声品質の観点でみると、有効な子音成分は重要で不可欠な音声成分であるが、母音成分や雑音などの重要度は、当該子音成分に比べて低い。例えば、前記オーバーフローが発生するような状況において、子音成分が失われると、音声品質を大きく低下させることになるが、母音成分や雑音などが失われても、音声品質はそれほど低下しない。
【0041】
ただし、母音成分や雑音でも、完全に失われてしまうと、音声品質に与える影響は必ずしも小さくないため、本実施形態では、この点に関しても配慮する。
【0042】
相似形検索は、音声波形の母音成分が、例えば、図3に示すように、特定の波形パターンの周期的な繰り返し(例えば、図3では、それぞれ半周期だけ表示された両端部分の波形を合わせて1周期とみると、全部で、12周期分が表示されている)である点に着目し、母音成分に対応する音声データCA1を検出するための処理である。
【0043】
この相似形検索は、例えば、最も新しい波形パターンを検索の基準となる基準波形パターンとし、この基準波形パターンよりも過去の波形パターンを検索の対象となる対象波形パターンとした上で、対象波形パターンの近い過去から遠い過去へ向かって、順次、基準波形パターンと比較して行き、対象波形パターンのなかから基準波形パターンと良好に一致する波形パターンを検出する処理である。基準波形パターンと良好に一致する波形パターンを検出できれば、検出できた波形パターンから当該基準波形パターンに至る区間に波形パターンの繰り返し、すなわち、母音成分(の1周期)が存在することがわかる。
【0044】
必要ならば、基準波形パターンを最も新しい波形パターンとしなくてもよいが、継続していた音声の終了部分などからも、良好に母音成分を検出するためには、最も新しい波形パターンを基準波形パターンとするのが効率的であると考えられる。
【0045】
また、基準波形パターンや対象波形パターンの時間的な長さをどの程度にするかは、音声の特性を考慮して決定すればよい。
【0046】
基準波形パターンや対象波形パターンの時間的な長さは、一定の時間間隔でサンプリングし、1サンプル当たりのビット長が固定されているという一般的な前提のもとでは、それぞれのデータ(波形パターン)のサイズに対応する。図5〜図9の例では、基準波形パターン(S(n)〜S(n−19))を20バイトとし、対象波形パターン(S(n−20)〜S(n−99))を80バイトとしている。
【0047】
基準波形パターンと対象波形パターンの比較を具体的にどのようにして実行するかにもよるが、十分な精度を得るためには、基準波形パターンのサイズや、対象波形パターンのサイズは、実際にユーザU2から発声される音声における母音成分の波形パターンの1周期に比べて、小さくなりすぎないようにすることが必要であると考えられる。もっとも、IP電話機12に搭載することのできる記憶資源の容量にも上限があるため、これらのサイズを無闇に大きくすることは困難である。
【0048】
この1周期は、男性の声の場合で53〜80バイト、女性の声の場合で26〜37バイト程度(男性の声の基本波周波数が100〜150Hz、女性の声の基本波周波数を220〜300Hzとして計算。ただし、この周波数範囲は文献によっては50〜400Hzとしているものも有る。)であるから、図5〜図9に示すように基準波形パターンが20バイト、対象波形パターンが80バイトであれば、ほぼ十分であると考えられる。
【0049】
もちろん必要ならば、基準波形パターンのサイズや対象波形パターンのサイズとして、これら以外のサイズを利用してもよいことは当然である。
【0050】
この相似形検索により例えば母音成分を検出し、子音成分、母音成分、雑音などが含まれた時系列な音声データCA1を分割して当該母音成分だけを含む分割音声データDA1を生成することができる。当該IP電話機12から母音成分(DA1)だけを収容した音声パケット(例えば、PK2、PK3)を送信すれば、受信側のIP電話機13では、前記オーバーフローが発生しそうなときに例えば母音成分を収容した音声パケット(例えば、PK3)を優先的に破棄することで、オーバーフローの発生を防止することが可能となる。
【0051】
また、母音成分は特定の波形パターンの繰り返しであるから、例えば、連続して繰り返されている波形パターンの最初の1または複数周期分だけを収容した音声パケットの音声データを復号(再生)し、該当する時間(母音継続時間)だけその復号結果を出力しつづければ、後続の周期の母音成分を収容した音声パケットは破棄しても、ユーザU2が発声した元の音声にほぼ忠実な音声をユーザU3に聴取させることが可能である。もしくは、母音成分パケットが欠損していても、その後続のパケットをつめて再生することによって、母音継続時間は短くなるがノイズの発生にはならず、音声品質が保たれる。したがって、音声パケットの破棄を実行した場合でも、音声品質はほとんど劣化することがない。
【0052】
反対に、子音成分を収容した音声パケット(例えば、PK1など)は、このような処理が困難であるため、受信側のIP電話機13でオーバーフローが発生しそうなときでも破棄しない。
【0053】
なお、前記母音継続時間を受信側のIP電話機13に伝えることが困難であれば、新たな子音成分が到着するまで、または、予め設定した一定の時間が経過するまでの時間を、当該母音継続時間として利用することができる。あるいは、この母音継続時間を決定するためには、その子音成分を収容していた音声パケットPKのヘッダ(例えば、RTPヘッダ)に記述されたタイムスタンプなども利用することが可能である。
【0054】
従来から、VoIPでは、音声パケットに対し、音声以外のデータを収容したIPパケットよりも優先的に帯域を割り当てる等の優先制御は実行していたが、本実施形態では、音声パケット相互間でも、優先制御を実行することが可能となる。
【0055】
このような優先制御を受信側のIP電話機13のバッファ34(図11参照)におけるキューイングに関して実行するため、データ分割部24では、分割音声データDA1とともに、各分割データDA1の優先度を示す優先順位値PR1を、パケット化処理部21に渡す。
【0056】
優先順位値PR1は、前記子音成分に対応する分割音声データDA1が最も高い優先度で、母音成分や雑音などに対応する優先度がそれより低い優先度となるように設定する。
【0057】
また、2段階以上の優先度の設定が可能な場合には、連続する母音成分を複数の分割音声データDA1に分割し、そのうち最初の分割音声データDA1の優先度は相対的に高く、後続の分割音声データDA1の優先度は相対的に低くなるように優先順位値を設定することも望ましい。例えば、連続する母音成分をその波形パターンの1周期ごとに分割して分割音声データDA1とするようにしてもよい。
【0058】
このような優先順位値の設定により、受信側のIP電話機13では、前記オーバーフロー時において母音成分に関する音声データも得ることができる可能性が高まり、以降は、前記母音継続時間が経過するまで(新たな子音成分が到着するまで、または、予め設定した一定の時間が経過するまでの時間などであってもよい)、当該母音成分の出力を継続することができる。
【0059】
雑音に関しても、当該母音成分と同様な処理を実行することが可能である。雑音(無音区間)も、必ずしも音声の品質にまったく寄与していないわけではないからである。
【0060】
ただし、連続する母音成分の最初の部分は、子音成分と同じ分割音声データDA1に振り分けるようにし、復号側で、当該分割音声データDA1の末尾の母音成分の出力を必要に応じて継続するようにすれば、最初の母音成分だけを独立した分割音声データDA1とする必要はない。
【0061】
また、母音成分に対応しない音声データCA1が子音成分に対応するものであるか、雑音に対応するものであるかは、前記無音判定部25から供給される無音判定信号DS1の値をもとに、データ分割部24で認識することが可能である。すなわち、母音成分でなく、無音判定信号DS1が無音区間を示している場合には、雑音(無音区間)であると認識でき、母音成分でなく、無音判定信号DS1が有音区間を示している場合には、子音成分であると認識することができる。
【0062】
当該優先順位値PR1と、対応する分割音声データDA1を受け取ったとき、前記パケット化処理部21は、当該分割音声データDA1に付加するヘッダ(例えば、IPヘッダ)の該当するフィールド(IPヘッダの場合には、TOSフィールド)に、当該優先順位値PR1を記述することになる。
【0063】
この場合、TOSフィールドに記述された優先順位値PR1は、受信側のIP電話機13だけでなく、音声パケットPKが伝送される経路上のルータによっても参照され中継処理に利用されることが望ましい。ルータにおける輻輳時など、優先順位値PR1の示す優先度が低い音声パケットから順番に破棄するほうが、音声品質を高く維持する上で好ましいからである。
【0064】
現在のところ、インターネット上のルータなどは、TOSフィールドの記述を無視するように実装されているのが普通であるが、IP網11内のルータは前記通信事業者が設置し、運用するものであるから、TOSフィールドの記述を参照して中継するように設定、実装することは容易である。
【0065】
一方、IP網11経由で当該音声パケットPKを受信するIP電話機13の内部構成例は、図11に示す通りである。
【0066】
(A−1−2)受信側IP電話機の内部構成例
図11において、当該IP電話機13は、LANインタフェース部30と、パケット抽出部31と、コーデック部32と、スピーカ(受話器)33と、バッファ34と、バッファ制御部35と、母音合成部36とを備えている。
【0067】
このうちLANインタフェース部30は前記LANインタフェース部20に対応し、パケット抽出部31は前記パケット化処理部21に対応し、コーデック部32は前記コーデック部22に対応し、スピーカ33は前記マイク23に対応するので、その詳しい説明は省略する。
【0068】
ただしIP電話機13は受信側であるから、これらの構成要素30〜33は、音声パケットPKを受信して当該音声パケットPKに収容された音声データ(分割音声データDA1)に応じた音声を出力するために機能することは当然である。
【0069】
すなわち、LANインタフェース部30はIP網11から音声パケットPKを受信するために機能し、パケット抽出部31は受信側のIP電話機13が配置されているLAN内のMACフレームからMACヘッダを除去して前記音声パケットPKを抽出するために機能し、コーデック部32は復号を行い、スピーカ33は音声出力を行う。
【0070】
なお、パケット抽出部31から出力された音声パケットPKの構成要素のうち、最終的に復号されてスピーカ33からの音声出力に利用されるのは、分割音声データDA1だけであるから、実装によっては、バッファ34内に分割音声データDA1だけを蓄積してキューイングすること(この場合、ヘッダは別にキューイングしてヘッダと分割音声データの対応関係を管理することになる)も可能であるが、ここでは、ヘッダが付加された状態の音声パケットPKをバッファ34でキューイングするものとする。
【0071】
音声パケットPKに含まれるヘッダには、前記IPヘッダ、UDPヘッダ、RTPヘッダがあり得るが、本実施形態における受信側のIP電話機13では、IPヘッダに基づいた処理が重要である。
【0072】
バッファ34は上述したゆらぎ吸収バッファに相当する構成要素である。
【0073】
バッファ制御部35はバッファ34の状態を監視し、必要なときに母音成分を収容した音声パケット(例えば、PK3)や雑音を収容した音声パケットを優先的に破棄する部分である。
【0074】
これらの音声パケット(例えば、PK3)の破棄が必要となるのは、バッファ34においてオーバーフローが発生しそうなときである。実際にオーバーフローが発生してから当該破棄を行ってもかまわないが、その場合、オーバーフローによって重要な前記子音成分を収容した音声パケットPKが失われる可能性もあるため、オーバーフローの発生を予測(オーバーフロー予測)し、オーバーフローが実際に発生する前に当該破棄を行うことが望ましい。
【0075】
オーバーフロー予測の実現法には様々な方法が考えられる。例えば、バッファ34に蓄積された音声パケットPKの総データ量が予め設定したバッファ用しきい値を越えたときにオーバーフローが発生するものと予測するようにしてもよく、図2(B)に示したアンダーフローが発生したときにオーバーフローが発生するものと予測するようにしてもよい。また、音声パケットPKによって構成されるキュー(待ち行列)の伸長する速度を監視してオーバーフロー予測に反映させることも考えられる。
【0076】
なお、当該バッファ用しきい値としては、例えば、図2(A)および(B)や、図4に示した基準値NV1を利用することができる。
【0077】
ただし当該オーバーフロー予測に基づいて、母音成分などを収容した音声パケット(例えば、PK3)を選択的に、かつ容易に破棄することができるのは、送信側のIP電話機12で、音声パケットPKに含まれるIPヘッダのTOSフィールドに前記優先順位値PR1を記述してあるからである。
【0078】
バッファ制御部35はまた、連続する母音成分を分割して得られる複数の分割音声データDA1を収容した複数の音声パケット(例えば、PK2,PK3)のうち、最初の分割音声データを収容した音声パケットPK2から当該母音成分に対応する分割音声データDA1だけを選出して母音合成部36に供給する機能を備えている。
【0079】
母音合成部36は当該分割音声データDA1をバッファ制御部35から受け取ったときには、当該分割音声データDA1に基づいて、前記母音継続時間のあいだ母音成分の合成音声信号SA1を出力する部分である。コーデック部32は、当該合成音声信号SA1の供給を受ける間、当該合成音声信号SA1に応じた復号信号KA1を出力する。
【0080】
以下、上記のような構成を有する本実施形態の動作について説明する。
【0081】
上述した基準波形パターンと対象波形パターンの比較(相似形検索)は、ここでは、分散を利用して実行する。
【0082】
(A−2)実施形態の動作
所定の呼設定プロトコルを利用してIP電話機12からIP電話機13へ発呼し、またはこれと反対にIP電話機13からIP電話機12へ発呼して、呼設定が行われ、ユーザU2とU3のあいだの通話(会話)が開始されたものとする。
【0083】
通常、会話は双方向で行われるものであるが、ここでは、上述したように、ユーザU2が発話した内容をユーザU3が聴取する場合に注目する。
【0084】
このとき、ユーザU2が発話した音声に応じた前記音声信号MA1がマイク23からコーデック部22に供給され、前記音声データCA1がデータ分割部24と、無音判定部25に供給される。
【0085】
図5に示したS(n)〜S(n−99)のそれぞれはサンプル値を示し、S(n)は現時点のサンプル値であり、S(n−1)は現時点より1サンプル前のサンプル値であり、S(n−2)は現時点より2サンプル前のサンプル値であり、…、S(n−99)は現時点より99サンプル前のサンプル値である。
【0086】
このうち左端の1列R0は、S(n)〜S(n−19)の20サンプルから構成されているが、残りの60列R1〜R61は、1列が20サンプルから構成される点は当該列R0と同じであるが、各列の構成要素となるサンプルが1サンプルずつ時間的にシフトしている。
【0087】
すなわち、左端から2番目の列R1は、S(n−20)〜S(n−39)の20サンプルから構成され、左端から3番目の列R2は、S(n−21)〜S(n−40)の20サンプルから構成され、左端から4番目の列R3は、S(n−22)〜S(n−41)の20サンプルから構成され、…、左端から62番目(すなわち右端)の列R61は、S(n−80)〜S(n−99)の20サンプルから構成されている。
【0088】
当該列R0が上述した基準波形パターンに対応し、当該列R1〜R61が上述した対象波形パターンに対応する。
【0089】
コーデック部22によってPCM信号に変換されたあとであるため、時系列な音声データCA1は、時間軸上で離散的な情報であるが、時間的に隣接した各サンプル(例えば、S(n)〜S(n−19))の値が示すものは、その時点の音声波形の振幅値であるため、これらの各サンプル値は、アナログ的な音声波形を示しているに等しいとみることができる。
【0090】
図6(A)〜(C)に示すように、コーデック部22から音声データCA1を構成する各サンプル値が1サンプルずつ送られてくると、まず前記基準波形パターンに対応する列R0の20バイトがシフトしながら格納され、そのあと、前記対象波形パターンに対応する各列R1〜R61がシフトしながら1サンプルずつ格納されて行く。
【0091】
この間、S(n)→S(n−1)→S(n−2)→…→S(n−99)の順番で、サンプル値の内容がシフトして行くから、基準波形パターンに対応する列R0内の各サンプル値(例えば、S(n))の値も、対象波形パターンに対応する列R1〜R61の各サンプル(例えば、S(n−20))の値も、その内容は、順次、変化することになる。
【0092】
対象波形パターンに対応する80バイト(オーバーラップする分を重ねてカウントすると、1220バイト)すべてにサンプル値が格納されてから、前記比較(相似形検索)を開始してもよいが、相似形検索を近い過去に対応する列から順番に行うなら、当該80バイトすべてにサンプル値が格納される前に相似形検索を開始することができ、また、そのほうが効率的である。
【0093】
本実施形態では、基準波形パターンに対応する列R0と、対象波形パターンに対応するそれぞれの列(その1つがR1)とを、同じ行のサンプル値のあいだで比を求め、各比について分散を計算するから、対象波形パターン中の左端の列R1の20バイトが満たされた時点で、最初の分散を算出することが可能である。
【0094】
列R0とR1の最上部の行のサンプル値の比R(200)は、S(n)/S(n−20)と表現することができる。
【0095】
最上部から2番目の行から20番目(すなわち最下部)の行についても同様にして、比R(201)〜R(219)を求めることができる。
【0096】
すなわち、2番目の行の比R(201)はS(n−1)/S(n−21)で、3番目の行の比R(202)はS(n−2)/S(n−22)で、4番目の行の比R(203)はS(n−3)/S(n−23)で、…、19番目の行の比R(218)はS(n−18)/S(n−38)で、20番目の行の比R(219)はS(n−19)/S(n−39)である。
【0097】
このあと、当該データ分割部24は、これら20個の比R(200)〜R(219)についての分散V(20)を算出する。
【0098】
同様な処理による比の分散の算出は、基準波形パターンに対応する列R0と対象波形パターンに対応する他の列(例えば、R2)とのあいだでも順次おこなわれ得る。
【0099】
対象波形パターンに対応する隣接する列(例えば、列R1とR2)は、1サンプル分ずれた関係にあるため、この処理により、対象波形パターンの全範囲について漏れなく分散を算出することが可能である。
【0100】
なお、相似形検索の精度をそれほど高くする必要がない場合には、ずれの幅を、当該1サンプルより大きくしてもよい。例えば、隣接する列が2サンプル分ずれた関係にあるようにしてもよい。
【0101】
実際の音声の波形パターンはたとえ連続する母音成分に対応する部分であっても、雑音の混入や周期間のバラツキなども存在し得るため、完全に一致する波形パターンとはならない可能性があるが、図3に画面表示したように、おおむね同じ音声波形パターンが繰り返されるから、例えば、列R0の波形パターンと列R1の波形パターンが母音成分に対応して実質的に一致する場合には、分散の値(ここでは、V(20))は、十分に小さなものとなる。
【0102】
分散の値が所定の分散用しきい値(規定値)よりも小さいことをもって、波形パターンの繰り返しの検出、すなわち、母音成分の1周期の検出としてもよいが、ここでは、さらに、当該分散の値(例えば、V(20))が隣接する分散の値(例えば、V(21))よりも小さいことを条件として追加する。
【0103】
すなわちデータ分割部24は、分散の値(例えば、V(20))が所定の分散用しきい値よりも小さく、なおかつ、当該分散の値が隣接する分散の値(例えば、V(21))よりも小さいときに、母音成分の1周期を検出したものと判断する。
【0104】
より一般的には、分散値V(X)が、所定の分散用しきい値よりも小さく、なおかつ、隣接する分散の値(V(X−1)、V(X+1))よりも小さいときに、母音成分の1周期を検出したものと判断する。このときまた、当該母音成分の1周期は、Xバイトであることもわかる。
【0105】
例えば、図7(A)〜(C)に示すように、列R29の20バイト(すなわち、サンプルS(n−47)まで)が満たされたときに、列R25の分散値V(24)で母音成分の1周期(1周期=24バイト)を検出したときには、データ分割部24は、S(n−43)からS(n−21)までの27バイトの音声データを、1つの分割音声データDA1とし、当該分割音声データDA1に対応する優先順位値PR1をもっとも高い優先度を示す値として、当該DA1とPR1をパケット化処理部21に供給する。
【0106】
この27バイトの分割音声データDA1は、母音成分の周期の開始に対応する部分である。母音成分の周期の開始時(波形の変化時も含む)に対応する部分には、例えば、上述した「TOKYO」の「TO」における「T」のように、子音成分が含まれている可能性が高いからである。
【0107】
ただしこの27バイトのうち最初の3バイトは、子音成分または雑音である可能性が高いため、後続の24バイトとは別な分割音声データDA1となるように分割してもよい。
【0108】
この3バイトが子音成分であるか雑音であるかは、前記無音判定部25が供給する無音判定信号DS1をもとに判断することが可能である。
【0109】
当該27バイトを1つの分割音声データDA1として分割する際、データ分割部24は、当該周期が24バイトであることも分かるから、後の処理のため、周期が24バイトであることを記憶しておく。
【0110】
図7(C)の状態から27バイトを取り出せば、対象波形パターンに対応する領域(列R1〜R61)は空になるため、再度、図8(A)、(B)に示すように、シフトしながらサンプル値が満たされて行く。
【0111】
そして、例えば、図8(C)に示すように、列R26の20バイトが満たされたときに、再び周期を検出したものとすると、データ分割部24は、記憶しておいた前記周期(24バイト)と同じ周期の母音成分が継続しているものと判断することができ、このS(n−44)〜S(n−21)の24バイトに対応する母音成分の分割音声データDA1は、上述した低い優先順位値PR1に対応付けられて、パケット化処理部21へ供給される。
【0112】
なお、図6(A)〜(C)に示すように、列R61の20バイトすべてにサンプル値が格納され、すべての列R61について分散値を求めて処理しても、前記分散用しきい値よりも小さい分散値(であって、隣接する分散値よりも小さい分散値)が得られなかった場合、列R61〜R1の対象波形パターン(80バイト)には、母音成分が含まれていないと推測できるから、当該80バイトを、1つの分割音声データDA1とし、優先順位値PR1とともにパケット化処理部21へ供給する。この優先順位値PR1が、このとき供給される前記無音判定信号DS1の値に応じて、異なる優先度とされることはすでに述べた通りである。
【0113】
このような分割を行わない場合、本実施形態では、IP電話機12から時系列に送信される音声パケットPKのサイズは、大きく変動する可能性がある。この変動は、各分割音声データDA1のサイズが大きく変動するためである。
【0114】
一方、子音成分、母音成分、雑音などに対応する分割音声データDA1を収容した音声パケットPKを、IP網11経由で受信するIP電話機13の内部では、バッファ34に当該音声パケットPKがキューイングされる。
【0115】
キューの長さが短く、当該バッファ34のオーバーフローが予測されないときには、IPヘッダのTOSフィールドに記述された優先順位値PR1が低い優先度を示す音声パケットPKも含め、すべての音声パケットが破棄されることなく、その分割音声データDA1がコーデック部32によって復号され、スピーカ33から音声出力が行われる。
【0116】
これに対し、オーバーフローが予測されたときには、バッファ制御部35は、前記キューの長さが十分に短くなるまで、優先順位値PR1が示す優先度が低い音声パケットPKから順番に破棄する。このとき、雑音や母音成分などの分割音声データDA1を収容した音声パケットPKは早く破棄され、子音成分の分割音声データDA1を収容した音声パケットPKは可能な限り、破棄しない。これにより、スピーカ33から出力される音声の品質は高く維持することができる。
【0117】
(A−3)実施形態の効果
本実施形態によれば、バッファ(34)のオーバーフローが発生するような状況でも、上述した途切れや遅延量の増大による音声品質の劣化が起きる可能性が低いため、音声品質を高く維持することが可能である。
【0118】
なお、同様なバッファのオーバーフローなどはIP電話機(例えば、13)の内部だけでなく、経路途中のルータ等の内部でも輻輳時などに起こり得るが、当該ルータにおける優先制御でも、前記優先順位値(PR1)を利用することができ、この優先制御も、音声品質の維持に寄与する。
【0119】
(B)他の実施形態
上記実施形態では、比(例えば、R(200)など)の計算や、分散値(例えば、V(20)など)の計算などの過程で除算が必要になるが、逐一これらの除算を実行したのでは、計算量が非常に多くなってしまう事が予想される。しかもこの計算は、リアルタイムにやり取りされる音声データに関するものであるから、計算に長時間を要することは許されない。
【0120】
この対策としては、例えば、図9に示すようなROM(リードオンリーメモリ)を利用することがあげられる。
【0121】
このROMには、割る数(除数)を入力する入力端子A15〜A9と、割られる数(被除数)を入力する入力端子A7〜A0と、除算結果に関するデータを出力する出力端子D15〜D0を備えている。当該ROMの内部には、これら入力端子A15〜A0に入力するデータと、出力端子D15〜D0から出力するデータとの対応関係が記憶されているから、逐一、除算を実行しなくても、ROMへのアクセスだけで除算結果に関するデータを得ることが可能となり、計算量の削減や、計算時間の短縮が可能となる。
【0122】
例えば、上述したように、1サンプルあたりのビット長が8ビット固定の場合には、図示したように1MビットのROMに、必要なデータを格納することが可能である。
【0123】
必要に応じて、当該ROMは、その他の記憶手段に置換可能である。
【0124】
また、上記実施形態で使用した図5は、必ずしも記憶領域(データ分割部24内に存在する記憶装置(メモリなど)の記憶領域)上のサンプル値の物理的なマッピングが図示した通りに行われるものであることを意味しない。例えば、物理的には同じサンプル値(例えば、S(n−23))を1つだけ記憶装置に格納し、論理的に図示した通りの関係にあるものとして取り扱うことができれば十分だからである。
【0125】
なお、上記実施形態では、各IP電話機(例えば、12)は、前記送信機能と受信機能の双方を搭載することとなるが、必要ならば、送信機能だけを搭載した通信装置や受信機能だけを搭載した通信装置を用いることも可能である。
【0126】
また、上記実施形態におけるIP電話機の双方または一方は、一般電話機(VoIP非対応の電話機)とVoIPゲートウエイの組に置換することが可能である。
【0127】
一般電話機とVoIPゲートウエイの組は、実質的に、前記IP電話機と同等な機能を持つからである。VoIPゲートウエイを利用する場合、前記バッファ制御部35やデータ分割部24などの機能は、当該VoIPゲートウエイに搭載され得る。
【0128】
また、上記実施形態で、連続する母音成分のうち最初の部分と子音成分を同じ音声パケットPKに収容する場合などには、前記母音合成部36に相当する機能はコーデック部32が備えることとなるため、当該母音合成部36は省略可能である。
【0129】
さらに、上記実施形態では、OSI参照モデルのネットワーク層のプロトコルがIPである場合に本発明を適用したが、ネットワーク層のプロトコルがIP以外の場合にも、本発明を適用できる可能性がある。
【0130】
なお、本発明は日本語のような母音成分の割合が多い言語に適用した場合に特に有利であるが、英語などのような母音成分の割合が少ない言語に適用することも可能であることは当然である。英語など、日本語以外の言語であっても、一般的に、母音成分が皆無ということはないと考えられるので、本発明の適用によって一定の効果を得ることが可能である。
【0131】
以上の説明では主としてハードウエア的に本発明を実現したが、本発明はソフトウエア的に実現することも可能である。
【0132】
【発明の効果】
以上に説明したように、本発明によれば、音声の品質を高めることができる。
【図面の簡単な説明】
【図1】実施形態で使用するIP電話機の送信機能に関する内部構成例を示す概略図である。
【図2】ゆらぎ吸収バッファのオーバーフロー時の動作を示す概略図である。
【図3】母音成分に対応する波形パターンの一例を示す概略図である。
【図4】ゆらぎ吸収バッファの通常時の動作を示す概略図である。
【図5】実施形態の動作説明図である。
【図6】実施形態の動作説明図である。
【図7】実施形態の動作説明図である。
【図8】実施形態の動作説明図である。
【図9】実施形態で計算量を低減するための構成例である。
【図10】実施形態に係る通信システムの全体構成例である。
【図11】実施形態で使用するIP電話機の受信機能に関する内部構成例を示す概略図である。
【符号の説明】
10…通信システム、11…IP網、12,13…IP電話機、20,30…LANインタフェース部、21…パケット化処理部、22,32…コーデック部、23…マイク、24…データ分割部、25…無音判定部、34…バッファ、35…バッファ制御部、36…母音合成部36、PK…音声パケット、CA1…音声データ、DA1…分割音声データ。
Claims (7)
- 時間的に連続して供給される音声データの系列を部分系列に分割し、部分系列ごとに所定のパケットに収容して送信するパケット処理装置において、
前記音声データの値の時間変化が示す音声波形の周期を検出する周期検出部と、
当該周期検出部が周期を検出し始めたときの前記部分系列には高い優先度を付与し、この周期に応じた相似波形を持つ後続の部分系列には低い優先度を付与する優先度付与部と、
当該優先度付与部により高い優先度を付与された部分系列を収容するパケットのヘッダ部分には高い優先度に応じた優先度情報を記述し、低い優先度を付与された部分系列を収容するパケットのヘッダ部分には低い優先度に応じた優先度情報を記述するヘッダ生成部とを備えたことを特徴とするパケット処理装置。 - 請求項1のパケット処理装置において、
前記部分系列が、有効な音声データを有する有音区間に対応するか有効な音声データを有しない無音区間に対応するかを判定する有音無音判定部を備え、
前記優先度付与部は、前記周期検出部が周期を検出しない部分系列については当該有音無音判定部の判定結果を参照し、判定結果が無音区間であることを示す場合には低い優先度を付与し、有音区間であることを示す場合には高い優先度を付与することを特徴とするパケット処理装置。 - 請求項1のパケット処理装置において、
前記周期検出部が、
時間的に連続して供給される音声データの系列に対して、前記周期を検出するための所定の周期検出処理を行い、周期を検出した時点で当該系列を分割することにより、前記部分系列を生成する系列分割部を備えることを特徴とするパケット処理装置。 - 請求項1のパケット処理装置において、
前記周期検出処理では、
所定の基準時点の音声波形を示す部分系列中の各音声データと、当該基準時点より過去のタイムシフトした音声波形を示す部分系列中の各音声データとの比の分散の値を検査することによって、前記周期を検出することを特徴とするパケット処理装置。 - 請求項4のパケット処理装置において、
前記比を算出する際に、除数となる音声データおよび被除数となる音声データのビットパターンと、当該ビットパターンに対応付する比の値のビットパターンを記憶した第1の記憶変換部を備えたことを特徴とするパケット処理装置。 - 請求項4のパケット処理装置において、
前記分散の値を算出する際の基礎となる比の値のビットパターンと、当該ビットパターンに対応する分散の値のビットパターンを記憶した第2の記憶変換部を備えたことを特徴とするパケット処理装置。 - 請求項1のパケット処理装置から送信されたパケットを受信又は中継する側のパケット処理装置において、
受信した前記パケットを一時的に記憶するバッファ部と、
当該バッファ部に記憶しているパケットを廃棄するときには、当該パケットのヘッダ部分に記述されている優先度情報の示す優先度が低いパケットから先に廃棄するパケット廃棄制御部とを備えたことを特徴とするパケット処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003167335A JP4130612B2 (ja) | 2003-06-12 | 2003-06-12 | パケット処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003167335A JP4130612B2 (ja) | 2003-06-12 | 2003-06-12 | パケット処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005006050A true JP2005006050A (ja) | 2005-01-06 |
JP4130612B2 JP4130612B2 (ja) | 2008-08-06 |
Family
ID=34093165
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003167335A Expired - Fee Related JP4130612B2 (ja) | 2003-06-12 | 2003-06-12 | パケット処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4130612B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007258928A (ja) * | 2006-03-22 | 2007-10-04 | Fujitsu Ltd | ゆらぎ吸収バッファ制御装置 |
JP2008042412A (ja) * | 2006-08-03 | 2008-02-21 | Pioneer Electronic Corp | コードレス電話機 |
KR101447666B1 (ko) * | 2012-12-27 | 2014-10-07 | 국방과학연구소 | 음성 트래픽의 중요도를 고려한 적응적 버퍼 관리 방법 및 이의 저장 매체 |
US20150266028A1 (en) * | 2012-10-26 | 2015-09-24 | Ballard Power Systems Inc. | Fuel cell membrane electrode assembly fabrication process |
WO2016088582A1 (ja) * | 2014-12-04 | 2016-06-09 | ソニー株式会社 | データ処理装置、データ処理方法、及び、プログラム |
US9961005B2 (en) | 2013-03-12 | 2018-05-01 | Panasonic Intellectual Property Management Co., Ltd. | Bus system and computer program |
-
2003
- 2003-06-12 JP JP2003167335A patent/JP4130612B2/ja not_active Expired - Fee Related
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007258928A (ja) * | 2006-03-22 | 2007-10-04 | Fujitsu Ltd | ゆらぎ吸収バッファ制御装置 |
JP4744332B2 (ja) * | 2006-03-22 | 2011-08-10 | 富士通株式会社 | ゆらぎ吸収バッファ制御装置 |
JP2008042412A (ja) * | 2006-08-03 | 2008-02-21 | Pioneer Electronic Corp | コードレス電話機 |
US20150266028A1 (en) * | 2012-10-26 | 2015-09-24 | Ballard Power Systems Inc. | Fuel cell membrane electrode assembly fabrication process |
KR101447666B1 (ko) * | 2012-12-27 | 2014-10-07 | 국방과학연구소 | 음성 트래픽의 중요도를 고려한 적응적 버퍼 관리 방법 및 이의 저장 매체 |
US9961005B2 (en) | 2013-03-12 | 2018-05-01 | Panasonic Intellectual Property Management Co., Ltd. | Bus system and computer program |
CN107005591A (zh) * | 2014-12-04 | 2017-08-01 | 索尼公司 | 数据处理设备、数据处理方法及程序 |
JPWO2016088582A1 (ja) * | 2014-12-04 | 2017-09-21 | ソニー株式会社 | データ処理装置、データ処理方法、及び、プログラム |
WO2016088582A1 (ja) * | 2014-12-04 | 2016-06-09 | ソニー株式会社 | データ処理装置、データ処理方法、及び、プログラム |
CN107005591B (zh) * | 2014-12-04 | 2020-07-28 | 索尼公司 | 数据处理设备、数据处理方法及程序 |
JP2020120379A (ja) * | 2014-12-04 | 2020-08-06 | ソニー株式会社 | 情報処理装置、情報処理方法、及び、プログラム |
US10764782B2 (en) | 2014-12-04 | 2020-09-01 | Sony Corporation | Data processing apparatus, data processing method, and program |
JP2022024042A (ja) * | 2014-12-04 | 2022-02-08 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、並びにプログラム |
US11284299B2 (en) | 2014-12-04 | 2022-03-22 | Sony Corporation | Data processing apparatus, data processing method, and program |
JP7160168B2 (ja) | 2014-12-04 | 2022-10-25 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、並びにプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4130612B2 (ja) | 2008-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
FI108692B (fi) | Menetelmä ja laite datapakettien prosessoinnin ajoittamiseksi | |
US8363678B2 (en) | Techniques to synchronize packet rate in voice over packet networks | |
US8102766B2 (en) | Method and system for managing time-sensitive packetized data streams at a receiver | |
JP5174182B2 (ja) | 再生遅延推定 | |
US8391175B2 (en) | Generic on-chip homing and resident, real-time bit exact tests | |
US7924711B2 (en) | Method and apparatus to adaptively manage end-to-end voice over internet protocol (VolP) media latency | |
EP2222038A1 (en) | Adjustment of a jitter buffer | |
WO2012141486A2 (en) | Frame erasure concealment for a multi-rate speech and audio codec | |
EP1408679A2 (en) | Multiple data rate communication system | |
JP2006238445A (ja) | 仮想ジッタ・バッファおよび時間スケール修正を使用した、VoiceoverIP通信ネットワークにおいてネットワーク・ジッタを処理する方法および装置 | |
US7769054B2 (en) | Method of conducting a communications session using incorrect timestamps | |
US20050114118A1 (en) | Method and apparatus to reduce latency in an automated speech recognition system | |
JP4130612B2 (ja) | パケット処理装置 | |
WO2002052240A1 (en) | Method and a communication apparatus in a communication system | |
US20090019343A1 (en) | Loss Compensation device, loss compensation method and loss compensation program | |
US20010012993A1 (en) | Coding method facilitating the reproduction as sound of digitized speech signals transmitted to a user terminal during a telephone call set up by transmitting packets, and equipment implementing the method | |
US7299176B1 (en) | Voice quality analysis of speech packets by substituting coded reference speech for the coded speech in received packets | |
US7542465B2 (en) | Optimization of decoder instance memory consumed by the jitter control module | |
US8085803B2 (en) | Method and apparatus for improving quality of service for packetized voice | |
KR20040095652A (ko) | 비등시성 전자 통신 스트림을 생성하기 위해 하나 또는 그이상의 엔코딩된 프레임들의 하나 또는 그 이상의 코드레이트들에 기초하여 등시성 전자 통신 스트림으로부터하나 또는 그 이상의 엔코딩된 프레임들을 제거하는 제어컴포넌트 | |
JP2005266411A (ja) | 音声圧縮方法および電話器 | |
JP2006253843A (ja) | 音声データ補間装置と音声データ補間方法 | |
KR20100034831A (ko) | 사운드 신호의 실시간 보간 장치 및 방법 | |
WO2009078535A1 (en) | Apparatus and method for generating fixed delay of variable-bandwidth multicodec |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060127 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080207 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080520 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080522 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4130612 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110530 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110530 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313115 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110530 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120530 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120530 Year of fee payment: 4 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120530 Year of fee payment: 4 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130530 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140530 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |