JP4419748B2 - 消失補償装置、消失補償方法、および消失補償プログラム - Google Patents

消失補償装置、消失補償方法、および消失補償プログラム Download PDF

Info

Publication number
JP4419748B2
JP4419748B2 JP2004235461A JP2004235461A JP4419748B2 JP 4419748 B2 JP4419748 B2 JP 4419748B2 JP 2004235461 A JP2004235461 A JP 2004235461A JP 2004235461 A JP2004235461 A JP 2004235461A JP 4419748 B2 JP4419748 B2 JP 4419748B2
Authority
JP
Japan
Prior art keywords
unit
periodic signal
erasure
interpolation
periodic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2004235461A
Other languages
English (en)
Other versions
JP2006053394A (ja
Inventor
厚史 田代
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2004235461A priority Critical patent/JP4419748B2/ja
Priority to PCT/JP2005/006850 priority patent/WO2006016439A1/ja
Priority to CNB2005800272467A priority patent/CN100445716C/zh
Priority to US11/659,205 priority patent/US7793202B2/en
Publication of JP2006053394A publication Critical patent/JP2006053394A/ja
Priority to GB0702838A priority patent/GB2435749B/en
Application granted granted Critical
Publication of JP4419748B2 publication Critical patent/JP4419748B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/80Responding to QoS
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0045Arrangements at the receiver end
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2236Quality of speech transmission monitoring

Description

本発明は消失補償装置、消失補償方法、および消失補償プログラムに関し、例えば、音声通話などのリアルタイム通信に適用して好適なものである。
現在、VoIP技術を用いてインターネット等のネットワークを利用した音声通信が盛んにおこなわれている。
インターネットなどの通信品質が保証されていないネットワークを介する通信では、伝送途中でパケットが失われるパケット損失に起因して、本来、時系列に受信されるはずの音声データの一部が欠損する現象(音声消失)が比較的頻繁に発生し得る。音声消失が発生した場合、そのまま復号し復号結果を出力すると、音声の途切れなどが頻発し、音声品質が劣化するが、この劣化に対する補償方法として、例えば、下記の非特許文献1の技術がすでに知られている。非特許文献1は、符号化方式として下記の非特許文献2に記載されたPCM(パルス変調)符号化方式を前提とする。
非特許文献1の技術では、非特許文献2のPCM符号化方式で符号化された音声信号である音声符号化データを復号した復号音声信号(以下、復号結果)を復号結果が記憶可能な機能体(メモリなど)に記憶しておく。その一方で、復号処理単位である音声フレーム(フレーム)毎に音声消失を監視し、音声消失が発生する度に補償処理を実行する。
当該補償処理の動作を、図2(A)〜(E)に示す。
図2(A)において、F1〜F7は時系列に受信されるべきフレームを示している。図2(A)中では、F1が最も早く受信され、F2,F3,…と順次、受信される。ところが、図2(A)の例では、F4〜F6の3フレームが連続して前記パケット損失によって失われたため、この3フレームF4〜F6に対応する3区間で、音声消失が検出される。
図2(B)は、前記メモリに記憶される復号結果を波形で表現したものである。T1,T2,T3のそれぞれが1つの基本周期に対応するため、ここでは、3基本周期分の復号結果が、前記メモリに記憶されることになる。なお、図示の例では、基本周期の長さTは1フレーム分の復号結果よりも短いものとしているが、基本周期の長さTが1フレーム分の復号結果より長くてもかまわない。
図2(C)はフレームF4に対応する区間への補償処理を示し、図2(D)はフレームF5に対応する区間への補償処理を示し、図2(E)はフレームF6に対応する区間への補償処理を示している。
フレームF4に対応する区間での音声消失(最初の音声消失)を検出したとき、図2(C)に示すように、フレームF4の直前にメモリに記憶された1基本周期分の区間Taの復号結果をもとに、音声消失を補償するための補間音声データを生成する。区間Taは前記基本周期T1に対応する区間である。
この1基本周期分では、区間Taの最古側の位置B4を当該補間音声データの開始位置とし、1フレーム分を取得することにより、補間音声データを生成する。ただし図示したように1基本周期が1フレーム分より短い場合には、1基本周期分の復号結果S41を取得しても不足が生じるから、再度、最古側の位置B4へ戻ってこの不足を補うための復号結果S42を取得する。そして、このS41とS42をつなぎ合わせたものを補間音声データとして、前記フレームF4に対応する区間に挿入する。なお、S41とS42の接合部が波形的に連続したものとなるように、重ね合わせ加算などの処理を行う。
フレームF4につづきフレームF5に対応する区間でも音声消失が検出されると、今度は2基本周期分の区間Tbの復号結果をもとに、図2(D)に示すように、音声消失を補償するための補間音声データを生成する。区間Tbは前記基本周期T1およびT2に対応する区間である。
この2基本周期分の区間Tbで、補間音声データの取得を開始する位置B5は次のようにして決定する。すなわち一般的には、前回、図2(C)で取得したS42の終了位置であるE4(S42の右端)を当該位置B5に選ぶが、図示の例のように、E4が区間Tbの最古側1基本周期にある区間T2に含まれていないケースでは、1基本周期Tずつ最古側へ区間T2に入るまで移動させて位置B5を決定する。図示の例の場合、位置E4を1基本周期分、最古側へ移動させた位置がB5に当たる。
このようにして位置B5が決まると、そこから最新側へ1フレーム分(すなわち、位置E5まで)のデータS51,S52を取得することにより、フレームF5に対応する区間に挿入する補間音声データを生成する。図示の例の場合、位置E5を右端とするS52は、区間T1の一部である。
フレームF4、F5につづきフレームF6に対応する区間でも音声消失が検出されると、3基本周期分の区間Tcの復号結果をもとに、図2(E)に示すように、音声消失を補償するための補間音声データを生成する。区間Tcは前記基本周期T1、T2およびT3に対応する区間である。図2(E)でも、図2(D)と同様、補間音声データの取得を開始する位置B6を決定し、そこから1フレーム分のデータS61,S62を取得してフレームF6に対応する区間に挿入するための補間音声データを生成する。
図示の例の場合、位置B6(S61の左端)は前記位置E5から1基本周期分、最古側へ移動させた位置に当たる。
なお、音声消失が複数フレームに渡って連続する場合、2フレーム目以降(図2の場合、F5,F6)では、補間音声データを徐々に減衰させる。例えば、10msにつき20%、線形的に減衰させる。これによって、同一の音声データが連続して音声出力された場合に起きるビープ音などの異音の発生を抑制することができる。
ITU−T勧告G.711 Appendix I ITU−T勧告G.711
ところが、上述した非特許文献1の技術では、ビープ音などの異音の発生を避けるため、音声消失が複数フレームに渡って連続した場合(例えば、60ms以上の連続した音声消失が発生した場合など)における特定期間以降は、無音が出力されることになる。したがって、長期間の音声消失補償が実行できず、柔軟性に欠け、広い意味での通信品質が低いといえる。
また、図2(B)に示したように、3基本周期分の復号結果を記憶できるだけの記憶容量を必要とするため、メモリなどの記憶資源が消費され、効率が低い。なお、後述するように、現実の実装では、3基本周期分以上の復号結果を記憶できるだけの記憶容量が必要になる可能性が高い。
かかる課題を解決するために、第1の本発明では、所定の区間に分割されて時系列に受信される周期性信号の任意の区間で消失が発生したとき、その消失を補償する消失補償装置において、(1)新しく受信された1または複数の区間の周期性信号を所定時間分、記憶する周期性信号記憶部と、(2)前記周期性信号の消失を区間ごとに検出する消失検出部と、(3)当該消失検出部によって消失が検出された場合、その時点で、前記周期性信号記憶部に記憶されている周期性信号をもとに、該周期性信号から算出された異なる基本周期を持つ補間用の複数の要素周期性信号を生成する要素周期性信号生成部とを備え、(4)当該要素周期性信号生成部が生成した複数の要素周期性信号を合成し、その合成結果を、周期性信号の消失が発生した区間に配置することを特徴とする。
また、第2の本発明では、所定の区間に分割されて時系列に受信される周期性信号の任意の区間で消失が発生したとき、その消失を補償する消失補償方法において、(1)周期性信号記憶部が、新しく受信された1または複数の区間の周期性信号を所定時間分、記憶し、(2)消失検出部が、前記周期性信号の消失を区間ごとに検出し、(3)要素周期性信号生成部が、当該消失検出部によって消失が検出されたとき、その時点で、前記周期性信号記憶部に記憶されている周期性信号をもとに、該周期性信号から算出された異なる基本周期を持つ補間用の複数の要素周期性信号を生成し、(4)当該要素周期性信号生成部が生成した複数の要素周期性信号を合成し、その合成結果を、周期性信号の消失が発生した区間に配置することを特徴とする。
さらに、第3の本発明では、所定の区間に分割されて時系列に受信される周期性信号の任意の区間で消失が発生したとき、その消失を補償する消失補償プログラムにおいて、コンピュータに、(1)新しく受信された1または複数の区間の周期性信号を所定時間分、記憶する周期性信号記憶機能と、(2)前記周期性信号の消失を区間ごとに検出する消失検出機能と、(3)当該消失検出機能によって消失が検出された場合、その時点で、前記周期性信号記憶機能に記憶されている周期性信号をもとに、該周期性信号から算出された異なる基本周期を持つ補間用の複数の要素周期性信号を生成する要素周期性信号生成機能とを実現させ、(4)当該要素周期性信号生成機能が生成した複数の要素周期性信号を合成し、その合成結果を、周期性信号の消失が発生した区間に配置することを特徴とする。
本発明によれば、柔軟性を高め、広い意味での通信品質を高めると共に、記憶資源を節約することができる。
(A)実施形態
以下、本発明にかかる受信装置および方法を、VoIPを用いた音声通信に適用した場合を例に、実施形態について説明する。
(A−1)第1の実施形態の構成
本実施形態にかかる通信システム20の全体構成例を図10に示す。
図10において、当該通信システム20は、ネットワーク21と、通信端末22,23とを備えている。
このうちネットワーク21はインターネットであってもよく、通信事業者が提供し、ある程度、通信品質が保証されたIPネットワークなどであってもよい。
また、通信端末22は例えばIP電話機(VoIP対応電話機)のような音声通話をリアルタイムで実行することのできる通信装置である。IP電話機は、VoIP技術を利用し、IPプロトコルを用いるネットワーク上で音声データをやり取りして通話を行うことを可能にする。通信端末23も、当該通信端末22と同じ通信装置である。
通信端末22はユーザU1によって利用され、通信端末23はユーザU2によって利用される。通常、IP電話機ではユーザ間の会話を成立させるために双方向に音声がやり取りされるものであるが、ここでは、通信端末22から音声フレーム(フレーム)を含むIPパケット(パケット)PK11〜PK13などが送信され、これらのパケットがネットワーク21経由で通信端末23に受信される方向に注目して説明を進める。
1フレームの長さに限定はないが、例えば、10msなどであってよい。さらに、符号化方式としてはPCM音声符号化方式を用いるものであってよい。
前記パケットPK11〜PK13に含まれるフレームにはユーザU1が発話した内容(音声情報)を示す音声データが収容されているので、この方向に関する限り、通信端末23は受信処理のみを行い、ユーザU2はユーザU1が発話した音声の聴取のみを行う。なお、1つのパケットに複数のフレームが含まれる構成とすることも可能であるが、ここでは、説明を簡単にするために1つのパケットには1つのフレームが含まれるものとする。
これらのパケットのうちPK11〜PK13のあいだでは送信の順番(これは、受信側における再生出力の順番に対応)が決まっている。すなわち、PK11〜PK13は、PK11,PK12,PK13,…の順番で送信が行われる。
前記パケットがPK11,PK12,PK13,…の順番で送信されると、多くの場合、この順番で欠けることなく全パケットが通信端末23に受信されるが、ネットワーク21上におけるルータ(図示せず)の輻輳などの事象に起因してパケット損失が発生することがある。パケット損失で失われたパケットは、例えば、PK13であってもよい。
当該パケットPK11を前記フレームF2に対応するものとすると、パケットPK12は前記フレームF3に対応し、パケットPK13は前記フレームF4に対応する。このため、例えば、当該パケットPK13がネットワーク21上で失われると、フレームF4が失われ、フレームF4に対応する区間で音声消失が発生する。
本実施形態の特徴は受信側の機能にあるため、以下では、前記通信端末23に注目して説明する。通信端末23の主要部の構成例を図1に示す。前記通信端末22が受信処理を行うためにこれと同じ構成を備えていてよいことは当然である。
(A−1−1)通信端末の構成例
図3において、当該通信端末23は、復号器10と、補償器11と、消失判定器12とを備えている。
このうち復号器10は、当該通信端末23が受信したパケット(例えば、PK11など)ごとにそのパケットから抽出された音声データ(例えば、CD11)を復号し、復号結果(例えば、DC11)を出力する部分である。ここで、当該復号器10による復号処理の単位(処理単位)となるのは、前記フレームである。ここで、パケットPK11から得られる復号結果をDC11、パケットPK12から得られる復号結果をDC12、パケットPK13から得られる復号結果をDC13とする。音声通話が継続し音声消失が発生しなければ、DC13以降の復号結果も得られることは当然である。
なお、個々の音声データを区別する必要がある場合には、CD11〜CD13などの符号を用い、音声データを総称する場合にはCDをその符号として用いる。同様に、個々の復号結果を区別する必要がある場合には、DC11〜DC13などの符号を用い、復号結果を総称する場合にはDCをその符号として用いる。復号結果DCは、1パケットから得られた復号結果(例えば、DC1)の一部を指す場合や、連続する複数パケットから得られた復号結果(例えば、DC1およびDC2)の一部を指す場合もある。
通常、人間が発話する音声には、振幅がランダムに変化する雑音部分と、ほぼ一様な周期で繰り返す周期音部分があり、周期音部分の繰り返し周期のことを基本周期と呼ぶ。したがって、復号結果であるDC11〜DC13からも基本周期を求めることができる。
なお、1つの音声データ(例えば、CD11)は送信側の通信端末22でサンプリングされ符号化された結果として得られたものであるため、そこに含まれるサンプル数は任意に決めることができるが、一例として、160サンプル程度であってもよい。
補償器11は、本実施形態で特徴的な構成要素であり、音声消失が発生したとき、補間を実行する。補償器11の構成および機能の詳細については、後で説明する。
消失判定器12は音声消失の有無を判定する部分で、その判定結果を音声消失情報ERとして出力する。音声消失の有無は様々な方法で判定できる可能性があるが、受信されるべきパケットが受信されなかったことをもって音声消失が起きたと判定することもできる。
その場合、例えば、伝送されてくるパケットに含まれるRTPヘッダなどが持つ、送信側で連番となるように付与したシーケンス番号が欠落している場合や順序が入れ替わりすでに到着したパケットのシーケンス番号より古い番号であった場合に音声消失が発生したと判定する手法や、当該RTPヘッダに含まれる、送信側で付与した送信時刻情報であるタイムスタンプの値をもとに遅延が所定値以上に大きいパケットを受信した時に音声消失が発生したと判定してもよい。また、伝送誤りが検出された場合なども音声消失として扱ってよい。消失判定器12は、復号器10内部でこのような機能を実現することも可能である。
前記補償器11の内部構成は例えば図4に示した通りである。
(A−1−2)補償器の内部構成例
図4において、当該補償器11は、2つの補間機能部35a、35bと、合成部34とを備えている。
このうち補間機能部35aと35bは同じ内部構成を備えている。すなわち、補間機能部35aは、制御部30aと、補間実行部31aと、基本周期算出部32aと、復号結果記憶部33aとを備え、補間機能部35bは、制御部30bと、補間実行部31bと、基本周期算出部32bと、復号結果記憶部33bとを備えている。
ここで、制御部30aは制御部30bに対応し、補間実行部31aは補間実行部31bに対応し、基本周期算出部32aは基本周期算出部32bに対応し、復号結果記憶部33aは復号結果記憶部33bに対応する。このように補間機能部35aの機能と、補間機能部35bの機能は同じなので、以下では、主として、補間機能部35aに注目して説明する。
補間機能部35a内において、制御部30aはハードウエア的にはCPU(中央処理装置)として機能し、ソフトウエア的にはOS(オペレーティングシステム)など制御プログラムとして機能し得る部分である。したがって、当該補間機能部35a内の各構成要素31a〜33aは、当該制御部30aによって制御される。
本実施形態では、まったく同じ内容の復号結果DCの信号列が補間機能部35aと35bに供給されるが、補間機能部35a内で当該復号結果DCを受け取るのが、補間実行部31aである。
補間実行部31aの役割は音声消失が発生していない通常時(後述する正常状態に対応)と、音声消失が発生した消失時(後述する消失補償状態に対応)で相違する。通常時には、復号器10から受け取った復号結果DCを制御部30aと合成部34に供給するだけであるが、消失時には、復号結果DCの信号列中、音声消失によって有効な復号結果DCが存在しない区間に、制御部30aから供給された補間音声データTP1を挿入し、挿入結果も含む信号列を合成部34に供給する。当該補間実行部31aが合成部34に供給する、主として復号結果DCからなる信号列が中間信号V1である。通常時、当該中間信号V1は復号結果DCとまったく同じ内容の信号列であるが、消失時には、音声消失によって有効な復号結果DCが存在しない区間に、前記補間音声データTP1が挿入された信号列となる。
なお、前記消失時は、音声消失が単発的に1フレームでのみ発生した場合と、複数フレームに渡って連続的に発生した場合に細分することができるが、本実施形態が従来に比べて優れた効果を発揮するのは、主として、連続的に発生した場合である。
復号結果記憶部33aは、前記補間実行部31aが制御部30aに供給した復号結果DCを記憶する部分で、揮発性または不揮発性の記憶手段によって構成される。実装にも依存するが、リアルタイム性が重要な音声通話を前提とすると、当該復号結果記憶部33aとしては、高速な読み書きアクセスが可能な高価な記憶手段が用いられる可能性が高い。
復号結果記憶部33aの記憶容量の上限はどのように決めることも自由であるが、ここでは、1基本周期分の復号結果DCを記憶できる容量であるものとする。1基本周期の長さは、その音声の内容に応じて変動するので、厳密に1基本周期分を記憶しようとすると、予め1基本周期の長さが判明しているような特殊なケースを除き、記憶の前にその復号結果の基本周期を算出し、1基本周期分だけを取得して記憶する操作が必要になるし、基本周期の算出のため、1基本周期分以上の復号結果を一時的に記憶する作業用の記憶領域が必要になる可能性が高い。ただしこれは、前記非特許文献1の技術を現実の機器に実装する場合に必ず発生する問題であるため、前記非特許文献1にしたがい、厳密に3基本周期分の復号結果を記憶する場合にも、実際には、記憶の前に基本周期を算出しなければならないし、作業用の記憶領域などに3基本周期分以上の記憶容量が必要になる可能性が高い。なお、一般的には、1基本周期分の復号結果が、1フレームの復号結果の中から得られることもあり、複数フレームにわたる復号結果から得られることもある。
復号結果記憶部33aに、例えば、1基本周期の長さの変動範囲の上限(固定値)に比べて十分に大きな記憶容量を用意しておき、その記憶容量を満たすだけの最新の復号結果を記憶するようにしてもよい。1フレーム分の復号結果DCが前記変動範囲の上限に比べて十分に長い場合には、復号結果記憶部33aは、1フレーム分の復号結果DCを記憶できるだけの記憶容量を持たせるようにすることもできる。また、この場合には、復号結果記憶部33aに記憶する前の基本周期の算出も省略できるため、作業用の記憶領域や計算量の節約にも寄与できる。
記憶容量が1基本周期分(1フレーム分)しかないと、新たなフレームから1基本周期分の復号結果DCを取得するたびに(新たな1フレームが到着するたびに)、前回、記憶した1基本周期分(1フレーム分)の復号結果DCを上書きすること等が必要となり、常時、最も新しい1基本周期分(1フレーム分)の復号結果DCのみが当該復号結果記憶部33aに記憶された状態になる。なお、音声消失が発生した区間では、有効な復号結果DCが供給されないため、復号結果記憶部33a上では、上書きされることなく、直前に記憶された1基本周期分の復号結果DCの記憶が維持される。音声消失が複数フレームに渡って継続した場合も同様である。
消失判定器12が、音声消失が検出された旨の音声消失情報ERを制御部30aに供給してくると、制御部30aはその区間に音声消失が発生していることを認識できるため、復号結果記憶部33a上の記憶を維持するように制御することが可能である。
基本周期算出部32aは、音声消失が発生していない状態から音声消失が発生している状態へ移行した時点で復号音声記憶部32aに記憶されている復号結果DCを用いて、その基本周期を算出する部分である。基本周期は様々な方法で求めることができる可能性があるが、例えば、復号結果記憶部33aに記憶されている復号結果DCから公知の自己相関関数を求め、この自己相関関数が極大となるような遅延量を計算することにより算出することも可能である。
音声消失が発生していない状態から音声消失が発生している状態へ移行するタイミングは、制御部30aが前記音声消失情報ERに基づいて認識することができる。
音声消失情報ERは補間機能部35b内の制御部30bにも供給されているため、補間機能部35bとほぼ同時に、補間機能部35aでも基本周期を求めることができる。本実施形態では、制御部30aが補間実行部31aに供給する前記補間音声データTP1と、制御部30bが補間実行部31bに供給する補間音声データTP2が異なるものとなるようにする必要があるが、復号結果記憶部33aと33bには同じ内容の復号結果DCが記憶されているため、基本周期を求める方法が同じであれば、補間機能部35aで得られる補間音声データTP1と補間機能部35bで得られる補間音声データTP2は同じものになってしまうので、基本周期を相違させるものとする。
同じ内容の復号結果DCから異なる基本周期を得る方法としては、様々なものがあり得るが、本実施形態では、いずれか先に基本周期を算出した側の制御部(例えば、30a)から他方の制御部(例えば、30b)へ算出した基本周期の値を伝え、他方では、その値を除外して基本周期を算出させるものとする。
放置しておくと、ほぼ同時に補間機能部35aと35b内で基本周期の算出が完了する可能性が高いため、いずれか一方で先に算出させ、その算出結果を受け取ったあと、他方に算出させるようにするとよい。いずれが先でもかまわないが、例えば、補間機能部35a側が先で、補間機能部35b側が後としてもよい。
補間機能部35a内の基本周期算出部32aが算出した基本周期をPa、補間機能部35b内の基本周期算出部32bが、当該Paの値を含まない探索範囲のなかから算出した基本周期をPbとする。一例として、基本周期Paの値が5ms〜15msであった場合、基本周期Pbは2.5ms〜Pa(ただし、Pa自体は除外)の間などであってよい。
一般に、音声信号は多数の周波数成分を足し合わせたものであると考えられるため、最も成分の大きい基本周期が前記Pa、次に成分の大きい基本周期が前記Pbとなるようにすることが可能である。したがって、Pbは復号結果記憶部33bに記憶されている復号結果DCの本来の基本周期(本来の基本周期はPa)とは異なるものの、復号結果DCの特徴を反映したものであるといえる。
必要ならば、上述したように制御部30aから30bへ、算出した基本周期Paを伝えるようにしてもよいが、復号結果DCを復号結果記憶部33bに記憶するまえに1基本周期を算出する場合、その値を記憶しておけば、制御部30bは、Paを認識でき、Paと異なる探索範囲のなかから基本周期Pbを探索することが可能である。
合成部34は、補間機能部35a内の補間実行部31aから供給された中間信号V1と、補間機能部35b内の補間実行部31bから供給された中間信号V2に重み係数を付与したあと、合成し、合成結果を最終的な出力音声信号Vとして出力する部分である。中間信号V1に付与する重み係数をα、中間信号V2に付与する重み係数をβとすると、α+β=1.0になるようにするとよい。一例として、α=0.8,β=0.2であってよい。
以下、上記のような構成を有する本実施形態の動作について説明する。
本実施形態において、受信時の通信端末23の動作は、4つに分けることができる。第1は、音声消失が発生することなく、フレームが継続して正常に受信されつづける正常状態に実行される正常動作で、第2は、1フレーム分の音声消失が検出され正常状態から消失補償状態に移行するときに実行される消失移行動作で、第3は、消失補償状態から前記正常状態に移行するときに実行される正常移行動作である。なお、前記消失補償状態は、1フレーム分の音声消失で終了する場合と、複数フレーム分の音声消失が発生する場合に分けることができる。
ここで、正常状態は、直前のフレームおよび現在のフレームが有効に受信され、ともに有効な復号結果DCが得られた状態である。また、消失移行動作は、直前のフレームは受信され有効な復号結果DCが得られたものの、現在のフレームは受信できず、有効な復号結果DCが得られないときに実行される。
前記正常移行動作は、直前のフレームは受信できず有効な復号結果DCが得られなかったものの、現在のフレームは受信でき有効な復号結果DCが得られたときに実行される。なお、複数フレーム分の音声消失が発生する場合、直前のフレームも現在のフレームも受信できず、ともに有効な復号結果DCが得られない。
(A−2)第1の実施形態の動作
ユーザU2が利用する前記通信端末23が、ユーザU1が利用する通信端末22から送信された(フレームを含む)時系列なパケットPK11,PK12,PK13,…を受信することによりVoIP通信が行われ、前記正常動作を実行する通信端末23からユーザU1が発話した音声が出力されるので、ユーザU2はその音声を聴取することができる。
この正常動作が行われているとき、通信端末23内の復号器10では、復号結果DC11,DC12,DC13,…からなる復号結果DCの信号列を出力し、この信号列が補間実行部31a、31bを介して合成部34に供給される。正常動作が実行される正常状態では、前記音声消失が発生しないため、補間実行部31a、31bは、復号器10から受け取った信号列を中間信号V1,V2としてそのまま合成部34へ供給し、合成部34は、合成結果である出力音声信号Vを出力する。ユーザU2が聴取するのは、この通信端末23が出力音声信号Vに対応する音声である。
このときまた、補間実行部31a、31bは、復号器10から受け取った復号結果DCを制御部30a、30bに供給するので、新たに1フレーム分の復号結果DCの供給を受けるたびに、制御部30a、30bは新たな1基本周期分(1フレーム分)の復号結果DCを算出し、算出結果を復号結果記憶部33a、33bに記憶する。復号結果記憶部33a、33bは、1基本周期分(1フレーム分)の復号結果を記憶できるだけの記憶容量しか持たないため、ある1基本周期(1フレーム分)に対応する復号結果(例えば、DC11の一部)の記憶は次の1基本周期(1フレーム分)に対応する復号結果(例えば、DC12の一部)が記憶されたときに失われる。したがって、当該復号結果記憶部33a、33bに残るのは、最新の1基本周期分(1フレーム分)の復号結果DCだけである。
例えば、復号結果DC12から得られた1基本周期分の復号結果DCが復号結果記憶部33aと33bに記憶された直後に、消失判定器12から、音声消失が検出された旨の音声消失情報ERが制御部30a、30bに供給されると、前記消失移行動作が実行され、補償器11は、正常状態から消失補償状態に移行する。このとき制御部30a、30bは、音声消失によって失われた復号結果DC13を補償するために前記補間音声データTP1,TP2を生成する必要性を認め、各基本周期算出部32a、32bに、その時点で復号結果記憶部33a、33b内に記憶されている1基本周期分の復号結果(例えば、DC12)を利用して基本周期を算出するように指示する。
復号結果記憶部33aに記憶する前に、上述した通り1基本周期を算出している場合には、その算出結果を記憶しておいて再利用するようにしてもよい。
ここで、基本周期算出部32aは、図1に示すように、基本周期としてPaを算出したものとすると、基本周期算出部32bは当該Paとは異なる値の基本周期Pbを算出する。
図1の例では、復号結果記憶部33a、33b内に本来の1基本周期Paより、わずかに大きな復号結果DCを記憶している。この復号結果DCは、ここでは、1フレーム分の復号結果であってもよい。
この場合、1基本周期Pa分の復号結果W1は、時間的に1フレーム分より短く、不足が生じるから、補間機能部35a内の制御部30aは、1基本周期Pa分の復号結果W1の一部であるW11を用いて、不足を補っている。ここでの処理は、上述した図2(C)でS42をS41につなぎ合わせたときと同様の処理であってよい。また、接合部が波形的に連続したものとなるように、重ね合わせ加算などを行う点も図2(C)の場合と同様でよい。また、このとき、補間音声データTP1の波形の最初の部分は、消失直前の終了位相と合わせたものとし、接合部が波形的に連続したものとなるようにする。
このようにして制御部30aが生成した補間音声データTP1は、補間実行部31aに供給され中間信号V1の信号列の一部として合成部34に供給される。
このとき、ほぼ同時に、補間機能部35b内では、基本周期算出部32bが、前記Paとは異なる値の基本周期Pbを算出するので、制御部30bは、復号結果記憶部33bに記憶されている1フレーム分の復号結果から、当該基本周期Pb分の復号結果W2を取得し、時間的な不足は、同じ復号結果W2の一部であるW21を用いて補っている。
このようにして制御部30bが生成した補間音声データTP2は、図1に示すように、TP1とは異なる波形を持っている。当該補間音声データTP2は、補間実行部31bに供給され中間信号V2の信号列の一部として合成部34に供給される。
合成部34では、当該補間音声データTP1,TP2に対し、前記重み係数α、βを付与して合成し、合成結果を、出力音声信号Vとして出力する。
補間音声データTP1およびTP2は、同じ復号結果DCに基づいて生成されたものであるため、本来の音声を示す復号結果DCの特徴を反映したものとなっている。したがって、TP1とTP2を合成することによって生成される出力音声信号Vも、本来の音声を示す復号結果DCの特徴を反映したものであり、聴取するユーザU2は、ほとんど違和感を感じず、高い音質を実現できる可能性が高い。また、このようにして生成された出力音声信号Vは、通常、有効な復号結果DCが得られた直前のフレームに対応する区間の出力音声信号Vと異なる波形になる。
音声消失が1フレーム分で終了した場合には、このあと直ちに、有効な復号結果DC14(図示せず)が復号器10から供給されるため、補償器11は正常移行動作を実行し、復号結果記憶部33a、33bには、当該復号結果DC14に対応する1フレーム分(または、1基本周期分)の復号結果が記憶されることになる。この際、有効な復号結果と生成した補間音声との接合部が波形的に連続したものとなるように、重ね合わせ加算の処理を行ってもよい。
一方、音声消失が1フレームで終了せず、複数フレームにわたって継続した場合には、制御部30a、30bから図1に示した波形の補間音声データTP1,TP2が補間実行部31a、31bに出力されるものであってもよい。ただし、継続する音声消失の2フレーム目以降に対応する補間音声データTP1,TP2の生成では、前フレームで補間音声データを生成するのに使用した最後のサンプルの次のサンプルから、生成を開始するようにすることも望ましい。これにより、波形的な連続性が確保できるほか、記憶されている限られた復号結果DCを有効活用することができ、出力音声信号V中における同じ波形の単位時間あたりの繰り返し頻度を低減することもできる。また、復号結果記憶部33a、33bに記憶されている限られた期間の復号結果DCのなかで、補間音声データTP1,TP2に使用する期間を変化させることも望ましい。
いずれにしても、復号結果記憶部33a、33bに記憶されている限られた復号結果DCから、循環的な方法で取得した補間音声データTP1,TP2をそのまま出力したのでは、図1に示した波形の出力音声信号Vなど、1または複数の波形の出力が繰り返されてしまい、ビープ音などの原因となり得る。ビープ音などの異音の発生を避けるには、例えば、重み係数α、βを変更することも望ましい。これによって、音声消失が、3基本周期より、はるかに長い時間つづいても、無音が出力されることなく、有効な音声消失補償を継続することが可能であるから、ユーザU2にとって、音質が高いものとして認識され得る。
また、復号結果記憶部33a、33bの記憶容量は、1フレーム分または1基本周期分程度で足りるから、従来よりも、はるかに小さい。
音声消失が継続していたとき、新たに有効な復号結果DCが補償器11に供給されると、前記正常移行動作が実行される点は、音声消失が1フレーム分で終了した場合と同様である。
(A−3)第1の実施形態の効果
本実施形態によれば、音声消失が長期間つづいた場合でも有効な音声消失補償を継続することが可能であるから、柔軟性を高め、広い意味での通信品質(例えば、ユーザU2が感じる音質)を高めると共に、記憶資源を節約することができる。
(B)第2の実施形態
以下では、本実施形態が第1の実施形態と相違する点についてのみ説明する。
本実施形態が第1の実施形態と相違するのは、補償器の内部構成に関する点に限られる。
(B−1)第2の実施形態の構成および動作
本実施形態の補償器13の内部構成例を図5に示す。
図5において、当該補償器13は、2つの補間機能部325a、325bと、合成部34と、切換部321,322とを備えている。
このうち補間機能部325aと325bは同じ内部構成を備えている。すなわち、補間機能部325aは、制御部30aと、補間実行部31aと、基本周期算出部32aと、復号結果記憶部323aとを備え、補間機能部325bは、制御部30bと、補間実行部31bと、基本周期算出部32bと、復号結果記憶部323bとを備えている。
ここで、図4と同じ符号を付与した各構成要素の機能は第1の実施形態と同じなので、その詳しい説明は省略する。
本実施形態では、切換部321および322に関連する部分に特徴がある。
切換部321は、前記正常状態では、復号結果DCを復号結果IN1として補間実行部31aに供給するのみである。これを受けた補間機能部325a内では、復号結果記憶部323aに新しい1フレーム(または、1基本周期)に対応する復号結果IN1が記憶されるが、補間機能部325b内ではそのような記憶は行われない。このとき、補間実行部31b、基本周期算出部32b、復号結果記憶部323bなど補間機能部325b内の各部は有効な動作を実行しない休眠状態を維持するものであってよい。休眠状態では、記憶資源や演算能力がほとんど使用されないため、記憶資源の節約や計算量の抑制に寄与する。
また、切換部322は、補間実行部31aから供給される中間信号V1の供給のみを受け、当該中間信号V1を合成部34または接続点P1に出力する。
切換部322が接続点P1へ中間信号V1を出力するのは、前記正常状態にあるときである。正常状態ではそのまま、当該中間信号V1が最終的な前記出力音声信号Vとして出力される。この場合、合成部34は第1の実施形態のように重み係数α、βに関する処理を行う必要がないため、その分、記憶資源を節約し、計算量を抑制することができる。
音声消失が発生して前記消失補償状態に移行すると切換部322は、中間信号V1を合成部34に出力するようになる。このとき、制御部30a、30bに前記音声消失情報ERで音声消失が検出された旨が伝えられるため、制御部30a、30bは、前記正常状態に復号結果記憶部323aに記憶された復号結果DCを、復号結果記憶部323bへコピーさせる(DCa)。このコピー以後は、復号結果記憶部323aと323bに同じ内容の復号結果DCが記憶された状態となるため、第1の実施形態と同様にして、2つの補間機能部323a、323b内で前記補間音声データTP1,TP2を生成することが可能である。生成された補間音声データTP1,TP2がそれぞれ補間実行部31a、31bに供給され、合成部34で合成される点も第1の実施形態と同じである。
このときの合成では、本実施形態でも、前記重み係数αとβを用いるようにするとよい。これにより、音声消失が長期間つづいた場合でも、異音の発生を抑制しながら、有効な音声消失補償を継続することが可能となる。
なお、前記正常状態から消失補償状態に移行したとき、切換部321から、前記復号結果IN1と同じ内容の復号結果IN2を補間実行部31bに供給するようにしてもよい。ただしこのとき、復号器10からは音声消失により有効な復号結果DCが供給されない状態となっているのであるから、フレームのタイミングを知らせるための信号など、制御用の信号を供給する必要がある場合などを除き、復号結果IN2を補間実行部31bへ供給する必要性は低い。消失補償状態において復号結果IN2を補間実行部31bに供給しないなら、切換部321は省略可能であり、復号器10から出力される復号結果DCは補間実行部31aにのみ供給することになる。
正常状態へ復帰した場合には、再度、切換部322は接点P1へ中間信号V1を出力するようになる。このときまた、補間機能部325b内の各部は有効な動作を実行しない休眠状態に復帰する。
(B−2)第2の実施形態の効果
本実施形態によれば、第1の実施形態の効果と同等な効果を得ることができる。
加えて、本実施形態では、正常状態において一方の補間機能部(325b)が休眠状態にあることや、合成部(34)が機能しないことから、記憶資源をいっそう節約し、計算量をいっそう抑制することが可能である。
(C)第3の実施形態
以下では、本実施形態が第1、第2の実施形態と相違する点についてのみ説明する。
本実施形態が第1、第2の実施形態と相違するのは、補償器の内部構成に関する点に限られる。
第1、第2の実施形態のなかでは、第1の実施形態のほうが本実施形態に近い。
(C−1)第3の実施形態の構成および動作
本実施形態の補償器14の内部構成例を図6に示す。
図6において、当該補償器14は、2つの補間機能部35a、35bと、合成部334とを備えている。
このうち補間機能部35aと35bは同じ内部構成を備えている。すなわち、補間機能部325aは、制御部30aと、補間実行部31aと、基本周期算出部32aと、復号結果記憶部33aとを備え、補間機能部35bは、制御部30bと、補間実行部31bと、基本周期算出部32bと、復号結果記憶部33bとを備えている。
ここで、図4と同じ符号を付与した各構成要素の機能は第1の実施形態と同じなので、その詳しい説明は省略する。
本実施形態は合成部334の内部構成が第1の実施形態と異なる。
合成部334では、ランダム重み生成部331がランダムな値の重み係数α、βを生成する。この場合でも、α+β=1の関係は維持されるものであってよい。ランダム重み生成部331は、音声消失情報ERが、音声消失の発生を伝えてきたときにのみ動作して、ほぼ白色雑音的にランダムな値を生成するものである。
ランダムに決定されるαの値は、0.5<α≦1の範囲を満たすものである。
ただしこの範囲の内部において、さらに範囲を限定してもよい。例えば、0.7≦α≦0.8などとしてもよい。
また、最終的にαの値が、ほぼランダムに決定されるものであれば、αの決定にどのような方法を用いてもかまわない。例えば、時系列にαの値が更新されるとき、更新前のαの値からの変化量をランダムに生成するようにしてもよい。
ランダムな値の生成には様々な方法を利用できる可能性があるが、本実施形態の場合、必ずしもそれほど厳密なランダム性を必要としないので、擬似乱数などを利用することができる。
また、αの値の更新頻度は様々な値にすることが可能であるが、フレームごとに更新するようにしてもよい。
重み係数α、βの値を、所定値以上の時間頻度で(例えば、フレームごとに)ランダムに変化させることができれば、最終的な出力音声信号Vで、同じ波形が繰り返される可能性がほとんどなくなるため、ビープ音などの異音が発生されにくくなる。
(C−2)第3の実施形態の効果
本実施形態によれば、第1の実施形態の効果と同等な効果を得ることができる。
加えて、本実施形態では、重み係数(α、β)の値を所定値以上の時間密度でランダムに変化させるため、音声消失が長時間つづいた場合でも、ほぼ確実に、ビープ音などの異音の発生を抑制することができる。
これにより、ユーザ(U2)が聴取する音声の品質がいっそう高くなり、通話時の聴覚疲労を軽減することが可能である。
(D)第4の実施形態
以下では、本実施形態が第1〜第3の実施形態と相違する点についてのみ説明する。
本実施形態が第1〜第3の実施形態と相違するのは、補償器の内部構成に関する点に限られる。
第1〜第3の実施形態のなかでは、第2の実施形態が本実施形態に最も近い。
(D−1)第4の実施形態の構成および動作
本実施形態の補償器15の内部構成例を図7に示す。
図7において、当該補償器15は、2つの補間機能部75a、75bと、切換部321,322と、合成部72とを備えている。
このうち補間機能部75aと75bは同じ内部構成を備えている。すなわち、補間機能部75aは、制御部71aと、補間実行部31aと、基本周期算出部32aと、復号結果記憶部323aとを備え、補間機能部75bは、制御部71bと、補間実行部31bと、基本周期算出部32bと、復号結果記憶部323bとを備えている。
以上の各構成要素のうち、図5と同じ符号を付与した各構成要素の機能は第2の実施形態と同じなので、その詳しい説明は省略する。
本実施形態は制御部71a、71bの機能の一部と、合成部72の内部構成が第2の実施形態と異なる。
本実施形態の制御部71a、71bは、自補間機能部75a、75b内の基本周期算出部32a、32bが算出した基本周期P1,P2を合成部72に伝える機能を備えている。基本周期P1は前記Paに対応し、基本周期P2は前記Pbに対応するものであってよい。
合成部72は例えば図8に示す内部構成を備え、その重み更新部81が、供給を受けた基本周期P1,P2に応じた重み係数α、βを生成する。
重み更新部81が、基本周期P1,P2をもとに重み係数α、βを更新(生成)する方法には様々なものがあり得るが、例えば、予めP1>P2という条件を満たすP1とP2を生成するように設定しておき、α+β=1、P2/P1とするようにしてもよい。
あるいは、α=1−(P2−P1)/(PM−Pm)にしたがってαの値を決定するようにしてもよい。
ここで、PMは計算し得る基本周期の最大値を示し、Pmは計算し得る基本周期の最小値を示す。
また、別な方法として、基本周期以外の特徴量(例えば、パワーやスペクトルなど)をもとに所定の規則にしたがってαの値を決定するようにしてもよい。この場合、前記消失補償状態に移行したときにαの値を設定し、正常状態に復帰するまで同じαの値を用いるものであってよい。
あるいは、制御部71a、71bから、前記基本周期P1、P2の代わりに復号結果DCの波形が持つパワー(例えば、1基本周期区間の標本値の二乗平均)を毎フレーム区間出力し、正常状態に復帰するまで、合成部72は毎フレーム区間αの値を更新するようにしてもよい。
(D−2)第4の実施形態の効果
本実施形態によれば、第2の実施形態の効果と同等な効果を得ることができる。
加えて、本実施形態では、基本周期(P1,P2)など、復号結果記憶部(323a、323b)に記憶している復号結果(DC)の各種の特徴量を、生成する重み係数の値(α、β)に反映させることができるので多様なバリエーションを提供することが可能である。
これにより、ユーザ(U2)が聴取する音声の品質をいっそう高め、通話時の聴覚疲労を第2の実施形態より軽減させることができる可能性がある。
(E)第5の実施形態
以下では、本実施形態が第1〜第4の実施形態と相違する点についてのみ説明する。
本実施形態が第1〜第4の実施形態と相違するのは、補償器の内部構成に関する点に限られる。
第1〜第4の実施形態のなかでは、切換部321、322などを持つ点で、第4の実施形態が最も本実施形態に近いといえる。
(E−1)第5の実施形態の構成および動作
本実施形態の補償器16の内部構成例を図9に示す。
図9において、当該補償器16は、1つの補間機能部95と、切換部321,322と、合成部72とを備えている。
前記補間機能部95は、補間実行部31a、31bと、制御部90と、基本周期算出部92と、復号結果記憶部93と、制御切換部96と、状態保持部97とを備えている。
以上の各構成要素のうち図7と同じ符号を付与した構成要素の機能は第4の実施形態と同じなので、その詳しい説明は省略する。
また、制御部90は前記制御部71aまたは71bに対応し、基本周期算出部92は前記基本周期算出部32aまたは32bに対応し、復号結果記憶部93は前記復号結果記憶部323aまたは323bに対応するので、その詳しい説明は省略する。
ただし、制御部90、基本周期算出部92、復号結果記憶部93は、補間音声データTP1,基本周期P1を生成するときとともに、補間音声データTP2,基本周期P2を生成するときにも機能する点が第4の実施形態と異なる。
本実施形態では、前記正常状態において補間実行部31a経由で復号結果IN1が復号結果記憶部93に記憶されているため、前記消失補償状態に移行した場合、制御部90は、基本周期算出部92に前記補間音声データTP1を生成するための基本周期P1を算出させ、当該基本周期P1に基づいて補間音声データTP1を生成することができる。また、つづくフレーム区間でも音声消失が発生した場合のため、後続の補間音声データTP1を生成する際に必要な各種情報を生成状態情報Q1として状態保持部97に記憶させる。
次に、当該制御部90は、基本周期算出部92に前記補間音声データTP2を生成するための基本周期P2を算出させ、当該基本周期P2に基づいて補間音声データTP2を生成することができる。そして、つづくフレーム区間でも音声消失が発生した場合のため、後続の補間音声データTP2を生成する際に必要な各種情報を生成状態情報Q2として状態保持部97に記憶させる。
生成状態情報Q1,Q2には様々な情報が含まれ得るが、例えば、復号結果記憶部93に記憶されている復号結果DCのどの部分を使用して今回の補間音声データTP1,TP2を生成したかを示す情報などであってよい。
このあと、制御部90は、制御切換部96により補間実行部31aを実行させて中間信号V1の信号列に、生成した補間音声データTP1を挿入し、つづいて、制御部切換部96により補間実行部31bを実行させて中間信号V2の信号列に、生成した補間音声データTP2を挿入する。
これにより、ほぼ同時に、補間音声データTP1とTP2が合成部72に供給されるので、合成部72では、すでに制御部90から供給されている基本周期P1,P2を用いて重み係数α、βを付与し、合成結果である出力音声信号Vを出力することができる。
消失補償状態が1フレーム分で終了せず、複数フレーム分つづいた場合には、前記状態保持部97に記憶されている生成状態情報Q1,Q2を利用して、後続の補間音声データTP1,TP2を生成し、音声消失補償を継続することができる。
(E−2)第5の実施形態の効果
本実施形態によれば、第4の実施形態の効果と同等な効果を得ることができる。
加えて、本実施形態では、1つの補間機能部(95)を用いて、仮想的に、2つの補間機能部を持つ場合と同様な機能を実現できるため、いっそう記憶資源を節約し、計算量を抑制できる可能性が高い。
(F)他の実施形態
上記第1〜第4の実施形態では、1つの補償器内に2つの補間機能部を設けるようにしたが、1つの補償器内の補間機能部の数は3つ以上であってもよい。
また、上記第5の実施形態では、1つの補間機能部内に2つの補間実行部を設けるようにしたが、1つの補間機能部内の補間実行部の数は3つ以上であってもよい。
なお、上記第1〜第5の実施形態の特徴は、相互に矛盾しない限り、任意の組み合わせで複合することが可能である。
また、上記第1〜第5の実施形態では、符号化方式としてPCMを用いたが、本発明は、様々な符号化方式に適用することができる。一例として、ADPCMなどの差分量子化方式などにも適用可能である。
さらに、上記第1〜第5の実施形態では、電話(VoIP対応電話機)による音声信号の通信を例に本発明を説明したが、本発明は、電話による音声信号以外の音声信号にも適用可能である。例えば、音声・トーン信号などの周期性信号を利用する通信に広く適用することができる。
符号化方式を変更した場合、それに応じて上記第1〜第5の実施形態で、前記正常状態、消失補償状態、正常移行動作、消失移行動作などの詳細が変更されてもよいことは当然である。
また、本発明を適用する通信プロトコルは、上述したIPプロトコルに限定する必要はないことは当然である。
以上の説明では主としてハードウエア的に本発明を実現したが、本発明はソフトウエア的に実現することも可能である。
第1の実施形態の動作説明図である。 従来の補間音声作成動作を示す概略図である。 第1〜第5の実施形態の通信端末の内部構成例を示す概略図である。 第1の実施形態で使用する補償器の内部構成例を示す概略図である。 第2の実施形態で使用する補償器の内部構成例を示す概略図である。 第3の実施形態で使用する補償器の内部構成例を示す概略図である。 第4の実施形態で使用する補償器の内部構成例を示す概略図である。 第4の実施形態で使用する合成部の内部構成例を示す概略図である。 第5の実施形態で使用する補償器の内部構成例を示す概略図である。 第1〜第5の実施形態にかかる通信システムの全体構成例を示す概略図である。
符号の説明
10…復号器、11、13,14,15…補償器、12…消失判定器、20…通信システム、21…ネットワーク、22,23…通信端末、30a、30b、71a、71b、90…制御部、31a、31b…補間実行部、32a、32b…基本周期算出部、33a、33b…復号結果記憶部、34…合成部、35a、35b、75a、75b、325a、325b…補間機能部、81…重み更新部、96…制御切換部、97…状態保持部、331…ランダム重み生成部、321,322…切換部、PK11〜PK13…パケット、CD…音声データ、DC…復号結果、ER…音声消失情報、Pa、Pb…基本周期。

Claims (6)

  1. 所定の区間に分割されて時系列に受信される周期性信号の任意の区間で消失が発生したとき、その消失を補償する消失補償装置において、
    新しく受信された1または複数の区間の周期性信号を所定時間分、記憶する周期性信号記憶部と、
    前記周期性信号の消失を区間ごとに検出する消失検出部と、
    当該消失検出部によって消失が検出された場合、その時点で、前記周期性信号記憶部に記憶されている周期性信号をもとに、該周期性信号から算出された異なる基本周期を持つ補間用の複数の要素周期性信号を生成する要素周期性信号生成部とを備え、
    当該要素周期性信号生成部が生成した複数の要素周期性信号を合成し、その合成結果を、周期性信号の消失が発生した区間に配置することを特徴とする消失補償装置。
  2. 請求項1の消失補償装置において、
    前記要素周期性信号を、受信される周期性信号の列に挿入する挿入実行部と、前記周期性信号記憶部と、前記要素周期性信号生成部とを備えた補間対応部を複数備え、
    当該各補間対応部に、受信された周期性信号の列を供給することを特徴とする消失補償装置。
  3. 請求項1の消失補償装置において、
    前記要素周期性信号を、受信される周期性信号の列に挿入する挿入実行部と、前記周期性信号記憶部と、前記要素周期性信号生成部とを有する補間対応部を複数備えると共に、
    各補間対応部への周期性信号の列の供給を制御する供給制御部を備え、
    前記複数の補間対応部のうち少なくとも1つを親補間対応部、他を子補間対応部とし、前記供給制御部は、前記消失検出部によって周期性信号の消失が検出されていないときには、前記親補間対応部に周期性信号の列を供給し、検出されたときには、前記親補間対応部および子補間対応部へ当該周期性信号の列を供給するように制御し、前記親補間対応部は自身の周期性信号記憶部に記憶してある1または複数の区間の周期性信号を子補間対応部の周期性信号記憶部に格納することによって子補間対応部による要素周期性信号の生成を支援することを特徴とする消失補償装置。
  4. 請求項1の消失補償装置において、
    前記各要素周期性信号生成部が所定の重み係数をもとに異なる波形を持つ要素周期性信号を生成する場合、所定の係数変更規則にしたがって重み係数の値を変化させる係数制御部を備えたことを特徴とする消失補償装置。
  5. 所定の区間に分割されて時系列に受信される周期性信号の任意の区間で消失が発生したとき、その消失を補償する消失補償方法において、
    周期性信号記憶部が、新しく受信された1または複数の区間の周期性信号を所定時間分、記憶し、
    消失検出部が、前記周期性信号の消失を区間ごとに検出し、
    要素周期性信号生成部が、当該消失検出部によって消失が検出されたとき、その時点で、前記周期性信号記憶部に記憶されている周期性信号をもとに、該周期性信号から算出された異なる基本周期を持つ補間用の複数の要素周期性信号を生成し、
    当該要素周期性信号生成部が生成した複数の要素周期性信号を合成し、その合成結果を、周期性信号の消失が発生した区間に配置することを特徴とする消失補償方法。
  6. 所定の区間に分割されて時系列に受信される周期性信号の任意の区間で消失が発生したとき、その消失を補償する消失補償プログラムにおいて、コンピュータに、
    新しく受信された1または複数の区間の周期性信号を所定時間分、記憶する周期性信号記憶機能と、
    前記周期性信号の消失を区間ごとに検出する消失検出機能と、
    当該消失検出機能によって消失が検出された場合、その時点で、前記周期性信号記憶機能に記憶されている周期性信号をもとに、該周期性信号から算出された異なる基本周期を持つ補間用の複数の要素周期性信号を生成する要素周期性信号生成機能とを実現させ、
    当該要素周期性信号生成機能が生成した複数の要素周期性信号を合成し、その合成結果を、周期性信号の消失が発生した区間に配置することを特徴とする消失補償プログラム。
JP2004235461A 2004-08-12 2004-08-12 消失補償装置、消失補償方法、および消失補償プログラム Active JP4419748B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2004235461A JP4419748B2 (ja) 2004-08-12 2004-08-12 消失補償装置、消失補償方法、および消失補償プログラム
PCT/JP2005/006850 WO2006016439A1 (ja) 2004-08-12 2005-04-07 消失補償装置、消失補償方法、および消失補償プログラム
CNB2005800272467A CN100445716C (zh) 2004-08-12 2005-04-07 消失补偿装置和消失补偿方法
US11/659,205 US7793202B2 (en) 2004-08-12 2005-04-07 Loss compensation device, loss compensation method and loss compensation program
GB0702838A GB2435749B (en) 2004-08-12 2007-02-14 Loss compensation device, loss compensation method, and loss compensation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004235461A JP4419748B2 (ja) 2004-08-12 2004-08-12 消失補償装置、消失補償方法、および消失補償プログラム

Publications (2)

Publication Number Publication Date
JP2006053394A JP2006053394A (ja) 2006-02-23
JP4419748B2 true JP4419748B2 (ja) 2010-02-24

Family

ID=35839215

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004235461A Active JP4419748B2 (ja) 2004-08-12 2004-08-12 消失補償装置、消失補償方法、および消失補償プログラム

Country Status (5)

Country Link
US (1) US7793202B2 (ja)
JP (1) JP4419748B2 (ja)
CN (1) CN100445716C (ja)
GB (1) GB2435749B (ja)
WO (1) WO2006016439A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4504389B2 (ja) * 2007-02-22 2010-07-14 富士通株式会社 隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラム
CN101542593B (zh) * 2007-03-12 2013-04-17 富士通株式会社 语音波形内插装置及方法
JP5059677B2 (ja) * 2008-04-18 2012-10-24 ルネサスエレクトロニクス株式会社 ノイズ除去装置、及びノイズ除去方法
JP5584157B2 (ja) * 2011-03-22 2014-09-03 株式会社タムラ製作所 無線受信機
KR20140067512A (ko) * 2012-11-26 2014-06-05 삼성전자주식회사 신호 처리 장치 및 그 신호 처리 방법
FR3004876A1 (fr) * 2013-04-18 2014-10-24 France Telecom Correction de perte de trame par injection de bruit pondere.

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57132486A (en) * 1981-02-10 1982-08-16 Sony Corp Magnetic recorder and reproducer
JPH0573097A (ja) * 1991-09-17 1993-03-26 Nippon Telegr & Teleph Corp <Ntt> 低遅延符号駆動形予測符号化方法
JP3148778B2 (ja) * 1993-03-29 2001-03-26 日本電信電話株式会社 音声の符号化方法
JP3713288B2 (ja) * 1994-04-01 2005-11-09 株式会社東芝 音声復号装置
JP3416331B2 (ja) 1995-04-28 2003-06-16 松下電器産業株式会社 音声復号化装置
CA2177413A1 (en) * 1995-06-07 1996-12-08 Yair Shoham Codebook gain attenuation during frame erasures
KR100197366B1 (ko) * 1995-12-23 1999-06-15 전주범 영상 에러 복구 장치
JP3157116B2 (ja) * 1996-03-29 2001-04-16 三菱電機株式会社 音声符号化伝送システム
US6128369A (en) * 1997-05-14 2000-10-03 A.T.&T. Corp. Employing customer premises equipment in communications network maintenance
JP3722366B2 (ja) * 2002-02-22 2005-11-30 日本電信電話株式会社 パケット構成方法及び装置、パケット構成プログラム、並びにパケット分解方法及び装置、パケット分解プログラム

Also Published As

Publication number Publication date
CN101002079A (zh) 2007-07-18
GB2435749A (en) 2007-09-05
US20090019343A1 (en) 2009-01-15
JP2006053394A (ja) 2006-02-23
GB2435749B (en) 2009-02-18
CN100445716C (zh) 2008-12-24
GB0702838D0 (en) 2007-03-28
US7793202B2 (en) 2010-09-07
WO2006016439A1 (ja) 2006-02-16

Similar Documents

Publication Publication Date Title
RU2407071C2 (ru) Способ генерации кадров маскирования в системе связи
Gunduzhan et al. Linear prediction based packet loss concealment algorithm for PCM coded speech
KR100272477B1 (ko) 코드여진선형 예측부호화기 및 복호기
JP5019479B2 (ja) ボコーダにおけるフレームの位相整合のための方法および装置
EP1886307B1 (en) Robust decoder
US9336783B2 (en) Method and apparatus for performing packet loss or frame erasure concealment
JP5405659B2 (ja) 消去されたスピーチフレームを再構成するためのシステムおよび方法
JP5173795B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
JP2008529423A (ja) 音声通信におけるフレーム消失キャンセル
JPWO2005109402A1 (ja) 音声パケット送信方法、音声パケット送信装置、および音声パケット送信プログラムとそれを記録した記録媒体
WO2004068098A1 (ja) 音声パケット消失隠蔽装置,音声パケット消失隠蔽方法,受信端末および音声通信システム
KR20160002920A (ko) 노이즈 주입이 가중된 프레임 손실 보정
US7793202B2 (en) Loss compensation device, loss compensation method and loss compensation program
Ogunfunmi et al. Speech over VoIP networks: Advanced signal processing and system implementation
EP1391880B1 (en) Coding device decoding device and methods thereof
JP2001228896A (ja) 欠落音声パケットの代替置換方式
JP4535069B2 (ja) 補償回路
JP2001352316A (ja) データ伝送において発生する遅延ジッタを吸収する装置および方法
Gournay et al. Performance analysis of a decoder-based time scaling algorithm for variable jitter buffering of speech over packet networks
Rodbro et al. Time-scaling of sinusoids for intelligent jitter buffer in packet based telephony
JP4093174B2 (ja) 受信装置および方法
JP2005274917A (ja) 音声復号装置
KR19990053837A (ko) 오디오 신호의 에러 은닉 방법과 그 장치
Lee et al. A forward-backward voice packet loss concealment algorithm for multimedia over IP network services

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090728

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090928

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091110

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091123

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4419748

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131211

Year of fee payment: 4