JP4093174B2 - 受信装置および方法 - Google Patents

受信装置および方法 Download PDF

Info

Publication number
JP4093174B2
JP4093174B2 JP2003377339A JP2003377339A JP4093174B2 JP 4093174 B2 JP4093174 B2 JP 4093174B2 JP 2003377339 A JP2003377339 A JP 2003377339A JP 2003377339 A JP2003377339 A JP 2003377339A JP 4093174 B2 JP4093174 B2 JP 4093174B2
Authority
JP
Japan
Prior art keywords
signal
periodic signal
element periodic
logical channel
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2003377339A
Other languages
English (en)
Other versions
JP2005142856A (ja
Inventor
厚史 田代
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2003377339A priority Critical patent/JP4093174B2/ja
Priority to GB0608295A priority patent/GB2424156B/en
Priority to US10/577,440 priority patent/US7586937B2/en
Priority to CN2004800300212A priority patent/CN1868151B/zh
Priority to PCT/JP2004/015892 priority patent/WO2005057818A1/ja
Publication of JP2005142856A publication Critical patent/JP2005142856A/ja
Application granted granted Critical
Publication of JP4093174B2 publication Critical patent/JP4093174B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)
  • Communication Control (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Telephone Function (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Noise Elimination (AREA)

Description

本発明は受信装置および方法に関し、例えば、広帯域の音声帯域を2分割して伝送する場合などに適用して好適なものである。
現在、VoIP技術を用いてインターネット等のネットワークを利用した音声通信が盛んにおこなわれている。
インターネットなどの通信品質が保証されていないネットワークを介する通信では、伝送途中でパケットが失われるパケット損失に起因して、本来、時系列に受信されるはずの音声データの一部が欠損する現象(音声消失)が頻繁に発生し得る。音声消失が発生した場合、そのまま復号すると、音声の途切れなどが頻発し、音声品質が劣化するが、この劣化に対する補償方法として、例えば、下記の非特許文献1の技術がすでに知られている。
この方法は、復号処理単位である音声フレーム(パケット)毎に音声消失の発生を監視し、音声消失が発生する度に補償処理を実行する。この補償処理では、符号化列を復号した後の音声データを内部メモリなどに記憶しておき、音声消失が生じた場合には、当該内部メモリから読み出した音声データをもとに、音声消失の起きた付近での基本周期を求める。そして、音声消失により音声データの補間(補償)が必要となったフレームに対し、そのフレームの開始位相がその直前フレームの終了位相と合って波形周期(基本周期)での連続性が確保できるように内部メモリから音声データを取り出して補間をおこなう。
一方、ネットワークを介した音声通信の方式として、下記の非特許文献2および3に記載された技術が知られている。
非特許文献2の技術では、音声データを単一の帯域で伝送するが、非特許文献3の技術は、高品質の音声通信を実現するため、従来よりも広帯域(例えば、8kHz帯域)の音声帯域を二分割して伝送させる帯域分割方式(SB−ADPCM)に関するものである。
ITU−T勧告G.711 Appendix I ITU−T勧告G.711 ITU−T勧告G.722
ところで、上述した非特許文献3の帯域分割方式をそのまま音声データの受信処理装置に適用した場合、当該受信処理装置内で、帯域ごとに同様な処理を行う処理系統を独立に設けることが必要となり、時間計算量と領域計算量が大きくなってしまう。
例えば、この処理系統を汎用的なDSP(ディジタル・シグナル・プロセッサ)で構成すると、メモリ量や演算処理量が大きくなるため、消費電力の増加、装置規模の増大、コストアップが避けられない。
しかも、単に、独立な処理系統を2つ設けただけでは、音声消失により双方の帯域で同じ前記基本周期を重複して算出することになって不必要な時間計算量や領域計算量の増大が発生する。また、いずれか一方の帯域に雑音が多いために前記基本周期が得られないと、その処理系統では、前記補間を行うことができないため、通信品質が低下してしまう。
結局、前記非特許文献3の帯域分割方式をそのまま受信処理装置に適用すると、時間計算量と領域計算量が大きい割に通信品質が低く、効率の悪い構成となってしまう。
かかる課題を解決するために、第1の本発明では、送信装置側で、所定の発生源から発生した元周期性信号を各論理チャネルに合わせて複数の要素周期性信号に分割し、分割によって得た各要素周期性信号の符号化結果である複数の符号化要素周期性信号を伝送単位信号に収容して送信したものを、所定の伝送路経由で受信し、伝送単位信号から取り出した符号化要素周期性信号の復号結果である要素周期性信号に応じた再生出力を行う受信装置において、(1)前記伝送路における伝送中、時系列に受信される前記伝送単位信号のうちのいずれかに、収容している符号化要素周期性信号を再生出力に使用することを妨げる所定の妨害事象が発生したことを検出する妨害事象検出手段を設けると共に、(2)当該妨害事象検出手段が妨害事象の発生を検出した場合、その伝送単位信号に収容されていた符号化要素周期性信号の替わりとなる代替要素周期性信号を、所定の周期をもとに生成して、要素周期性信号の系列中に挿入する補間手段を、前記論理チャネルの数だけ設け、(3)前記各論理チャネルごとに設けられた複数の補間手段は、該当する論理チャネルで受信された伝送単位信号から取り出した符号化要素周期性信号の復号結果である要素周期性信号を記憶する要素周期性信号記憶部を備え、(4)前記各論理チャネルごとに設けられた複数の補間手段のうち少なくともいずれか1つは、前記要素周期性信号記憶部に記憶してある要素周期性信号から、前記代替要素周期性信号の生成の基礎となる情報であって、同じ元周期性信号を分割して得られた各要素周期性信号に共通する前記周期の値を算出する周期算出部と、(5)算出した周期の値を他の補間手段に通知する周期通知部とを有することを特徴とする。
また、第2の本発明では、信装置側で、所定の発生源から発生した元周期性信号を各論理チャネルに合わせて複数の要素周期性信号に分割し、分割によって得た各要素周期性信号の符号化結果である複数の符号化要素周期性信号を伝送単位信号に収容して送信したものを、所定の伝送路経由で受信し、伝送単位信号から取り出した符号化要素周期性信号の復号結果である要素周期性信号に応じた再生出力を行う受信方法において、(1)前記伝送路における伝送中、時系列に受信される前記伝送単位信号のうちのいずれかに、収容している符号化要素周期性信号を再生出力に使用することを妨げる所定の妨害事象が発生したことを、妨害事象検出手段が検出し、(2)当該妨害事象検出手段が妨害事象の発生を検出した場合、その伝送単位信号に収容されていた符号化要素周期性信号の替わりとなる代替要素周期性信号を、(3)記論理チャネルの数だけ設けられた各補間手段が所定の周期をもとに生成して、要素周期性信号の系列中に挿入する場合、前記各論理チャネルごとに設けられた複数の補間手段は、該当する論理チャネルで受信された伝送単位信号から取り出した符号化要素周期性信号の復号結果である要素周期性信号を要素周期性信号記憶部に記憶し、(4)前記各論理チャネルごとに設けられた複数の補間手段のうち少なくともいずれか1つでは、前記要素周期性信号記憶部に記憶してある要素周期性信号から、前記代替要素周期性信号の生成の基礎となる情報であって、同じ元周期性信号を分割して得られた各要素周期性信号に共通する前記周期の値を、周期算出部で算出し、(5)算出した周期の値を、周期通知部が他の補間手段に通知することを特徴とする。
本発明によれば、時間計算量と領域計算量が少ない割に通信品質を高め、効率的な構成を実現することができる。
(A)実施形態
以下、本発明にかかる受信装置および方法を、VoIPを用いた音声通信に適用した場合を例に、実施形態について説明する。
(A−1)実施形態の構成
本実施形態にかかる通信システム20の全体構成例を図4に示す。
図4において、当該通信システム20は、ネットワーク21と、通信端末22,23とを備えている。
このうちネットワーク21はインターネットであってもよく、通信事業者が提供し、ある程度、通信品質が保証されたIPネットワークなどであってもよい。
また、通信端末22は例えばIP電話機のような音声通話をリアルタイムで実行することのできる通信装置である。IP電話機は、VoIP技術を利用し、IPプロトコルを用いるネットワーク上で音声データをやり取りして通話を行うことを可能にする。通信端末23も、当該通信端末22と同じ通信装置である。
通信端末22はユーザU1によって利用され、通信端末23はユーザU2によって利用される。通常、IP電話機ではユーザ間の会話を成立させるために双方向に音声がやり取りされるものであるが、ここでは、通信端末22から音声フレーム(音声パケット)PK11〜PK13などが送信され、これらのパケットがネットワーク21経由で通信端末23に受信される方向に注目して説明を進める。
これらのパケットPK11〜PK13にはユーザU1が発話した内容(音声情報)を示す音声データが含まれているので、この方向に関する限り、通信端末23は受信処理のみを行い、ユーザU2はユーザU1が発話した音声の聴取のみを行う。
これらのパケットのうちPK11〜PK13のあいだでは送信の順番(これは、受信側における再生出力の順番に対応)が決まっている。すなわち、PK11〜PK13のあいだでは、PK11,PK12,PK13,…の順番で送信が行われる。
本実施形態では、前記非特許文献3の帯域分割方式を採用するが、この帯域分割方式により広帯域を二分割することによって得られる各帯域は論理的な別チャネルとみなすことができる。例えば、8kHzの帯域幅を有する広帯域の音声情報を周波数軸上の4kHzの位置で二分割すれば、より狭い4kHz幅の2つの帯域(狭帯域)ごとに音声情報が得られる。この場合、例えば、周波数軸上で0〜4kHzの範囲に位置する狭帯域WAと、4〜8kHzの範囲に位置する狭帯域WBが得られ、これら2つの狭帯域WA、WBの音声情報がそれぞれ論理チャネルCA、CBで伝送されることになる。ここで、周波数が低いほうの狭帯域WAが論理チャネルCAに対応し、高いほうの狭帯域WBが論理チャネルCBに対応する。
各論理チャネルCA、CBの音声情報を別個のパケットに収容して送信することも考えられるが、ここでは、前記非特許文献3の規定にしたがい、各論理チャネルCA、CBの音声情報を同一のパケットに収容して送信するものとする。
帯域分割により狭帯域WA側に配置される音声情報に対応する符号化済みの音声データの系列をCD11、CD12,CD13,…とし、狭帯域WB側に配置される音声情報に対応する符号化済みの音声データの系列をCD21、CD22,CD23,…とする。ここで、CD11とCD21はユーザU1により同時に発話された音声に対応し、CD12とCD22はユーザU1により同時に発話された音声に対応し、CD13とCD23はユーザU1により同時に発話された音声に対応する。そして、CD11とCD21の組は前記パケットPK11に収容され、CD12とCD22の組は前記パケットPK12に収容され、CD13とCD23の組は前記パケットPK13に収容される。
通常の音声通信が例えば前記狭帯域WAに相当する帯域幅の音声情報のみを伝えるものであるとすると、前記非特許文献3の帯域分割方式を用いることにより、狭帯域WBに相当する帯域幅の音声情報を伝えることができる分だけ、通常の音声通信よりも通信品質が高くなる。
前記狭帯域WAとWBは周波数帯域で分割されてはいるものの、通常のユーザU1が発話する音声は周波数軸方向に広がりを持っているため、同じ(または類似した)波形が狭帯域WAにおける音声情報と狭帯域WBにおける音声情報に共通して存在する可能性が高い。このため、例えば、前記基本周期に対応する波形も両狭帯域WA、WBに共通して存在し得る。
前記パケットがPK11,PK12,PK13,…の順番で送信されると、多くの場合、この順番で欠けることなく全パケットが通信端末23に受信されるが、ネットワーク21上におけるルータ(図示せず)の輻輳などの事象に起因してパケット損失が発生することがある。パケット損失で失われたパケットは、例えば、PK12であってもよい。
本実施形態の特徴は受信側の機能にあるため、以下では、前記通信端末23に注目して説明する。通信端末23の主要部の構成例を図1に示す。前記通信端末22が受信処理を行うためにこれと同じ構成を備えていてよいことは当然である。
(A−1−1)通信端末の構成例
図1において、当該通信端末23は、復号器11A、11Bと、消失判定器12と、補間器13A、13Bと、帯域結合器14とを備えている。
このうち復号器11Aは、前記論理チャネルCAのための復号器で、当該通信端末23が受信したパケット(例えば、PK11など)ごとにそのパケットから抽出された音声データCD1を復号し、復号結果DC1を出力する部分である。ここで、CD1は、前記論理チャネルCAに対応する各音声データCD11〜CD13を総称するための符号である。以下でも、CD11〜CD13を区別する必要がないときには、このCD1を用いる。
1つの音声データ(例えば、CD11)に含まれるサンプル数は任意に決めることができるが、一例として、160サンプル程度であってもよい。
また、復号器11Aによる音声データCD11の復号結果はDC11であり、音声データCD12の復号結果はDC12であり、音声データCD13の復号結果はDC13である。復号結果に関しても、DC11〜DC13を区別する必要がないときには、総称して符号DC1を用いる。
前記復号器11Bは、それ自体の機能は前記復号器11Aとまったく同じものである。ただしこの復号器11Bは、論理チャネルCBのための復号器で、音声データCD21〜CD23を復号し、復号結果としてDC21〜DC23を出力する。復号器11Bの入出力に関連する符号CD2は、前記CD1に対応し、符号DC2は前記DC1に対応する。
消失判定器12は、基礎情報ST1に基づいて前記パケット損失(音声消失)の発生を検出し、消失状態検出結果ER1を出力する部分である。パケット損失が発生すると、前記補間器13A、13Bによる補間が必要となるので、その旨を当該消失状態検出結果ER1で通知する。
パケット損失の検出方法には様々な方法を使用可能であるが、例えば、各パケットに含まれるRTPヘッダなどが持つ、連番となるはずのシーケンス番号(通信端末22がパケット送信時に付与した連続番号)に抜けが発生した場合に、パケット損失が発生したものと判定してもよく、当該RTPヘッダなどが持つタイムスタンプ(通信端末22がパケット送信時に付与した送信時刻情報)の値をもとに、遅延が大きすぎるパケットは、パケット損失により失われたものと判定するようにしてもよい。シーケンス番号を用いる場合には、前記基礎情報ST1は当該シーケンス番号となり、タイムスタンプを用いる場合には、前記基礎情報ST1はタイムスタンプとなる。
いったんパケット損失により失われたと判定されたパケットが、後から受信されることも起こり得るが、そのような場合、受信したパケットは廃棄するものであってよい。リアルタイム通信では、受信されるべきタイミングまでに受信されなかった音声データを音声出力に利用することができないからである。
ただし、シーケンス番号をもとにパケット損失を判定するケースでは、音声出力までに間に合うタイミングでそのパケットが受信された場合、受信したパケットの順番を通信端末23内で入れ替えることにより、音声出力に利用できる可能性があるので、このような入れ替えを行う場合には、前記消失状態検出結果ER1でパケット損失を通知するタイミングが早くなりすぎないように配慮したほうがよい。
補間器13Aは、前記復号器11Aから出力された復号結果DC1の系列に対し、受け取った消失状態検出結果ER1に応じて補間音声(補間音声情報)を挿入し、補間結果IN1を出力する部分である。すなわち当該補間器13Aは、前記消失状態検出結果ER1が音声消失を示したときに、前記基本周期の値(これをPSとする)をもとに作成した補間音声を、前記音声消失に対応する区間に挿入して補間を行い、前記消失状態検出結果ER1が音声消失を示さないときには、補間を行うことなく、受け取った復号結果DC1を透過的に通過させる。補間を行うか否かにかかわらず、補間器13Aの出力は補間結果IN1とする。
また、補間音声を生成するために、補間器13Aは、つねに最新の復号結果(例えば、DC11)を記憶している。補間にも様々な方法を用いることができる可能性があるが、ここでは、前記非特許文献1の方法を用いるものとする。前記非特許文献1の方法で補間を行うとき、基本周期値PSは必須のパラメータである。
ここまでの機能に関する限り、補間器13Bと補間器13Aは同じであるが、両者には機能上、重要な相違がある。
すなわち、補間器13Aのほうは記憶している最新の復号結果(例えば、DC11)をもとに基本周期値PSを生成した上で他方の補間器13Bに通知する機能を備えているが、補間器13Bのほうは通知を受けた基本周期値PSに基づいて補間音声を作成して、前記挿入を行う機能を持つだけである。
新たな復号結果(例えば、DC11)を受け取るたびに補間器13Aが基本周期値PSを生成して他方の補間器13Bに通知する構成を取ること等も可能であるが、通信端末23の処理能力にかかる負荷を低減し、計算量を抑制するためには、消失判定器12が消失状態検出結果ER1で音声消失の発生を示したときに補間器13Aが基本周期値PSを算出する構成とするのが効率的である。
本実施形態の場合、同じパケット(例えば、PK11)に論理チャネルCAとCBの音声データ(例えば、CD11とCD21)を収容しているため、補間器13A側で補間が必要なときには当然、補間器13B側でも補間が必要である。したがって、補間器13Aが算出した基本周期値PSは、自身で補間音声を生成するために使用されるほか、補間器13Bで補間音声を生成するためにも使用される。ただし補間器13Bで使用するには後述する通知が必要である。
補間器13B側では消失状態検出結果ER1を受け取るようにしてもよく、しなくてもよいが、いずれにしても当該補間器13Bは、補間器13Aから基本周期値PSが通知されると、その基本周期値PSを用いて補間音声を生成して復号結果DC2の系列に対する補間を行う。
図2に示すように、補間器13Aは、制御部30と、復号波形記憶部31と、
波形周期算出部32と、周期通知部33と、補間実行部34とを備えている。
このうち制御部30は補間器13A内の各構成要素31〜34を制御する部分である。
補間実行部34は、復号器11Aから受け取った復号結果DC1の系列に対し、必要に応じて、補間を実行する部分で、補間結果IN1を帯域結合器14へ出力する。この補間結果IN1は、ほとんど復号結果DC1の系列と同じものであるが、補間が実行された場合には、該当区間(音声消失が発生している区間)に補間音声が挿入されている点が相違する。
当該補間実行部34が前記復号器11Aから時系列に受け取る復号結果DC1のうち少なくとも最新のものは、復号波形記憶部31に記憶されている。当該復号波形記憶部31に記憶される復号結果DC1の量は、補間音声の生成に必要なだけでよい。
復号波形記憶部31における記憶領域の管理では、新しい復号結果(例えば、DC12)が供給されるたびに、同じサイズの記憶データを、例えば古いもの(例えば、DC11)から順番に削除(または無効化)して、その新しい復号結果を記憶するための記憶領域を確保するようにしてもよい。
波形周期算出部32は、必要が生じたときに、復号波形記憶部31内に記憶されている最新の復号結果(例えば、DC12)をもとに基本周期値PSを生成する部分である。この算出では様々な方法を使用できる可能性があるが、例えば、最新の当該復号結果DC12を用いて公知の自己相関関数を計算し、計算結果が極大になるような遅延量を基本周期値PSとする方法を使用してもよい。算出した基本周期値PSは、当該補間器13A内で行う補間のために利用されるほか、他の補間器13B内で行う補間のためにも利用される点はすでに説明した通りである。
他の補間器13B内で行う補間のため、周期通知部33を用いて、当該基本周期値PSを他の補間器13Bに通知する必要があるが、当該補間器13A内で行う補間のために利用する場合には、当該基本周期値PSは制御部30を介して、前記補間実行部34に渡されることになる。補間音声を生成するとき、当該基本周期値PSは、前記復号波形記憶部43に記憶されているどの時刻の復号波形を補間音声に利用するかを決めるために用いられる。
一方、補間器13Bのほうは、図3に示すように、制御部40と、通知受付部41と、補間実行部42と、復号波形記憶部43とを備えている。
このうち制御部40は前記制御部30に対応し、補間実行部42は前記補間実行部34に対応し、復号波形記憶部43は前記復号波形記憶部31に対応するので、その詳しい説明は省略する。
通知受付部41は、前記周期通知部33に対向する部分で、周期通知部33が通知してくる基本周期値PSを受け取って制御部40に渡す。制御部40を介して当該基本周期値PSを受け取った補間実行部42は、その基本周期値PSをもとに補間音声を生成する。
図2と図3を対比すれば明らかなように、補間器13B内には前記波形周期算出部32に相当する構成要素が存在しないため、作業用の記憶領域をほとんど必要としない点で領域計算量を節約でき、必要な処理能力がわずかである点で時間計算量を節約できる。
補間器13Aから出力される補間結果IN1と、補間器13Bから出力される補間結果IN2は、図1に示す帯域結合器14に供給される。当該帯域結合器14は、これら補間結果IN1とIN2を結合し、ユーザU1が発話したものを通信端末22側で集音した直後と同等の広帯域の音声Vに復元して出力する。
なお、本来、同時刻に処理するはずの上述した同じ音声データの組(例えば、CD11とCD21の組)に対応する各復号結果の組(例えば、DC11とDC21の組)が、厳密には同時に得られない場合には、各復号結果を例えばメモリに一時的に蓄積して遅延を付与することによりタイミング調整を行い、同じ組に属する各復号結果を補間器13Aと13Bに同時に供給する構成とすることも望ましい。このようなタイミング調整は、同じ組を構成する音声データ(例えば、CD11とCD21)のサイズが異なる場合などにも有効である。
以下、上記のような構成を有する本実施形態の動作について説明する。
(A−2)実施形態の動作
前記非特許文献3の帯域分割方式を用いると、ユーザU1の発話した音声は狭帯域WAとWBに分割されるため、各狭帯域WA、WBに対応する音声情報は符号化によって別な音声データ(例えば、CD11とCD21)とされ、同じパケット(例えば、PK11)に収容されて通信端末22から送信される。
通信端末22から各パケットの送信される順番は、上述したように、PK11,PK12,PK13,…の順番である。
パケットPK11〜PK13がネットワーク21を伝送されるときにパケット損失が発生しなければ、通信端末23内の図1に示した消失判定器12が出力する消失状態検出結果ER1が、音声消失の発生を示すことがないから、補間器13A、13Bは補間音声の挿入を行うことなく、復号器11A、11Bから受け取った復号結果DC1、DC2を透過的に(補間結果IN1,IN2として)帯域結合器14に通過させる。
このような状態がつづき、通信品質を劣化させるその他の要因(大きなジッタの発生など)もなければ、通信端末23は高い音声品質で音声出力を継続することができる。
ところが、いずれかのパケット(ここでは、PK12とする)がパケット損失によって失われると、前記消失状態検出結果ER1が音声消失の発生を示すため、補間器13Aがすでに復号波形記憶部31内に記憶してある復号結果(ここでは、DC11(必要に応じてDC11以前の復号結果も含む))をもとに波形周期算出部32に基本周期値PSを算出させる。ここで、算出した基本周期値PSは、音声損失直前の波形の基本周期に対応するものとなっている。
この基本周期値PSは当該補間器13A内で使用するほか、補間器13Bへ通知される。
補間器13A内では当該基本周期値PSをもとに復号波形記憶部31に記憶されているどの時刻の復号波形を利用するかを決め、その復号波形をもとに補間音声を生成し、当該補間音声を復号結果DC1の系列中に挿入することによって、補間を実行する。
この挿入は、復号結果DC1の系列中、もしも前記パケットPK12のパケット損失がなければ、当該PK12に収容されていた音声データCD12の復号結果であるDC12が存在したずの位置、すなわち、復号結果DC11とDC13のあいだの位置に対して実行される。
補間器13Aから前記基本周期値PSの通知を受けた補間器13B内でも、補間器13A内と同様の補間が行われる。すなわち、当該基本周期値PSをもとに復号波形記憶部43に記憶されているどの時刻の復号波形を利用するかを決め、その復号波形をもとに補間音声を生成し、復号結果DC2の系列中、前記復号結果DC22が存在したはずの位置に対して当該補間音声を挿入する。
当該補間音声を含む補間結果IN2の系列は、当該補間器13Bから帯域結合器14に供給されて、補間器13Aから帯域結合器14へ供給される補間結果IN1の系列と結合され、広帯域の音声Vとして出力される。通信端末23側のユーザU2はこの音声Vを聴取することになる。
この場合、復号結果DC12とDC22の組に対応する音声Vが出力されたはずの時刻には、ユーザU2は、結合された補間音声を聴取することになる。
補間音声は擬似的な音声情報であるから、本来の復号結果であるDC12やDC22が得られた場合に比べると、ユーザU2が聴取する音声Vの品質が低下することは避けられないが、音声消失が発生しているにもかかわらず補間音声の挿入さえ実行できないケースに比較すると、音声品質が高いといえる。
しかも本実施形態では、補間音声の生成に必要な基本周期値PSをつくるための構成要素である波形周期算出部32は、2つの補間器13A、13Bのうち補間器13A側にのみ設けておけばよいため、音声品質が高い割に時間計算量も領域計算量も少なく、装置規模も小さい。
(A−3)実施形態の効果
本実施形態によれば、一方の論理チャネル(CA)側でのみ基本周期値(PS)を算出するため、その算出に必要な時間計算量と領域計算量を節約することができ、時間計算量と領域計算量が少ない割に通信品質が高く効率的な構成の通信端末(23)を提供することが可能である。
時間計算量や領域計算量が少ないことは具体的な実装において、メモリ量、演算処理量、装置規模、消費電力の低減、縮小につながり、コストアップの抑制が可能となる。
(B)他の実施形態
上記実施形態にかかわらず、周波数が高いほうの狭帯域WBに対応する論理チャネルCBを処理する補間器13Bに、図2の構成を用い、周波数が低いほうの狭帯域WAに対応する論理チャネルCAを処理する補間器13Aに、図3の構成を用いるようにしてもよい。
なお、上記実施形態では、狭帯域WAとWBは周波数軸上で接触していたが、接触していない2つの狭帯域(例えば、0〜4kHzの狭帯域と4.5〜8kHzの狭帯域)を設定してもかまわない。
また、設定する狭帯域の数は、3つ以上であってもよいことは当然である。狭帯域の数が3つ以上の場合、1つの通信端末に含まれる補間器の数も3つ以上になる。
さらに、図2に示した構成要素31,32,33を持つ補間器が、1つの通信端末内に複数存在する構成を取ることも有効である。
実際には、分割したいずれかの帯域(いずれかの論理チャネル)にのみ雑音が多く基本周期値が得られないことが起こり得るが、そのような場合、1つの通信端末内に図2の構成の補間器を複数設けておくことが有効である。ただしこの場合、各補間器には、図2の構成に加えて図3中の通知受付部41に相当する構成要素も用意し、補間器相互間で基本周期の値を通知しあう構成とする。
複数の論理チャネルに対応する複数の補間器で基本周期の値を算出して他の補間器に通知できるように構成しておけば、いずれか1つでも雑音の少ない論理チャネルがあると、その論理チャネルに対応する補間器で算出した基本周期の値を他の補間器で利用することが可能になり、有効な補間を実行することができるからである。これにより、すべての論理チャネルで有効な補間を行うことのできない状態が発生する確率を低減し、通信品質のいっそうの向上をはかることができる。
また、上述したように、各論理チャネル(例えば、CA、CB)の音声情報を別個のパケットに収容して送信するようにしてもよい。
なお、上記実施形態では、周波数軸上で分割した音声情報を異なる論理チャネルに伝送させたが、異なる論理チャネルで伝送させる音声情報は必ずしも周波数軸上で分割したものである必要はない。例えば、時間軸上で分割した音声情報を異なる論理チャネルで伝送させること等も可能である。時間軸上で分割しても、分割の単位が十分に短時間であれば、リアルタイム性のある通信を行うことが可能である。
また、上記実施形態では、パケット損失(音声消失)が発生したときに補間器による補間を行わせたが、パケット損失が発生していないときにも補間を行うことができる可能性がある。
例えば、あるパケット(フレーム)について伝送誤りの発生を検出した場合や雑音の混入を検出した場合などに、補間を実行するようにしてもよい。パケットを受信することはできても、伝送誤りが検出された場合や雑音が検出された場合などには、そのパケット中の音声データが壊れているか、品質が低いために、補間音声と置き換えたほうがよいこともあり得るからである。
また、上記実施形態では、電話(IP電話)による音声情報を例に本発明を説明したが、本発明は、電話による音声情報以外の音声情報にも適用可能である。例えば、音声・トーン信号などの周期性を用いた処理を並列して行う場合に広く適用することができる。
さらに、本発明の適用範囲は必ずしも音声やトーンなどに限定されない。例えば、動画像などの画像情報に適用できる可能性もある。
また、本発明を適用する通信プロトコルは、上述したIPプロトコルに限定する必要はないことは当然である。
以上の説明では主としてハードウエア的に本発明を実現したが、本発明はソフトウエア的に実現することも可能である。
実施形態で使用する通信端末の主要部の構成例を示す概略図である。 実施形態の通信端末に含まれる補間器の構成例を示す概略図である。 実施形態の通信端末に含まれる他の補間器の構成例を示す概略図である。 実施形態にかかる通信システムの全体構成例を示す概略図である。
符号の説明
11A、11B…復号器、12…消失判定器、13A、13B…補間器、14…帯域結合器、20…通信システム、21…ネットワーク、22、23…通信端末、30,40…制御部、31、43…復号波形記憶部、32…波形周期算出部、33…周期通知部、34,42…補間実行部、41…通知受付部、PK11〜PK13…パケット、CD1,CD2,CD11〜CD13,CD21〜CD23…音声データ、DC1,DC2,DC11〜DC13,DC21〜DC23…復号結果、PS…基本周期。

Claims (3)

  1. 送信装置側で、所定の発生源から発生した元周期性信号を各論理チャネルに合わせて複数の要素周期性信号に分割し、分割によって得た各要素周期性信号の符号化結果である複数の符号化要素周期性信号を伝送単位信号に収容して送信したものを、所定の伝送路経由で受信し、伝送単位信号から取り出した符号化要素周期性信号の復号結果である要素周期性信号に応じた再生出力を行う受信装置において、
    前記伝送路における伝送中、時系列に受信される前記伝送単位信号のうちのいずれかに、収容している符号化要素周期性信号を再生出力に使用することを妨げる所定の妨害事象が発生したことを検出する妨害事象検出手段を設けると共に、
    当該妨害事象検出手段が妨害事象の発生を検出した場合、その伝送単位信号に収容されていた符号化要素周期性信号の替わりとなる代替要素周期性信号を、所定の周期をもとに生成して、要素周期性信号の系列中に挿入する補間手段を、前記論理チャネルの数だけ設け、
    前記各論理チャネルごとに設けられた複数の補間手段は、該当する論理チャネルで受信された伝送単位信号から取り出した符号化要素周期性信号の復号結果である要素周期性信号を記憶する要素周期性信号記憶部を備え、
    前記各論理チャネルごとに設けられた複数の補間手段のうち少なくともいずれか1つは、
    前記要素周期性信号記憶部に記憶してある要素周期性信号から、前記代替要素周期性信号の生成の基礎となる情報であって、同じ元周期性信号を分割して得られた各要素周期性信号に共通する前記周期の値を算出する周期算出部と、
    算出した周期の値を他の補間手段に通知する周期通知部とを有することを特徴とする受信装置。
  2. 請求項1の受信装置において、
    前記各論理チャネルごとに設けられた複数の補間手段のうち少なくとも2つ以上が、
    前記要素周期性信号記憶部と、前記周期算出部と、前記周期通知部とを備えることを特徴とする受信装置。
  3. 送信装置側で、所定の発生源から発生した元周期性信号を各論理チャネルに合わせて複数の要素周期性信号に分割し、分割によって得た各要素周期性信号の符号化結果である複数の符号化要素周期性信号を伝送単位信号に収容して送信したものを、所定の伝送路経由で受信し、伝送単位信号から取り出した符号化要素周期性信号の復号結果である要素周期性信号に応じた再生出力を行う受信方法において、
    前記伝送路における伝送中、時系列に受信される前記伝送単位信号のうちのいずれかに、収容している符号化要素周期性信号を再生出力に使用することを妨げる所定の妨害事象が発生したことを、妨害事象検出手段が検出し、
    当該妨害事象検出手段が妨害事象の発生を検出した場合、その伝送単位信号に収容されていた符号化要素周期性信号の替わりとなる代替要素周期性信号を、
    前記論理チャネルの数だけ設けられた各補間手段が所定の周期をもとに生成して、要素周期性信号の系列中に挿入する場合、
    前記各論理チャネルごとに設けられた複数の補間手段は、該当する論理チャネルで受信された伝送単位信号から取り出した符号化要素周期性信号の復号結果である要素周期性信号を要素周期性信号記憶部に記憶し、
    前記各論理チャネルごとに設けられた複数の補間手段のうち少なくともいずれか1つでは、
    前記要素周期性信号記憶部に記憶してある要素周期性信号から、前記代替要素周期性信号の生成の基礎となる情報であって、同じ元周期性信号を分割して得られた各要素周期性信号に共通する前記周期の値を、周期算出部で算出し、
    算出した周期の値を、周期通知部が他の補間手段に通知することを特徴とする受信方法。
JP2003377339A 2003-11-06 2003-11-06 受信装置および方法 Expired - Lifetime JP4093174B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2003377339A JP4093174B2 (ja) 2003-11-06 2003-11-06 受信装置および方法
GB0608295A GB2424156B (en) 2003-11-06 2004-10-27 Receiving device and method
US10/577,440 US7586937B2 (en) 2003-11-06 2004-10-27 Receiving device and method
CN2004800300212A CN1868151B (zh) 2003-11-06 2004-10-27 接收装置和方法
PCT/JP2004/015892 WO2005057818A1 (ja) 2003-11-06 2004-10-27 受信装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003377339A JP4093174B2 (ja) 2003-11-06 2003-11-06 受信装置および方法

Publications (2)

Publication Number Publication Date
JP2005142856A JP2005142856A (ja) 2005-06-02
JP4093174B2 true JP4093174B2 (ja) 2008-06-04

Family

ID=34674792

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003377339A Expired - Lifetime JP4093174B2 (ja) 2003-11-06 2003-11-06 受信装置および方法

Country Status (5)

Country Link
US (1) US7586937B2 (ja)
JP (1) JP4093174B2 (ja)
CN (1) CN1868151B (ja)
GB (1) GB2424156B (ja)
WO (1) WO2005057818A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4642617B2 (ja) * 2005-09-16 2011-03-02 シャープ株式会社 受信機器、電子装置、通信方法、通信プログラム、および記録媒体
JP5411807B2 (ja) * 2010-05-25 2014-02-12 日本電信電話株式会社 チャネル統合方法、チャネル統合装置、プログラム
US8594254B2 (en) * 2010-09-27 2013-11-26 Quantum Corporation Waveform interpolator architecture for accurate timing recovery based on up-sampling technique
WO2016127336A1 (zh) * 2015-02-11 2016-08-18 华为技术有限公司 传输数据的方法及装置、第一设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0888607A (ja) * 1994-09-20 1996-04-02 Fujitsu Ltd ディジタル電話機
JPH08125990A (ja) * 1994-10-20 1996-05-17 Sony Corp 符号化装置および復号化装置
CN1114294C (zh) * 2000-06-15 2003-07-09 华为技术有限公司 速度自适应信道估计方法及装置
US6526264B2 (en) * 2000-11-03 2003-02-25 Cognio, Inc. Wideband multi-protocol wireless radio transceiver system
EP1326359A1 (en) * 2002-01-08 2003-07-09 Alcatel Adaptive bit rate vocoder for IP telecommunications
US7352720B2 (en) * 2003-06-16 2008-04-01 Broadcom Corporation System and method to determine a bit error probability of received communications within a cellular wireless network

Also Published As

Publication number Publication date
WO2005057818A1 (ja) 2005-06-23
JP2005142856A (ja) 2005-06-02
US7586937B2 (en) 2009-09-08
CN1868151B (zh) 2012-11-07
CN1868151A (zh) 2006-11-22
GB2424156A (en) 2006-09-13
US20070073545A1 (en) 2007-03-29
GB2424156B (en) 2007-09-05
GB0608295D0 (en) 2006-06-07

Similar Documents

Publication Publication Date Title
JP5362808B2 (ja) 音声通信におけるフレーム消失キャンセル
KR101301843B1 (ko) 스피치 프레임내의 정보의 분실을 방지하는 시스템 및 방법
EP1746581B1 (en) Sound packet transmitting method, sound packet transmitting apparatus, sound packet transmitting program, and recording medium in which that program has been recorded
KR101290425B1 (ko) 소거된 스피치 프레임을 복원하는 시스템 및 방법
JP2007258928A (ja) ゆらぎ吸収バッファ制御装置
KR20090113894A (ko) 일련의 데이터 패킷들을 전송하기 위한 장치와 방법, 디코더, 및 일련의 데이터 패킷들을 디코딩하기 위한 장치
JP3566931B2 (ja) 音声信号の符号列のパケット組立方法、装置及びパケット分解方法、装置並びにこれらの方法を実行するプログラム、プログラムを記録する記録媒体
EP2610867B1 (en) Audio reproducing device and audio reproducing method
JP4093174B2 (ja) 受信装置および方法
KR100792209B1 (ko) 디지털 오디오 패킷 손실을 복구하기 위한 방법 및 장치
US7793202B2 (en) Loss compensation device, loss compensation method and loss compensation program
CN1929355B (zh) 语音包丢失恢复系统以及方法
KR100594599B1 (ko) 수신단 기반의 패킷 손실 복구 장치 및 그 방법
JP2008139661A (ja) 音声信号受信装置、それに使用される音声パケット消失補償方法、その方法を実施するプログラム、及びそのプログラムを記録した記録媒体
KR100911771B1 (ko) 음성통신의 패킷 손실을 은닉하는 단말장치 및 방법
JP4135621B2 (ja) 受信装置および方法
JP2004301907A (ja) 音声符号化装置
JP2004080625A (ja) パケット型音声通信端末
JP2002252644A (ja) 音声パケット通信装置及び音声パケット通信方法
KR20050027272A (ko) 스피치 프레임들의 에러 경감을 위한 스피치 통신 유닛 및방법
JP4869882B2 (ja) 音声復号装置
JP2002099299A (ja) 無音圧縮音声符号化復号化装置
JPH0263333A (ja) 音声符号化・復号化装置
JP4510742B2 (ja) 音声パケット受信再生方法及びその装置、そのプログラム記録媒体
JP2009111838A (ja) 音声データ伝送装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060131

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080225

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110314

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4093174

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110314

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120314

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130314

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140314

Year of fee payment: 6

EXPY Cancellation because of completion of term