JP2005094356A - 音声信号伝送システム、及び音声信号伝送方法 - Google Patents

音声信号伝送システム、及び音声信号伝送方法 Download PDF

Info

Publication number
JP2005094356A
JP2005094356A JP2003325001A JP2003325001A JP2005094356A JP 2005094356 A JP2005094356 A JP 2005094356A JP 2003325001 A JP2003325001 A JP 2003325001A JP 2003325001 A JP2003325001 A JP 2003325001A JP 2005094356 A JP2005094356 A JP 2005094356A
Authority
JP
Japan
Prior art keywords
signal
packet
encoded
speech
encoded information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003325001A
Other languages
English (en)
Other versions
JP4365653B2 (ja
Inventor
Hiroyuki Ebara
宏幸 江原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2003325001A priority Critical patent/JP4365653B2/ja
Priority to US10/923,700 priority patent/US7502735B2/en
Publication of JP2005094356A publication Critical patent/JP2005094356A/ja
Application granted granted Critical
Publication of JP4365653B2 publication Critical patent/JP4365653B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)

Abstract

【課題】 連続したフレーム消失後であっても誤りの影響が伝播せず、追加の伝送遅延も必要としない、符号化音声伝送方法を用いた音声信号伝送システム、及び音声信号伝送方法を提供すること。
【解決手段】 フレーム分類情報FIは、Dec2の処理を行うことを示すので、フレーム消失補償処理部410によって第1の復号信号Sfが生成される。次に、通常復号化処理部409の内部状態がリセットされ、パラメータ保持部414が第1の符号化情報Fを保持する。次に、通常復号化処理部409が第2の符号化情報fを用いて第2の復号信号So を生成する。次に、窓掛け部411,412と加算器413によって数式(1)のような重ね合わせ加算処理が行われて最終出力信号Sが生成される。
【選択図】 図8

Description

本発明は、符号化した音声情報を伝送する通信システム、特にCELP型音声符号化を用いて符号化したパラメータをパケット化して伝送するような音声信号伝送システム、及び音声信号伝送方法などに関する。
従来、インターネット通信に代表されるパケット通信においては、伝送路においてパケットが消失するなどして復号器側で符号化情報を受信できない場合、消失補償(隠蔽)処理を行うのが一般的である。このようなパケット消失に対応する手法の1つとして図11に示すような方式が知られている。
送信側では、入力されるデジタル音声信号に対して数十msのフレーム単位で処理が行われる。図11において、F(n)は第nフレームの符号化データ、P(n)はn番目のペイロードパケット、をそれぞれ表す。
図11では、連続する2フレームの符号化データが1つのパケットに多重化されて送信側から受信側へ伝送される様子を示している。同じパケットに多重化される2フレームは1フレームずつシフトするので、各フレームの符号化データは別々のパケットを用いて2度送信側から受信側へ伝送される。
受信側ではパケット・多重化分離後、受信した2フレームの符号化データの一方(図ではフレーム番号が若い方)を用いて復号化処理を行う。パケット消失がない場合は、重複して伝送された符号化データは全て無駄になり、2フレームをまとめて多重化するため1フレームずつ伝送する場合に比べて1フレームだけ伝送遅延が余計に増えてしまう。
しかしながら、パケット消失があった場合でも、図12に示すように、1パケットの消失であれば、直前に受信したパケットに入っている符号化データを利用できるので、誤り(パケット消失)の影響を全く受けない。
このような伝送方法は例えば非特許文献1などで開示されている。但し、2パケット以上連続して消失した場合は、符号化データが消失するフレームが発生するため、フレーム消失隠蔽処理を復号器で行う必要がある。フレーム消失隠蔽処理の例としては、非特許文献2に示される方法などが挙げられる。
IETF標準RFC3267 3GPP3GTS26−091
しかしながら、パケット(またはフレーム)消失隠蔽処理は、過去に受信済みの符号化情報を用いて復号器側で独立的に処理が行われるため、符号器側で過去の符号化情報を利用した符号化処理が行われている場合は、消失部分のみならず消失部以降の区間にパケット消失の影響が伝播し、復号音声の品質を大きく劣化させる場合がある。
例えば、音声符号化方式としてCELP(Code Excited Linear Prediction)方式を用いる場合、過去の復号駆動音源信号を用いて音声の符号化・復号化処理が行われるため、フレーム消失処理によって符号器と復号器とで異なる駆動音源信号が合成されてしまうと、その後しばらくの間は、符号器と復号器の内部状態が一致せず、復号音声の品質が大きく劣化してしまう場合がある。
したがって、従来の音声符号化方法では、連続したパケット消失が発生すると復号音声の品質が大きく劣化する場合があるという問題がある。また、前記従来の方法では1フレーム分伝送遅延が余計にかかってしまうという問題もある。
本発明はかかる点に鑑みてなされたものであり、連続したフレーム消失後であっても誤りの影響が伝播せず、追加の伝送遅延も必要としない、符号化音声伝送方法を用いた音声信号伝送システム、及び音声信号伝送方法を提供することを目的とする。
本発明の音声信号伝送システムは、通常状態で符号化した第1の符号化情報と、音声符号化装置の内部状態をリセットして符号化した第2の符号化情報と、を多重化・パケット化して音声信号受信装置に送信する音声信号送信装置と、前記多重化・パケット化された第1の符号化情報と第2の符号化情報とを前記音声信号送信措置から受信してパケット分離・多重化分離し、前記分離した受信パケットに損失があった場合はパケット隠蔽処理を行い、損失パケット直後に受信したパケットでは前記第2の符号化情報を用いて復号化処理を行う音声信号受信装置と、を具備する構成を採る。
また、本発明の音声信号伝送システムは、請求項1記載の音声信号伝送システムにおいて、前記音声符号化装置は、適応符号帳と固定符号帳を備えるCELP型音声符号化装置である。
この発明によれば、追加伝送遅延なしにパケット損失によって生じる誤り伝播を抑えることが可能な音声伝送システムを構築することができる。
本発明の音声信号伝送システムは、請求項1記載の音声信号伝送システムにおいて、前記音声信号受信装置は、前記損失パケット直後の正常パケットにおいて、パケット消失隠蔽処理を行って生成した合成信号と、受信した符号化情報を復号して得られる合成信号と、を重ね合わせ加算処理により重ね合わせた信号として最終的な復号合成信号を出力する音声復号化装置を備える。
この発明によれば、パケット損失によって生じる誤り伝播を損失パケット直後の1パケットで収束させるとともに、損失パケットで生成された復号音声信号と損失パケット直後の正常フレームで復号生成された復号音声信号とを滑らかに接続し、音声の主観的な品質劣化を抑えることができる。
本発明の音声信号伝送システムは、請求項1から3のいずれかに記載の音声信号伝送システムにおいて、前記音声信号送信装置は、目標信号と適応符号帳によって生成される合成信号との誤差信号を算出する第一の誤差算出手段と、前記目標信号と固定符号帳によって生成される合成信号との誤差信号を算出する第二の誤差算出手段と、前記第一の誤差算出手段により算出された誤差信号と、前記第二の誤差算出手段により算出された誤差信号との比を算出する誤差信号比算出手段と、前記誤差信号比算出手段により算出された誤差信号比の大きさによって音声フレームを分類する音声フレーム分類手段と、前記音声フレーム分類手段の分類結果に基づいて、前記音声符号化装置の内部状態をリセットして符号化した第2の符号化情報を多重化するか否かを判定する多重化判定手段と、を備え、前記第2の符号化情報を多重化すると判定した場合以外は、前記通常状態で符号化した第1の符号化情報だけを音声符号化情報として送信する構成を採る。
この発明によれば、パケット損失により誤り伝播による品質劣化を招き易い音声フレームに対してのみ第2の符号化情報を追加して伝送するため、低い平均伝送ビットレートで誤り伝播による音声の品質劣化を抑えることができ、効率的で高品質な音声信号の伝送が可能となる。
本発明の音声信号電送システムは、請求項1または4のいずれかに記載の音声信号送信装置を備えた基地局装置と、請求項1から3のいずれかに記載した音声信号受信装置を備えた移動局装置と、を備える構成を採る。
この発明によれば、追加伝送遅延なしにパケット損失によって生じる誤り伝播を抑えることが可能な移動局装置を提供することができる。
本発明の音声信号伝送方法は、符号化した音声情報を伝送するための音声信号伝送方法において、通常状態で符号化した第1の符号化情報と、音声符号化装置の内部状態をリセットして符号化した第2の符号化情報と、を多重化・パケット化して送信する工程と、前記多重化・パケット化された第1の符号化情報と第2の符号化情報とを受信してパケット分離・多重化分離する工程と、前記分離した受信パケットに損失があった場合はパケット隠蔽処理を行い、損失パケット直後に受信したパケットでは前記第2の符号化情報を用いて復号化処理を行う工程と、を具備する。
この発明によれば、追加伝送遅延なしにパケット損失によって生じる誤り伝播を抑えることが可能な音声伝送システムを構築することができる。
本発明の音声信号伝送プログラムは、符号化した音声情報を伝送するための音声信号伝送プログラムにおいて、通常状態で符号化した第1の符号化情報と、音声符号化装置の内部状態をリセットして符号化した第2の符号化情報と、を多重化・パケット化して送信するステップと、前記多重化・パケット化された第1の符号化情報と第2の符号化情報とを受信してパケット分離・多重化分離するステップと、前記分離した受信パケットに損失があった場合はパケット隠蔽処理を行い、損失パケット直後に受信したパケットでは前記第2の符号化情報を用いて復号化処理を行うステップと、を具備する。
この発明によれば、追加伝送遅延なしにパケット損失によって生じる誤り伝播を抑えることが可能な音声伝送システムを構築することができる。
本発明によれば、追加伝送遅延なしにパケット損失によって生じる誤り伝播を抑えることが可能な音声伝送システムを構築することができる。
本発明の骨子は、リセット状態で符号化した符号化データを冗長情報として追加伝送する事によって、フレーム消失直後の符号化装置と復号化装置の内部状態を同期させ、消失フレーム後の正常フレームにフレーム消失の影響が伝播することを防ぎ、フレーム消失条件化の復号化音声信号の主観品質を、追加の伝送遅延なしに改善することである。また、前記冗長情報を追加伝送するフレームを効果的に選択し、追加伝送情報をなるべく少なくすることである。
以下、本発明の一実施の形態について図面を参照して詳細に説明する。
図1は、本発明の実施の形態に係る音声信号伝送システムの構成を示すブロック図である。
図1において、音声信号伝送システムは、本発明の音声信号送信装置としての機能を搭載した基地局100と、本発明の音声信号受信装置としての機能を搭載した移動局装置110を具備している。
基地局100は、入力装置101、A/D変換装置102、音声符号化装置103、信号処理装置104、RF変調装置105、送信装置106及びアンテナ107を有している。
A/D変換装置102の入力端子は、入力装置101に接続されている。音声符号化装置103の入力端子は、A/D変換装置102の出力端子に接続されている。信号処理装置104の入力端子は、音声符号化装置103の出力端子に接続されている。RF変調装置105の入力端子は、信号処理装置104の出力端子に接続されている。送信装置106の入力端子は、RF変調装置105の出力端子に接続されている。アンテナ107は、送信装置106の出力端子に接続されている。
入力装置101は、マイクなどにより構成され、ユーザの音声を受けてこれを電気信号であるアナログ音声信号に変換してA/D変換装置102に出力する。A/D変換装置102は、入力装置101から入力されるアナログ音声信号をデジタル音声信号に変換して音声符号化装置103に出力する。
音声符号化装置103は、A/D変換装置102から入力されるデジタル音声信号を符号化して音声符号化ビット列を生成して信号処理装置104に出力する。信号処理装置104は、音声符号化装置103から入力された音声符号化ビット列にチャネル符号化処理やパケット化処理及び送信バッファ処理等を行った後、その音声符号化ビット列をRF変調装置105に出力する。
RF変調装置105は、信号処理装置104から入力されたチャネル符号化処理等が行われた音声符号化ビット列の信号を変調して送信装置106に出力する。送信装置106は、RF変調装置105から入力された変調された音声符号化信号をアンテナ107を介して電波(RF信号)として移動局装置110に送信する。
基地局100においては、A/D変換装置102を介して得られるデジタル音声信号に対して数十msのフレーム単位で処理が行われる。システムを構成するネットワークがパケット網である場合には、1フレーム又は数フレームの符号化データを1つのパケットに入れこのパケットをパケット網に送出する。なお、前記ネットワークが回線交換網の場合には、パケット化処理や送信バッファ処理は不要である。
移動局装置110は、アンテナ111、受信装置112、RF復調装置113、信号処理装置114、音声復号化装置115、D/A変換装置116及び出力装置117を有している。
受信装置112の入力端子は、アンテナ111に接続されている。RF復調装置113の入力端子は、受信装置112の出力端子に接続されている。信号処理装置114の入力端子は、RF復調装置113の出力端子に接続されている。音声復号化装置115の入力端子は、信号処理装置114の出力端子に接続されている。D/A変換装置116の入力端子は、音声復号化装置115の出力端子に接続されている。出力装置117の入力端子は、D/A変換装置116の出力端子に接続されている。
受信装置112は、アンテナ111を介して、基地局100から送信される音声符号化情報を含んでいる電波(RF信号)を受信してアナログの電気信号である受信音声符号化信号を生成し、これをRF復調装置113に出力する。アンテナ111を介して受信した電波(RF信号)は、伝送路において信号の減衰や雑音の重畳がなければ、基地局100において送出された電波(RF信号)と全く同じものになる。
RF復調装置113は、受信装置112から入力された受信音声符号化信号を復調して信号処理装置114に出力する。信号処理装置114は、RF復調装置113から入力された受信音声符号化信号のジッタ吸収バッファリング処理、パケット組みたて処理およびチャネル復号化処理等を行い、受信音声符号化ビット列を音声復号化装置115に出力する。
音声復号化装置115は、信号処理装置114から入力された受信音声符号化ビット列の復号化処理を行って復号音声信号を生成してD/A変換装置116に出力する。D/A変換装置116は、音声復号化装置115から入力されたデジタル復号音声信号をアナログ復号音声信号に変換して出力装置117に出力する。出力装置117は、スピーカなどにより構成され、D/A変換装置116から入力されたアナログ復号音声信号を空気の振動に変換し音波として人間の耳に聞こえる様に出力する。
次に、本実施の形態の音声信号伝送システムにおける符号化データの流れについて、図2を参照して説明する。図2は、伝送路誤りがない場合を示している。
図2において、送信側では2種類のフレームデータが、図には示されていない音声符号化装置によって符号化される。1つは通常状態で符号化された第1の符号化情報(フレームデータ1)であり、第nフレームにおける第1の符号化情報をF(n)と表す。もう1つは音声符号化装置の内部状態をリセットして符号化した第2の符号化情報(フレームデータ2)であり、第nフレームにおける第2の符号化情報をf(n)と表す。
図2に示すように、第1の符号化情報F(n)と第2の符号化情報f(n)は1つのペイロードパケットP(n)に多重化・パケット化されて送信側から受信側へパケット網を介して伝送される。受信側では、ペイロードパケットP(n)のパケットから第1の符号化情報F(n)を取りだして、図には示していない音声復号化装置へ渡す。伝送路誤りがなければ第2の符号化情報f(n)は音声復号化処理に用いられる事はない。
図3は、本実施の形態の音声信号伝送システムにおけるフレーム消失が発生する符号化データの流れを示す図であり、第nフレームのデータを伝送している第nパケットが伝送途中で消失した場合を示したものである。
受信側ではペイロードパケットP(n)を受信できないので、第nフレームの復号に用いるべき符号化情報は得られない。このため、第nフレームについては、音声復号化装置は公知のフレーム消失隠蔽(補償)処理を行って復号音声信号を生成し、内部状態を更新する。
続く第n+1フレームでは、ペイロードパケットP(n+1)から第2の符号化情報f(n+1)が取り出されて音声復号化装置へ渡される。音声復号化装置は、フレーム消失直後の正常フレームでは内部状態をリセットして復号化処理を行う。続く第n+2フレーム以降ではペイロードパケットから第1の符号化情報が取り出されて音声復号化装置へ渡される。
但し、後述するように、スペクトルパラメータや利得パラメータの符号化にMA予測を用いているような場合は、第n+2フレームにおいてその予測器の状態を第n+1フレームで受信した第1の符号化情報F(n+1)を用いて更新した方が良い。
このような更新ができない場合、例えばパケットの情報を多重化分離する装置と音声復号化装置との間の伝送レートが1種類の符号化データの伝送しか許容しない場合や音声復号化装置への入力データが1種類に限られている場合、MA予測器の状態が一致しない可能性のあるフレームでは復号信号が局所的に大きくなる事を避けるために利得のクリッピング処理を行う必要がある。このような利得のクリッピング処理は従来のフレーム消失隠蔽処理においても一般的に行われている。
図4は、予測器の更新を行う場合の復号化処理方法について示した図である。ペイロードパケットは図3と同じであり、第nパケットが消失した場合を示している。パケット内に多重化された第1の符号化情報と第2の符号化情報がどのように利用されて復号化信号が生成されるのかを示されている。復号化処理は4種類(Dec0,Dec1,Dec2,Dec3)あり、符号化情報の受信状況に応じて切替えられる。
Dec0は、通常の復号化処理であり、ペイロードパケットP(i)から多重化分離して得られた第1の符号化情報F(i)を用いて通常の復号化処理が行われる。Dec1は、フレーム消失時の隠蔽処理で、非特許文献2に示されるような一般的な処理である。
Dec2は、消失フレーム直後の通常フレームn+1で行われる復号化処理で、まずDec2と同じフレーム消失補償処理を行って復号化信号Aを合成し、続いて復号化装置の内部状態をリセットして第2の符号化情報f(n+1)を用いて復号化処理を行って復号化信号Bを合成し、復号化信号AとBを重ね合わせ加算処理で重ね合わせて最終的な復号化信号を生成する処理を行う。また、同時に、第1の符号化情報F(n+1)を保持する処理を行う。
Dec3は、Dec2の処理を行った次のフレームn+2で行われる復号化処理で、Dec2で保持された第1の符号化情報F(n+1)を用いて復号化装置の内部状態を更新してから、第1の符号化情報F(n+2)を用いて通常の復号化処理を行う。Dec3で行われる内部状態の更新とは、復号化装置においてMA予測器が用いられている場合、第n+1フレームでMA予測器の状態がf(n+1)によって生成されているため、第n+2フレームでF(n+1)によって生成しなおし、第n+2フレームでの復号化処理が正しく行われるようにする処理のことである。MA予測の次数が高く、MA予測器の状態が2フレーム以上の符号化情報から生成される場合は、Dec3の復号化処理を2フレーム以上続ける必要もあるが、図4ではMA予測器の状態が1フレーム以内で生成されることを想定している。
次に、上記Dec0,1,2,3の各復号化処理を実現する音声復号化装置のブロック図を図5〜図9に示し、その構成及び動作について説明する。
図5は、音声復号化装置の構成を示すブロック図である。音声復号化装置は、パケット分離部401、フレーム分類部402、切替スイッチ403,404,405,406,407,408、通常復号化処理部409、フレーム消失補償処理部410、窓掛け部411,412、加算器413、及びパラメータ保持部414を備える。
パケット分離部401は、パケットペイロード(パケットデータ)から第1の符号化情報Fと第2の符号化情報fとフレームタイプ情報FTを取り出し、第1の符号化情報Fと第2の符号化情報fを切替スイッチ403,404に出力し、フレームタイプ情報FTをフレーム分類部402に出力する。
フレーム分類部402は、パケット分離部401から入力されたフレームタイプ情報FTに基づいて、復号化処理Dec0〜Dec3のうちいずれの処理を行うかを判別し、その判別結果として復号化処理Dec0〜Dec3を示すフレーム分類情報FIを生成し、切替スイッチ403〜408に出力する。
切替スイッチ403〜408は、フレーム分類部402から入力されるフレーム分類情報FIにより、復号化処理Dec0〜Dec3に応じた切替位置に切り替えられる。
通常復号化処理部409は、復号化装置の内部状態をリセット後、切替スイッチ403を介してパケット分離部401から入力された第2の符号化情報fの復号化処理を行って第2の復号信号So(n)を生成し、切替スイッチ405を介して窓掛け部412に出力する。
フレーム消失補償処理部410は、第1の復号信号Sf(n)(nはサンプル番号)を生成し、切替スイッチ406を介して窓掛け部411に出力する。
窓掛け部411は、フレーム消失補償処理部410から入力された第1の復号信号Sf(n)に、時間とともに振幅が減衰する窓(例えば、wf(n)=1−n/L,但し、Lは窓長、で示されるような三角窓)を乗じて加算器413に出力する。
窓掛け部412は、通常復号化処理部409から入力される第2の復号信号So(n)に、時間とともに振幅が増大する窓(例えば、wo(n)=n/L で示されるような三角窓)を乗じて加算器413に出力する。
加算器413は、窓掛け部411および412から入力された2つの信号を加算し、その加算結果を切替スイッチ408を介して最終復号信号として出力する。
パラメータ保持部414は、メモリを内蔵し、切替スイッチ404を介してパケット分離部401から入力された第1の符号化情報Fをメモリに保持する。
なお、図5に示す各切替スイッチ403〜408の切り替え状態は、復号化処理Dec0〜Dec3に応じたものではない。各復号化処理Dec0〜Dec3に応じた各切替スイッチ403〜408の切り替え状態は、以下の図6〜図9において示す。
図6は、Dec0の復号化処理を実行する際の切替スイッチ403〜408の動作を示しており、図5の中でDec0の復号化処理時に使用されない部分(窓掛け部411,412)を薄く表示したものである。
パケット分離部401は、パケットペイロード(パケットデータ)から第1の符号化情報Fと第2の符号化情報fとフレームタイプ情報FTを取り出す。フレームタイプ情報FTは、符号化情報を生成した符号化装置の情報(アルゴリズムやビットレートなどを特定する)やパケット消失が発生したことを示す情報などを示すもので、符号化情報とは別の情報としてペイロードパケットに多重化されている。フレームタイプ情報FTは、フレーム分類部402に入力され、フレーム分類部402は、フレームタイプ情報FTに基づいて、復号化処理Dec0〜Dec3のうちいずれの処理を行うかを判別し、その判別結果として復号化処理Dec0〜Dec3を示すフレーム分類情報FIを生成し、切替スイッチ403〜408に出力する。
次に、図6では、フレーム分類情報FIは、Dec0の処理を行うことを示すので、通常復号化処理部409の入力端子に接続された切替スイッチ403は、パケット分離部401の第1の符号化情報Fの出力端子に接続され、通常復号化処理部409の出力端子に接続された切替スイッチ405は切替スイッチ408に接続され、最終出力端子に接続された切替スイッチ408は切替スイッチ405に接続され、切替スイッチ404,407は開放される。パケット分離部401から出力された第1の符号化情報Fは、通常復号化処理部409によって復号化されて、その復号信号が最終復号信号として出力される。
次に、図7では、フレーム分類情報FIは、Dec1の処理を行うことを示すので、フレーム消失補償処理部410の出力端子に接続された切替スイッチ406は切替えスイッチ408に接続され、最終出力端子に接続された切替スイッチ408は切替スイッチ406に接続され、切替スイッチ404,407は開放となる。フレーム消失補償処理部410によって生成された復号信号が最終復号信号として出力される。
次に、図8では、フレーム分類情報FIは、Dec2の処理を行うことを示すので、フレーム消失補償処理部410の出力端子に接続された切替スイッチ406は窓掛け部411に接続され、通常復号化処理部409の入力端子に接続された切替スイッチ403はパケット分離部401の第2の符号化情報fの出力端子に接続され、通常復号化処理部409の出力端子に接続された切替スイッチ405は窓掛け部412に接続され、パラメータ保持部414の入力端子に接続された切替えスイッチ404は閉じられ、パラメータ保持部414の出力端子に接続された切替えスイッチ407は開放される。
図8の場合、処理手順としては、以下のような流れとなる。
まず、フレーム消失補償処理部410によって第1の復号信号Sfが生成される。次に、通常復号化処理部409の内部状態がリセットされ、パラメータ保持部414が第1の符号化情報Fを保持する。次に、通常復号化処理部409が第2の符号化情報fを用いて第2の復号信号So を生成する。次に、窓掛け部411,412と加算器413によって数式(1)のような重ね合わせ加算処理が行われて最終出力信号Sが生成される。
Figure 2005094356
次に、図9では、フレーム分類情報FIはDec3の処理を行うことを示すので、通常復号化処理部409の入力端子に接続された切替スイッチ403はパケット分離部401の第一の符号化情報Fの出力端子に接続され、パラメータ保持部414の出力端子に接続された切替スイッチ407は通常復号化処理部409のもうひとつの入力端子に接続され、通常復号化処理部409の出力端子に接続された切替スイッチ405は切替えスイッチ408に接続され、最終出力端子に接続された切替スイッチ408は切替スイッチ405に接続される。
なお、図9の中でDec3の復号化処理時に使用されない部分(窓掛け部411,412)を薄く表示している。
この場合、通常復号化処理部409は、切替スイッチ407を介してパラメータ保持部414から入力された1フレーム前の第1の符号化情報F(n+1)を用いて復号化装置の内部状態の少なくとも一部を更新し、切替スイッチ403を介してパケット分離部401から入力された第1の符号化情報F(n+2)の復号化処理を行い、その復号信号を切替スイッチ405,408を介して最終復号信号として出力する。
図9の場合、処理手順としては以下のような流れとなる。
まず、通常復号化処理部409において、復号化装置の内部状態の一部をパラメータ保持部414のメモリに保持されている直前フレームの第1の符号化情報F(n+1)を用いて生成し直す。次に、現フレームの第1の符号化情報F(n+2)を用いて通常の音声復号化処理を行い、その復号信号を最終出力とする。
次に、基地局100内の音声符号化装置103内の内部構成について図10に示すブロック図を参照して説明する。
図10において、901は入力音声信号の線形予測分析を行う線形予測分析部、902は聴覚的な重みづけを行う重みづけ部、903はCELPモデルで合成される信号の目標信号を生成する目標ベクトル生成部、904は線形予測係数を量子化するLPC量子化部、905は量子化された線形予測係数によって構成される合成フィルタと聴覚的な重みづけを行うフィルタを従属接続したフィルタのインパルス応答を算出するインパルス応答算出部、906は適応符号帳探索部、907は固定符号帳探索部、908は利得符号帳探索部、909は適応符号帳のみから生成される信号を算出する適応符号帳成分合成部、910は固定符号帳のみから生成される信号を算出する固定符号帳成分合成部、911は適応符号帳成分と固定符号帳成分とを加算する加算器、912は量子化パラメータを用いて復号音声信号を生成する局部復号部、913は符号化パラメータを多重化する多重化部、914は適応符号帳成分と目標信号との誤差を算出する加算器、915は固定符号帳成分と目標信号との誤差を算出する加算器、916は加算器914と915で算出された誤差信号の比を算出する雑音比計算部、917はエンコーダの状態(例えば、適応符号帳の内容、LPC量子化器の予測器の状態、利得量子化器の予測器状態など)をリセットした状態で904〜913の各部処理を行うリセット符号化部、918は通常状態で符号化されたビットストリームとリセット状態で符号化されたビットストリームをパケット化するパケット化部、をそれぞれ示している。
符号化対象となる入力音声信号は、線形予測分析部901と目標ベクトル生成部903とリセット符号化部917に入力される。線形予測分析部901は、線形予測分析を行い、線形予測係数を重みづけ部902とLPC量子化部904とリセット符号化部917に出力する。
重みづけ部902は、不図示の聴覚重みづけフィルタの係数を算出し、目標ベクトル生成部903とインパルス応答算出部905とリセット符号化部917に出力する。聴覚重みづけフィルタは、以下の数式(2)のような伝達関数で表される公知の極零型フィルタである。
この数式(2)において、Pは線形予測分析の次数、aii次の線形予測係数である。γ1とγ2は重みづけ係数であり、定数でも良いし、入力音声信号の特徴に応じて適応的に制御されても良い。重みづけ部902では、γ1 i×aiおよびγ2 i×aiが算出される。
Figure 2005094356
目標ベクトル生成部903は、入力音声信号に数式(2)の聴覚重みづけフィルタをかけたものから、合成フィルタ(量子化線形予測係数で構築)の零入力応答に聴覚重みづけフィルタをかけたものを差し引いた信号を算出し、適応符号帳探索部906と固定符号帳探索部907と利得符号帳探索部908と加算器914と加算器915とリセット符号化部917に出力する。
目標ベクトルは前述の様に零入力応答を減じる方法で求める事ができるが、一般的には以下のステップで生成される。まず、入力音声信号に逆フィルタA(z)をかけて線形予測残差信号を得る。次に、この線形予測残差信号を量子化線形予測係数で構成される合成フィルタ1/A´(z)にかける。但し、このときのフィルタ状態は入力音声信号から合成音声信号(局部復号部912で生成される)を減じた信号とする。これにより、合成フィルタ1/A´(z)の零入力応答除去後の入力音声信号が得られる。
次に、この零入力応答除去後の入力音声信号を聴覚重みづけフィルタW(z)にかける。但し、このときのフィルタ状態(AR側)は重みづけ入力音声信号から重みづけ合成音声信号を減じた信号とする。ここで、この信号(重みづけ入力音声信号から重みづけ合成音声信号を減じた信号)は、目標ベクトルから適応符号帳成分(適応符号ベクトルを零状態の合成フィルタ1/A´(z)と聴覚重みづけフィルタW(z)に通して生成される信号)と固定符号帳成分(固定符号ベクトルを零状態の合成フィルタ1/A´(z)と聴覚重みづけフィルタW(z)に通して生成される信号)のそれぞれに量子化利得を乗じて加算して得られる信号を減じたものと等価であるので、そのようにして算出するのが一般的である。(数式(3)参照。数式(3)において、xは目標ベクトル、gaは適応符号帳利得、Hは重みづけ合成フィルタインパルス応答畳込み行列、yは適応符号ベクトル、gfは固定符号帳利得、zは固定符号ベクトル、をそれぞれ示す)
Figure 2005094356
LPC量子化部904は、線形予測分析部901から入力された線形予測係数(LPC)の量子化・符号化を行い、量子化LPCをインパルス応答算出部905と局部復号部912に出力し、符号化情報を多重化部913に出力する。LPCはLSPなどに変換され、LSPの量子化・符号化が行われるのが一般的である。
インパルス応答算出部905は、合成フィルタ1/A´(z)と聴覚重みづけフィルタW(z)を従属接続したフィルタのインパルス応答を算出し、適応符号帳探索部906と固定符号帳探索部907と利得符号帳探索部908に出力される。
適応符号帳探索部906は、インパルス応答算出部905から聴覚重みづけ合成フィルタのインパルス応答を、目標ベクトル生成部903から目標ベクトルを、それぞれ入力し、適応符号帳探索を行って、適応符号ベクトルを局部復号部912に、ピッチラグに対応するインデックスを多重化部913に、適応符号ベクトルにインパルス応答(インパルス応答算出部905より入力)を畳みこんだ信号を固定符号帳探索部907と利得符号帳探索部908と適応符号帳成分合成部909にそれぞれ出力する。
適応符号帳探索は、目標ベクトルと適応符号ベクトルから合成される信号との自乗誤差(数式(4))を最小化する適応符号ベクトルyを決定することによって行われる。
Figure 2005094356
固定符号帳探索部907は、インパルス応答算出部905から聴覚重みづけ合成フィルタのインパルス応答を、目標ベクトル生成部903から目標ベクトルを、適応符号帳探索部906から適応符号ベクトルに聴覚重みづけ合成フィルタインパルス応答を畳みこんだベクトルを、それぞれ入力し、固定符号帳探索を行って、固定符号ベクトルを局部復号部912に、固定符号帳インデックスを多重化部913に、固定符号ベクトルにインパルス応答(インパルス応答算出部905より入力)を畳みこんだ信号を利得符号帳探索部908と固定符号帳成分合成部910にそれぞれ出力する。
固定符号帳探索は、数式(3)のエネルギ(2乗和)を最小とする固定符号ベクトルzをみつける事である。既に決定している適応符号ベクトルyに最適適応符号帳利得(ピッチゲイン)ga(固定符号帳探索前に利得量子化が行われる構成の場合は量子化された適応符号帳利得)を乗じてインパルス応答を畳みこんだ信号(即ち、x‐gaHy)を固定符号帳探索用目標信号x’として、|x’−gcHz|2 を最小化する固定符号ベクトルzを決定することが一般的である。
利得符号帳探索部908は、インパルス応答算出部905から聴覚重みづけ合成フィルタのインパルス応答を、目標ベクトル生成部903から目標ベクトルを、適応符号帳探索部906から適応符号ベクトルに聴覚重みづけ合成フィルタのインパルス応答を畳みこんだベクトルを、固定符号帳探索部907から固定符号ベクトルに聴覚重みづけ合成フィルタのインパルス応答を畳みこんだベクトルを、それぞれ入力し、利得符号帳探索を行って、量子化適応符号帳利得を適応符号帳成分合成部909と局部復号部912へ、量子化固定符号帳利得を固定符号帳成分合成部910と局部復号部912へ、利得符号帳インデックスを多重化部913へ、それぞれ出力する。
利得符号帳探索は、数式(3)のエネルギ(2乗和)を最小とする量子化適応符号帳利得(ga )と量子化固定符号帳利得(gf )を生成する符号を利得符号帳のなかから選び出すことである。
適応符号帳成分合成部909は、適応符号帳探索部906から適応符号ベクトルに聴覚重みづけ合成フィルタのインパルス応答を畳みこんだベクトルを、利得符号帳探索部908から量子化適応符号帳利得を、それぞれ入力し、両者を乗じて聴覚重みづけ合成信号の適応符号帳成分として加算器911および加算器914に出力する。
固定符号帳成分合成部910は、固定符号帳探索部907から固定符号ベクトルに聴覚重みづけ合成フィルタのインパルス応答を畳みこんだベクトルを、利得符号帳探索部908から量子化固定符号帳利得を、それぞれ入力し、両者を乗じて聴覚重みづけ合成信号の固定符号帳成分として加算器911および加算器915に出力する。
加算器911は、適応符号帳成分合成部909から聴覚重みづけ合成音声信号の適応符号帳成分を、固定符号帳成分合成部910から聴覚重みづけ合成音声信号の固定符号帳成分を、それぞれ入力し、両者を加算して聴覚重み付け合成音声信号(零入力応答は除去されている)として目標ベクトル生成部903に出力する。目標ベクトル生成部903へ入力された前記聴覚重みづけ合成音声信号は、次の目標ベクトルを生成する際の聴覚重みづけフィルタのフィルタ状態を生成するのに用いられる。
局部復号部912は、LPC量子化部904から量子化線形予測係数を、適応符号帳探索部906から適応符号ベクトルを、固定符号帳探索部907から固定符号ベクトルを、利得符号帳探索部908から適応符号帳利得と固定符号帳利得を、それぞれ入力し、量子化線形予測係数で構成した合成フィルタを、適応符号ベクトルと固定符号ベクトルのそれぞれに適応符号帳利得と固定符号帳利得をそれぞれ乗じて加算して得られる音源ベクトルで駆動し、合成音声信号を生成して目標ベクトル生成部903に出力する。目標ベクトル生成部903に出力された合成音声信号は、次の目標ベクトルを生成する際の零入力応答除去後の合成音声信号を生成するためのフィルタ状態を生成するのに用いられる。
多重化部913は、LPC量子化部904から量子化LPCの符号化情報を、適応符号帳探索部906から適応符号帳インデックス(ピッチラグ符号)を、固定符号帳探索部907から固定符号帳インデックスを、利得符号帳探索部908から利得符号帳インデックスを、それぞれ入力し、多重化して1つのビットストリームにしてパケット化部918に出力する。
加算器914は、適応符号帳成分合成部909から聴覚重みづけ合成音声信号の適応符号帳成分を、目標ベクトル生成部903から目標ベクトルを、それぞれ入力し、両者の差分信号のエネルギを算出して雑音比計算部916に出力する。
加算器915は、固定符号帳成分合成部910から聴覚重みづけ合成音声信号の固定符号帳成分を、目標ベクトル生成部903から目標ベクトルを、それぞれ入力し、両者の差分信号のエネルギ(2乗和)を算出して雑音比計算部916に出力する。
雑音比計算部916は、加算器914と加算器915とから入力したエネルギの比を算出し、比が予め設定した閾値を超えているかどうかに基づいて、リセット符号化部917とパケット化部918とに制御信号を送る。即ち、前記比が前記閾値を超えた時のみリセット符号化部917の符号化処理を行い、得られる符号化ビットストリームをパケット化するように制御を行う。前記比の算出は、例えば、以下の数式(5)で得られる。ここで、Naは加算器914から入力されたエネルギ値、Nfは加算器915から入力されたエネルギ値をそれぞれ示す。
Figure 2005094356
数式(5)は、目標ベクトルに対する適応符号帳成分のS/N比と、目標ベクトルに対する固定符号帳成分のS/N比との差に相当する。なお、閾値としては、例えば、3GPP標準方式であるARM方式の12.2kbit/sモードの場合、3[dB]程度が好適である。
また、リセット符号化部917の符号化データを伝送することによって主観品質が大きく改善されるのは、音声の立ち上がり部でフレーム消失が発生した場合であるため、立ち上がり部付近のフレームでのみ選択的にリセット符号化部917を動作させるのが効率的である。具体的には、前フレームの平均振幅と現フレームの平均振幅の比を計算し、現フレームの振幅が前フレームの平均振幅のThA(閾値:例えば2.0)倍を超えている場合をオンセット(立ち上がり)フレームと定義し、リセット符号化部917を動作させるフレームを以下2種類のフレーム(1)、(2)にのみ限定することにより、さらに効果的かつ効率的な音声信号伝送システムを実現することも可能である(本構成は図10には示していないが、目標ベクトル生成部903から出力される目標ベクトルの二乗平均平方根(RMS)を算出し、現フレームでの算出結果と前フレームでの算出結果との比を計算し、その値が閾値ThA を超えているかどうかでオンセットフレームの判定を行う機能ブロックを追加することで実現可能である(下記(1)のフレーム)。下記(2)のフレームの判定には、下記(1)のフレームにおいて常にリセットされる専用のフレームカウンタを備えるようにすれば良い。なお、平均振幅の代わりにフレームエネルギを用いても良く、その場合は二乗平方根(RMS)の算出はせずに単に1フレームの信号の二乗和を算出すれば良い)。
(1)前記オンセットフレーム
(2)雑音比計算部916において数式(5)の結果が閾値を超えたフレームでかつ前記オンセットフレーム直後の数フレーム(1〜3フレーム程度)であるフレーム
このような選択を行うことにより、全フレームの80%以上はリセット符号化部917の符号化情報を伝送せずに、全フレームでリセット符号化部917の符号化情報を伝送するのと同程度の主観品質を実現する事も可能である。
リセット符号化部917は、入力音声信号と、線形予測分析部901から線形予測係数を、重みづけ部902から重みづけ線形予測係数を、目標ベクトル生成部903から目標ベクトルを、雑音比計算部916から制御信号を、それぞれ入力し、制御信号がリセット符号器917で符号化を行うことを示している場合に、内部状態をリセット(適応符号帳バッファのゼロクリア、合成フィルタ状態のゼロクリア、聴覚重みづけフィルタ状態のゼロクリア、LSP予測器の初期化、固定符号帳利得予測器の初期化、など)した状態で904〜913と全く同じ処理を行い、符号化ビットストリームをパケット化部918に出力する。
パケット化部918は、多重化部913から通常の符号化ビットストリームを、リセット符号化部917からリセット状態で符号化した符号化ビットストリームを、それぞれ入力し、ペイロードパケットに詰めてパケット伝送路に出力する。
次に、上記音声符号化装置103で符号化されたパケットデータを受信した音声復号化装置115の動作は、図5〜図9で説明したものと同様であるが、以下の点が異なる。
構成的には、受信パケットに符号fが含まれているかどうかを判断するリセット符号検出手段(不図示)を更に備える。リセット符号検出手段は、パケット分離部401からパケットのヘッダ情報を入力し、リセット符号fがパケットに含まれているかどうかを確認し、その確認結果の結果情報Mをフレーム分類部402に出力する。
動作的には、上記Dec2の処理が結果情報Mによって2種類に別れる。一方は、既に説明したDec2と同じ処理であり、もう一方は既に説明したDec0と同じ処理である。すなわち、結果情報Mが「符号fがパケットに含まれている」ことを示す場合は、Dec2と同じ処理(図8)を行い、結果情報Mが「符号fがパケットに含まれていない」ことを示す場合は、Dec0と同じ処理(図6)を行う。
なお、Dec0と同じ処理を行う際、通常復号化処理部409では適応符号帳利得を0として復号信号を生成すると、直前フレームのフレーム消失補償処理によって生成された適応符号帳の誤り伝播をリセットする効果も得られる。また、フレーム消失直後の正常フレームで上述したようなDec0の処理を行った場合、後続するフレームではDec3の処理ではなくDec0の処理を行う。
以上説明したように、本発明によれば、通常の符号化情報とともに符号化装置の内部状態をリセットして符号化した符号化情報も伝送するので、フレーム消失後の正常フレームにおける誤り伝播による復号音声信号の品質劣化を大幅に軽減することが可能となる。本発明は、連続したフレーム消失の後でも改善効果は変わらず、追加遅延も不要である。
なお、音声コーデックとして12.2kbit/sのARM方式を用いた場合、図12に示した従来方法と比較して、2連続以上の連続パケット消失を想定した場合、本発明を適用することにより0.6dB〜1dB程度のセグメンタルSN比の改善が得られる(パケット消失率5%〜20%における結果の一例)ことを確認しており、特にバースト的にパケット消失が発生した場合に効果がある。
本発明にかかる音声信号伝送システム、及び音声信号伝送方法は、追加伝送遅延なしにパケット損失によって生じる誤り伝播を抑えることが可能な音声信号伝送システムを可能にすることである。
本発明を適用した一実施の形態に係る音声信号伝送システムにおける基地局と移動局装置の各構成を示すブロック図 本実施の形態に係る音声信号伝送システムにおいて、パケット消失がない場合の送受信符号化情報とペイロードパケットの関係を示す図 本実施の形態に係る音声信号伝送システムにおいて、第nパケットが消失した場合の送受信符号化情報とペイロードパケットの関係を示す図 本実施の形態に係る音声信号伝送システムにおいて、第nパケットが消失した場合のペイロードパケットと復号化処理の関係を示す図 本発明の実施の形態に係る音声信号伝送システムに用いられる音声復号化装置のブロック図 本実施の形態に係る音声信号伝送システムに用いられる音声復号化装置において、Dec0を処理する際のブロック図 本実施の形態に係る音声信号伝送システムに用いられる音声復号化装置において、Dec1を処理する際のブロック図 本実施の形態に係る音声信号伝送システムに用いられる音声復号化装置において、Dec2を処理する際のブロック図 本実施の形態に係る音声信号伝送システムに用いられる音声復号化装置において、Dec3を処理する際のブロック図 本実施の形態に係る音声信号伝送システムに用いられる音声符号化装置のブロック図 従来の音声信号伝送システムにおいて、パケット消失がない場合の送受信符号化情報とペイロードパケットの関係を示す図 従来の音声信号伝送システムにおいて、第nパケットが消失した場合の送受信符号化情報とペイロードパケットの関係を示す図
符号の説明
100 基地局
103 音声符号化装置
110 移動局装置
115 音声復号化装置
401 パケット分離部
402 フレーム分類部
403〜408 切替スイッチ
409 通常復号化処理部
410 フレーム消失補償処理部
411,412 窓掛け部
413 加算器
414 パラメータ保持部
901 線形予測分析部
902 重みづけ部
903 目標ベクトル生成部
904 LPC量子化部
905 インパルス応答算出部
906 適応符号帳探索部
907 固定符号帳探索部
908 利得符号帳探索部
909 適応符号帳成分合成部
910 固定符号帳成分合成部
911,914,915 加算器
912 局部復号部
913 多重化部
916 雑音比計算部
917 リセット符号化部
918 パケット化部

Claims (7)

  1. 通常状態で符号化した第1の符号化情報と、音声符号化装置の内部状態をリセットして符号化した第2の符号化情報と、を多重化・パケット化して音声信号受信装置に送信する音声信号送信装置と、
    前記多重化・パケット化された第1の符号化情報と第2の符号化情報とを前記音声信号送信措置から受信してパケット分離・多重化分離し、前記分離した受信パケットに損失があった場合はパケット隠蔽処理を行い、損失パケット直後に受信したパケットでは前記第2の符号化情報を用いて復号化処理を行う音声信号受信装置と、を具備することを特徴とする音声信号伝送システム。
  2. 前記音声符号化装置は、適応符号帳と固定符号帳を備えるCELP型音声符号化装置であることを特徴とする請求項1記載の音声信号伝送システム。
  3. 前記音声信号受信装置は、
    前記損失パケット直後の正常パケットにおいて、パケット消失隠蔽処理を行って生成した合成信号と、受信した符号化情報を復号して得られる合成信号と、を重ね合わせ加算処理により重ね合わせた信号として最終的な復号合成信号を出力する音声復号化装置を備えることを特徴とする請求項1記載の音声信号伝送システム。
  4. 前記音声信号送信装置は、
    目標信号と適応符号帳によって生成される合成信号との誤差信号を算出する第一の誤差算出手段と、
    前記目標信号と固定符号帳によって生成される合成信号との誤差信号を算出する第二の誤差算出手段と、
    前記第一の誤差算出手段により算出された誤差信号と、前記第二の誤差算出手段により算出された誤差信号との比を算出する誤差信号比算出手段と、
    前記誤差信号比算出手段により算出された誤差信号比の大きさによって音声フレームを分類する音声フレーム分類手段と、
    前記音声フレーム分類手段の分類結果に基づいて、前記音声符号化装置の内部状態をリセットして符号化した第2の符号化情報を多重化するか否かを判定する多重化判定手段と、を備え、前記第2の符号化情報を多重化すると判定した場合以外は、前記通常状態で符号化した第1の符号化情報だけを音声符号化情報として送信することを特徴とする請求項1から3のいずれかに記載の音声信号伝送システム。
  5. 請求項1または4のいずれかに記載の音声信号送信装置を備えた基地局装置と、請求項1から3のいずれかに記載した音声信号受信装置を備えた移動局装置と、を具備することを特徴とする音声信号伝送システム。
  6. 符号化した音声情報を伝送するための音声信号伝送方法において、
    通常状態で符号化した第1の符号化情報と、音声符号化装置の内部状態をリセットして符号化した第2の符号化情報と、を多重化・パケット化して送信する工程と、
    前記多重化・パケット化された第1の符号化情報と第2の符号化情報とを受信してパケット分離・多重化分離する工程と、
    前記分離した受信パケットに損失があった場合はパケット隠蔽処理を行い、損失パケット直後に受信したパケットでは前記第2の符号化情報を用いて復号化処理を行う工程と、を具備することを特徴とする音声信号伝送方法。
  7. 符号化した音声情報を伝送するための音声信号伝送プログラムにおいて、
    通常状態で符号化した第1の符号化情報と、音声符号化装置の内部状態をリセットして符号化した第2の符号化情報と、を多重化・パケット化して送信するステップと、
    前記多重化・パケット化された第1の符号化情報と第2の符号化情報とを受信してパケット分離・多重化分離するステップと、
    前記分離した受信パケットに損失があった場合はパケット隠蔽処理を行い、損失パケット直後に受信したパケットでは前記第2の符号化情報を用いて復号化処理を行うステップと、を具備することを特徴とする音声信号伝送プログラム。
JP2003325001A 2003-09-17 2003-09-17 音声信号送信装置、音声信号伝送システム及び音声信号送信方法 Expired - Fee Related JP4365653B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2003325001A JP4365653B2 (ja) 2003-09-17 2003-09-17 音声信号送信装置、音声信号伝送システム及び音声信号送信方法
US10/923,700 US7502735B2 (en) 2003-09-17 2004-08-24 Speech signal transmission apparatus and method that multiplex and packetize coded information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003325001A JP4365653B2 (ja) 2003-09-17 2003-09-17 音声信号送信装置、音声信号伝送システム及び音声信号送信方法

Publications (2)

Publication Number Publication Date
JP2005094356A true JP2005094356A (ja) 2005-04-07
JP4365653B2 JP4365653B2 (ja) 2009-11-18

Family

ID=34270089

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003325001A Expired - Fee Related JP4365653B2 (ja) 2003-09-17 2003-09-17 音声信号送信装置、音声信号伝送システム及び音声信号送信方法

Country Status (2)

Country Link
US (1) US7502735B2 (ja)
JP (1) JP4365653B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009116332A (ja) * 2007-11-05 2009-05-28 Huawei Technologies Co Ltd 信号処理方法、処理装置および音声復号器
US7957961B2 (en) 2007-11-05 2011-06-07 Huawei Technologies Co., Ltd. Method and apparatus for obtaining an attenuation factor
JP2015509214A (ja) * 2012-01-20 2015-03-26 クゥアルコム・インコーポレイテッドQualcomm Incorporated 冗長フレーム符号化および復号のためのデバイス
JP2016513290A (ja) * 2013-02-21 2016-05-12 クゥアルコム・インコーポレイテッドQualcomm Incorporated 補間係数セットを決定するためのシステムおよび方法

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008007699A1 (en) * 2006-07-12 2008-01-17 Panasonic Corporation Audio decoding device and audio encoding device
US8000961B2 (en) * 2006-12-26 2011-08-16 Yang Gao Gain quantization system for speech coding to improve packet loss concealment
US8688437B2 (en) 2006-12-26 2014-04-01 Huawei Technologies Co., Ltd. Packet loss concealment for speech coding
US8589166B2 (en) * 2009-10-22 2013-11-19 Broadcom Corporation Speech content based packet loss concealment
US9026434B2 (en) 2011-04-11 2015-05-05 Samsung Electronic Co., Ltd. Frame erasure concealment for a multi rate speech and audio codec
IN2015DN02595A (ja) * 2012-11-15 2015-09-11 Ntt Docomo Inc
WO2017055091A1 (en) * 2015-10-01 2017-04-06 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for removing jitter in audio data transmission
US10204634B2 (en) * 2016-03-30 2019-02-12 Cisco Technology, Inc. Distributed suppression or enhancement of audio features

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002221994A (ja) * 2001-01-26 2002-08-09 Nippon Telegr & Teleph Corp <Ntt> 音声信号の符号列のパケット組立方法、装置及びパケット分解方法、装置並びにこれらの方法を実行するプログラム、プログラムを記録する記録媒体
JP2002268696A (ja) * 2001-03-13 2002-09-20 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
JP2002542521A (ja) * 1999-04-19 2002-12-10 エイ・ティ・アンド・ティ・コーポレーション パケットロス又はフレーム消去隠蔽を実行するための方法及び装置
JP2003202898A (ja) * 2002-01-08 2003-07-18 Matsushita Electric Ind Co Ltd 音声信号送信装置、音声信号受信装置及び音声信号伝送システム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6301222B1 (en) * 1997-10-24 2001-10-09 Lucent Technologies Inc. Signal data transmission over lossy packet networks
JP3555568B2 (ja) * 2000-09-04 2004-08-18 日本電気株式会社 Ip電話録音システム
JP2002268697A (ja) 2001-03-13 2002-09-20 Nec Corp パケット誤り耐性付き音声復号装置、音声符号化復号装置、及びその方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002542521A (ja) * 1999-04-19 2002-12-10 エイ・ティ・アンド・ティ・コーポレーション パケットロス又はフレーム消去隠蔽を実行するための方法及び装置
JP2002221994A (ja) * 2001-01-26 2002-08-09 Nippon Telegr & Teleph Corp <Ntt> 音声信号の符号列のパケット組立方法、装置及びパケット分解方法、装置並びにこれらの方法を実行するプログラム、プログラムを記録する記録媒体
JP2002268696A (ja) * 2001-03-13 2002-09-20 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
JP2003202898A (ja) * 2002-01-08 2003-07-18 Matsushita Electric Ind Co Ltd 音声信号送信装置、音声信号受信装置及び音声信号伝送システム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
C.MONTMINY, ET AL.: "Improving the Performance of ITU-T G.729A for VoIP", MULTIMEDIA AND EXPO, 2000. ICME 2000. 2000 IEEE INTERNATIONAL CONFERENCE ON, vol. 1, JPN6008035858, 2000, pages 433 - 436, XP010511489, ISSN: 0001091792, DOI: 10.1109/ICME.2000.869632 *
M.SERIZAWA, ET AL.: "A PACKET LOSS RECOVERY METHOD USING PACKET ARRIVED BEHIND THE PLAYOUT TIME FOR CELP DECODING", ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 2002. PROCEEDINGS. (ICASSP '02). IEEE INTERNATIONAL CONFER, vol. 1, JPN6008035860, 2002, pages 169 - 172, ISSN: 0001091793 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009116332A (ja) * 2007-11-05 2009-05-28 Huawei Technologies Co Ltd 信号処理方法、処理装置および音声復号器
JP4586090B2 (ja) * 2007-11-05 2010-11-24 華為技術有限公司 信号処理方法、処理装置および音声復号器
US7957961B2 (en) 2007-11-05 2011-06-07 Huawei Technologies Co., Ltd. Method and apparatus for obtaining an attenuation factor
US8320265B2 (en) 2007-11-05 2012-11-27 Huawei Technologies Co., Ltd. Method and apparatus for obtaining an attenuation factor
JP2015509214A (ja) * 2012-01-20 2015-03-26 クゥアルコム・インコーポレイテッドQualcomm Incorporated 冗長フレーム符号化および復号のためのデバイス
JP2016513290A (ja) * 2013-02-21 2016-05-12 クゥアルコム・インコーポレイテッドQualcomm Incorporated 補間係数セットを決定するためのシステムおよび方法

Also Published As

Publication number Publication date
US7502735B2 (en) 2009-03-10
US20050060143A1 (en) 2005-03-17
JP4365653B2 (ja) 2009-11-18

Similar Documents

Publication Publication Date Title
US7848921B2 (en) Low-frequency-band component and high-frequency-band audio encoding/decoding apparatus, and communication apparatus thereof
US7016831B2 (en) Voice code conversion apparatus
EP1768105B1 (en) Speech coding
US7590532B2 (en) Voice code conversion method and apparatus
KR20070028373A (ko) 음성음악 복호화 장치 및 음성음악 복호화 방법
JPH11126098A (ja) 音声合成方法及び装置、並びに帯域幅拡張方法及び装置
US20090016426A1 (en) Encoder, decoder, and their methods
JP4365653B2 (ja) 音声信号送信装置、音声信号伝送システム及び音声信号送信方法
WO2006041055A1 (ja) スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
JP4287637B2 (ja) 音声符号化装置、音声符号化方法及びプログラム
KR20060135699A (ko) 신호 복호화 장치 및 신호 복호화 방법
JPH0946233A (ja) 音声符号化方法とその装置、音声復号方法とその装置
JP4558734B2 (ja) 信号復号化装置
JP4414705B2 (ja) 音源信号符号化装置、及び音源信号符号化方法
JP4437052B2 (ja) 音声復号化装置および音声復号化方法
JP4236675B2 (ja) 音声符号変換方法および装置
JP4373693B2 (ja) 音響信号の階層符号化方法および階層復号化方法
JP4597360B2 (ja) 音声復号装置及び音声復号方法
JP2005534984A (ja) 音声フレームのエラー軽減用の音声通信ユニットおよび方法
JP3338885B2 (ja) 音声符号化復号化装置
JPWO2003021573A1 (ja) コーデック

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060418

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080711

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080722

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080919

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090401

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090728

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090821

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120828

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130828

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees