JP2005258226A - 広帯域音声復号化方式及び広帯域音声復号化装置 - Google Patents

広帯域音声復号化方式及び広帯域音声復号化装置 Download PDF

Info

Publication number
JP2005258226A
JP2005258226A JP2004071740A JP2004071740A JP2005258226A JP 2005258226 A JP2005258226 A JP 2005258226A JP 2004071740 A JP2004071740 A JP 2004071740A JP 2004071740 A JP2004071740 A JP 2004071740A JP 2005258226 A JP2005258226 A JP 2005258226A
Authority
JP
Japan
Prior art keywords
signal
band
identification information
wideband speech
speech decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004071740A
Other languages
English (en)
Other versions
JP4047296B2 (ja
Inventor
Kimio Miseki
公生 三関
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2004071740A priority Critical patent/JP4047296B2/ja
Priority to PCT/JP2004/004913 priority patent/WO2004090870A1/ja
Publication of JP2005258226A publication Critical patent/JP2005258226A/ja
Priority to US11/240,495 priority patent/US7788105B2/en
Application granted granted Critical
Publication of JP4047296B2 publication Critical patent/JP4047296B2/ja
Priority to US12/751,292 priority patent/US8160871B2/en
Priority to US12/751,191 priority patent/US8249866B2/en
Priority to US12/751,421 priority patent/US8260621B2/en
Priority to US13/417,906 priority patent/US8315861B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】 低ビットレートにおいて狭帯域音声信号が生成される符号化データであっても、良い音質を得ることができる広帯域音声復号化装置を提供する。
【解決手段】 狭帯域音声信号が生成されることを識別する識別情報を帯域検出部13が検出して、この識別情報を基に制御部15が音声復号化部16を制御する。
【選択図】 図1

Description

本発明は、低ビットレートにおいて広帯域の音声信号だけでなく狭帯域の音声信号でも高性能に復号することができる広帯域音声復号化方法及び広帯域音声復号化装置に関する。
従来の携帯電話やVoIP通信で使用される音声信号のディジタル伝送においては、音声信号は8kHzのサンプリング周波数(以降では、サンプリングレートと言うこともある)でサンプリングされ、このサンプリング周波数に適合した符号化方式によって符号化されて伝送される。サンプリング定理から知られているように、8kHzのサンプリング周波数でサンプリングされた信号には、サンプリング周波数の半分の周波数に相当する4kHz以上の周波数は含まれない。音声符号化の分野では、このように4kHz以上の周波数は含まれないような音声信号のことを狭帯域音声(もしくは電話帯域音声)と呼ぶ。狭帯域音声の符号化/復号化には、狭帯域音声に適合した方式が用いられる。例えば、ITU−Tで国際標準になっているG.729や、3GPP標準のAMR−NB(Adaptive Multi Rate−Narrow Band)は狭帯域用の音声符号化/復号化の方式であり、入力音声信号のサンプリング周波数は8kHzと規定されている。
一方、16kHz程度のより高いサンプリング周波数の音声信号を用いることにより、50Hz〜7kHz程度までの広い周波数帯域を持つ音声を表現することが可能である。音声符号化の分野では、このように8kHzよりも十分高いサンプリング周波数(通常、16kHz程度、場合によっては、12.8kHz程度や16kHz以上のサンプリング周波数もある)を使用して表した音声信号のことを広帯域音声と呼ぶ。このような広帯域音声を符号化するためには、通常の狭帯域音声符号化方式とは異なる、広帯域音声に適合した広帯域音声符号化方式を用いる。例えば、ITU−Tで国際標準になっているG.722.2(非特許文献1)は広帯域音声用の符号化/復号化の方式であり、符号化器に入力する入力音声信号のサンプリング周波数と、復号化器から出力される音声信号のサンプリング周波数は、どちらも16kHzと規定されている。G.722.2に記載された広帯域音声符号化方式はAMR−WB(Adaptive Multi Rate − Wide Band)方式と呼ばれ、サンプリング周波数が16kHzの広帯域音声信号を高品質に符号化/復号化することを目的としている。AMR−WBでは9つのビットレートが使用可能である。一般に、高いビットレートで符号化と復号化を行って生成される音声の音質は比較的良いが、低いビットレートで符号化と復号化を行って生成される音声は符号化歪みが大きくなるために音質は劣化する傾向にある。
このようにITU−T勧告G.722.2(AMR−WB)に記載された広帯域音声符号化方式では、50Hz〜7kHzの帯域幅を持つ広帯域な音声信号を扱うことを想定して符号化と復号化を行うため、符号化の入力信号と復号化の出力信号のサンプリング周波数は16kHzに定められている。ところが、通常の電話音声のように4kHz以上の周波数を持たない音声信号を扱う狭帯域音声通信システムと広帯域音声通信システムが共存するシステムにおいては、広帯域音声通信システムで狭帯域音声信号を扱うケースが生じる。この場合、狭帯域音声信号を広帯域音声符号化によって符号化し生成された符号化データが、広帯域音声符号化に対応した広帯域音声復号化により復号されることになる。このような場合に復号化される音声信号は、通常の広帯域音声信号と全く同じ処理で復号されるため、サンプリング周波数は広帯域信号用のものであるにも関わらず、元々が4kHz以上の周波数を持たない狭帯域の音声信号を符号化したものであるため、復号化しても4kHz以上の周波数成分を殆ど持たない狭帯域音声信号が再生されると予想される。ただし、符号化による歪みや、復号化処理で帯域拡張処理などがあると、狭帯域の音声信号でも符号化/復号化することで4kHz以上の周波数成分をある程度は持つようになる。
このように、従来法では、4kHz以上の周波数を持たない狭帯域音声信号を広帯域音声符号化により符号化して得られる符号化データが復号側に受信された場合でも、通常の広帯域音声復号化を用いて音声信号の復号化を行う。従来法のAMR−WBに代表される方式では符号化と復号化は広帯域音声信号に特化したものとなっている。従って、従来法では4kHz以上の周波数を殆ど持たない狭帯域の音声信号を生成するような符号化データであっても、広帯域の音声信号に特化した復号化が行われるために、生成される狭帯域音声の音質が劣化するという問題がある。このような傾向は、高い圧縮効率が求められる低ビットレートにおいて特に顕著となる。このため、狭帯域の通信路/蓄積系や、狭帯域のコーデックを介すなどして帯域制限されたような狭帯域の音声信号に対して広帯域音声符号化/復号化を用いると、6〜10kbit/s程度の低ビットレートでは、狭帯域の音声符号化/復号化を用いた場合より、音質が極めて悪くなるという問題がある。また、狭帯域音声信号だけに限らず、4kHz以上の周波数が非常に少ない音声信号を扱う場合についても同様の問題があり、従来の広帯域音声復号化では低ビットレートで高品質な音声を提供できなくなるという問題がある。
また、従来法のAMR−WB方式は、広帯域音声復号化部がLower−Band部(約6kHz以下の低域側の音声信号を生成する)と、Higher−Band部(約6kHz〜7kHzの帯域の高域側の音声信号を生成する)から構成されている。Lower−Band部はCELP系の音声符号化方式であり、Lower−Band部内で復号して生成された低域側の音声信号に、Higher−Band部で生成される高域側の音声信号を常に付与することにより広帯域音声復号化部の出力信号が生成される。このように、AMR−WB方式の復号化部は広帯域音声に特化したものとなっているため、狭帯域音声を生成するような符号化データが入力されたときでも、High−Band部で生成した不要な高域信号が音声復号化部からの音声出力に付与されてしまうという問題がある。
従来法として、低ビットレートに対応した符号化/復号化の効率を改善するための方法として、様々な手法があり、音源信号を表すパルスの位置の集合を複数セット準備して、入力音声信号との間のひずみが最小となる集合を選択してその判別情報を受信側に伝送することにより、低ビットレート化に対応するものが開示されている(例えば、特許文献1)。
一方、入力信号の音声/非音声の識別によって符号化及び復号化装置の構成を切り換える方法があり、符号器及び復号器の一部の機能ブロックについて音声信号の処理用に最適化された構成と非音声信号の処理用に最適化された構成とを設け、音声/非音声の識別情報に基づいてこれらの構成を切り換えるというものである(例えば、特許文献2)。
しかし、これらの従来技術はいずれも音声信号の帯域の違いに着目するものではないことは明白であり、上述したような、低ビットレートで広帯域符号化された狭帯域音声の符号化データを広帯域音声復号化で復号する場合に生ずる音質の劣化を改善することはできないという問題がある。
ITU−T勧告G.722.2 特開2001−318698号公報(第2−4頁、図1) 特開平11−259099号公報(第2、5、6ページ、図1)
上述したような従来技術では、低ビットレートで広帯域符号化された狭帯域音声の符号化データを広帯域音声復号化で復号する場合に生ずる音質の劣化を改善することはできないという問題があった。
本発明は、上記問題を解決するためになされたもので、低ビットレートでも、狭帯域音声信号を広帯域音声符号化して得られる符号化データを高品質に復号化するための広帯域音声復号化方法及び広帯域音声復号化装置を提供することを目的とする。
上記目的を達成するために、本発明の広帯域音声復号化方法は、符号化データから音源信号と合成フィルタを生成し、音源信号と合成フィルタから音声信号を復号する復号処理を用いた広帯域音声復号化方法において、復号される音声信号が狭帯域であることを識別する識別情報を取得し、前記識別情報を基に復号処理を制御することを特徴とする。
また、本発明の広帯域音声復号化装置は、符号化データから音源信号を生成する手段、合成フィルタを生成する手段、音源信号と合成フィルタから音声信号を復号する手段を用いた広帯域音声復号化装置において、復号される音声信号が狭帯域であることを識別する識別情報を取得する手段、前記識別情報を基に復号手段を制御する手段とを備えたことを特徴とする。
本発明によれば、復号化して再生される音声信号が狭帯域信号であっても広帯域信号であっても、適切に復号処理を制御することができるので、低ビットレートにおいても復号化処理により再生される音質の劣化を防止することができる。
以下、図面を参照して本発明の実施例を説明する。
以下、図1及び図2を参照して、本発明の第1の実施形態を説明する。図1は、本発明の第1の実施形態に係る広帯域音声復号化装置の例を表したブロック図である。また、図2は、この広帯域音声復号化装置に入力する符号化音声データを生成する広帯域音声符号化装置の一例を表すブロックである。移動通信端末の場合には、広帯域音声復号化装置は受信系で、広帯域音声符号化装置は送信系で用いられる。また、広帯域音声復号化装置は、コンテンツとして記録された符号化データを再生する場合などにも用いられる。
まず初めに、広帯域音声復号化装置10の入力となる符号化データを生成するための広帯域音声符号化装置の例について図2を用いて説明する。
図2において、広帯域音声符号化装置20は、音声入力部22、帯域検出部23、制御部25、サンプリングレート変換部24、音声符号化部26、および、符号化データ出力部27から構成される。
図2を用いて音声符号化装置20の動作を説明する。音声入力部22は入力音声21の情報を入力すると共に入力音声信号の帯域に関する識別情報を取得する。入力音声信号の帯域に関する識別情報として、入力音声信号の取得手段や取得経路、取得履歴などを用いることも可能であるが、ここでは、入力音声信号のサンプリングレート情報を取得する例で説明することにする。音声入力部22は取得したサンプリングレート情報を帯域検出部23に送ると共に、入力音声信号をサンプリングレート変換部24に出力する。
音声入力部22の実現例としては、マイクロホンから音声を入力してA/D変換するようなリアルタイム通信だけでなく、ディジタルデータとして音声情報が格納されたファイルから音声データを読み出して音声入力部に入力する場合も有り得る。このような場合、帯域に関する識別情報は当該音声情報ファイルに付属する属性情報をヘッダ部分などから読み出す等の方法が考えられる。
帯域検出部23は、音声入力部22から出力される入力音声信号のサンプリングレート情報を入力し、これに基づいて検出された帯域情報を制御部25に出力する。帯域情報としては、サンプリングレート情報そのものでもよいし、これに対応して予め設定されたサンプリングレートのモード情報であってもよい。例えば、音声入力部22で想定する音声信号のサンプリングレート情報が“16kHz”または“8kHz”の2種類の場合、“16kHz”にモード“0”を対応させる。また、サンプリングレート情報が“8kHz”を表す場合、モード“1”を対応させ、音声入力部22で想定しないサンプリングレート情報が取得された場合(この例では“16kHz”でも“8kHz”でもない場合に相当)には、これらと別のモード(例えばモード“unknown”)を用意しておくことにより、音声符号化部26で想定しないサンプリングレートの音声信号が入力された場合に符号化動作を行わないなどの対策を行うことができる。
制御部25は、帯域検出部23からの帯域情報を基に、サンプリングレート変換部24と音声符号化部26を制御する。具体的には、入力音声信号が、音声符号化部26で想定する入力音声信号のサンプリングレートに合致していなければ、これに合致するように入力音声信号のサンプリングレート変換を行ったものを音声符号化部26への入力音声信号となるようにする。また、入力音声信号が、音声符号化部26で想定する入力音声信号のサンプリングレートに合致していれば、入力音声信号のサンプリングレート変換は行わずに、入力信号をそのまま音声符号化部26に出力する。例えば、音声符号化部26で想定する入力音声信号のサンプリングレートが16kHzで、音声入力部22から出力される入力音声信号のサンプリングレートが8kHzの場合、音声符号化部26で想定する入力音声信号のサンプリングレートに合致していないので、サンプリングレートが8kHzの入力音声信号を16kHzのサンプリングレートにアップサンプリングしてから音声符号化部26に出力する。一方、音声符号化部26で想定する入力音声信号のサンプリングレートが16kHzで、音声入力部22から出力される入力音声信号のサンプリングレートが同じ16kHzの場合は、音声符号化部26で想定する入力音声信号のサンプリングレートと合致しているため、入力音声信号のサンプリングレートの変換をせずに、入力音声信号をそのまま音声符号化部26に送る。
音声符号化部26は、入力された音声信号を所定の広帯域音声符号化により符号化し、対応する符号化データは符号化データ出力部27にて纏めて出力される。音声符号化部26で用いられる符号化アルゴリズムの例としては、非特許文献1に示されているAMR−WBなどのCELP系の広帯域音声符号化が考えられる。
この際、制御部25は、帯域の識別情報に基づいて内蔵する符号化パラメータ用メモリから広帯域用又は狭帯域用符号化パラメータを選択して読み出し、選択された符号化パラメータを用いて音声符号化部26で符号化を行う。帯域の識別情報は、符号化データ出力部27で符号化データの一部に組み入れて出力する。なお、どのように組み入れるかは適宜設計すべき事項である。また、別な実現の方法においては、帯域の識別情報は、サイド情報として、符号化データと別系統のデータとして出力することも可能である。これも適宜設計すべき事項である。また、組み入れない場合もある。
以上説明した音声符号化装置20の構成及び動作については、出願人の先の特許出願(特願2003−101422)の願書に添付した明細書に記載した通りであるが、これも、符号化データを生成するための音声符号化装置の一実現例に過ぎず、これに限られるものではない。例えば、帯域の識別情報を用いて音声符号化部を制御しない従来の符号化である場合であっても、そこから生成される符号化データは、本発明の音声復号化装置および復号化方法を用いた音声復号化の入力に用いることは可能である。
次に、図1を用いて、本発明の第1の実施形態に係る音声復号化装置の詳細について説明する。
図1において、音声復号化装置10は、符号化データ入力部17、帯域検出部13、制御部15、音声復号化部16、サンプリングレート変換部14、および、音声出力部12から構成される。
符号化データ入力部17は、入力される符号化データを音声パラメータ符号の情報と帯域の識別情報に分離し、音声復号化部16に音声パラメータ符号の情報が送られ、帯域の識別情報を帯域検出部13に送られる。
帯域検出部13は、帯域の識別情報に基づいて検出された帯域情報を制御部25に出力する。帯域情報としては、サンプリングレート情報そのものでもよいし、これに対応して予め設定されたサンプリングレートのモード情報であってもよい。例えば、音声入力部22で想定する音声信号のサンプリングレート情報が“16kHz”または“8kHz”の2種類である場合、“16kHz”にモード“0”を対応させる。また、サンプリングレート情報が“8kHz”を表す場合、モード“1”を対応させ、音声入力部22で想定しないサンプリングレート情報が取得された場合(この例では“16kHz”でも“8kHz”でもない場合に相当)には、これらと別のモード(例えばモード“unknown”)を用意しておくことにより、音声符号化部26で想定しないサンプリングレートの音声信号が入力されることがある場合でも、復号化処理の不具合が生じることを防止することができる。
このように、符号化データの一部に組み入れるか、もしくは、符号化データに付随したデータとして送られた帯域の識別情報は、符号化データ入力部17で抽出され、帯域検出部13に送られる。符号化データのフォーマットは、例えば、帯域の識別情報が符号化データの一部として受信される形式のデータフォーマットであるか、もしくは、符号化データに付随して受信されるデータフォーマットになっていればよい。
別な実施形態においては、帯域の識別情報が符号化データの一部に組み入れられない場合が可能である。例えば、帯域の識別情報を図示しない入力手段によって音声符号化装置23の外部から入力することができる。また、別な実施形態においては、音声復号化部の内部で再生される信号(例えば、音声信号や音源信号など)もしくは、音声信号のスペクトルの概形を表すスペクトルパラメータを基に、復号化により再生される音声信号の帯域を識別することも可能である。図9はその構成例であり、音声復号化部16において、例えば、音声信号のスペクトルの概形を表すスペクトルパラメータが表す周波数の範囲を分析することにより、復号部で再生される音声信号の帯域を識別することが可能である。こうして抽出された帯域の識別情報を帯域検出部13に送られ、帯域の識別情報そのものを明に伝送すること無しに帯域の識別情報を用いた制御が可能となる。このようにすると符号化データの一部に帯域の識別情報を組み入れるための情報が不要になる効果がある。
また、別な実現の方法においては、帯域の識別情報は、図10に示すようにサイド情報として、符号化データとは別のデータとして送信側から伝送されたものを受信する復号化側の実施形態であってもよい。
また、帯域の識別情報を符号化側から送信する方法において、受信した帯域の識別情報Aと、音声信号もしくは音声信号のスペクトルの概形を表すスペクトルパラメータを分析して得られた帯域の識別情報Bとを比較することにより、識別情報Aと識別情報Bが異なる結果を示す場合には、受信データに誤りがあることを検出することができるという効果もある。
制御部15は、帯域検出部13からの帯域情報を基に、音声復号化部16とサンプリングレート変換部14と、音声出力部12を制御する。具体的な制御の方法については以下の音声復号化部16、サンプリングレート変換部14、および、音声出力部12の説明の中で述べることにする。
音声復号化部16は、符号化データ入力部17からの音声パラメータ符号の情報を入力し、これらを用いて音声信号を再生するが、この際に、音声復号化部16は、制御部15からの帯域情報を基に制御される。以下で、図3を用いて帯域情報を基に音声復号化部16を制御する方法の一例について詳細に説明する。
図3で音声復号化部36は、適応符号帳31、音源信号生成部32、合成フィルタ部33、パルス位置設定部34、後処理フィルタ部38から構成される。また制御部35は、この実施形態においては、復号化部パラメータ用メモリを内蔵するものとする。
ここでは音声復号化部36はAMR−WBのようなCELP系の広帯域音声符号化方式に対応した音声復号化を用いる例で説明を行う。この場合、入力される音声パラメータ符号の情報は、スペクトルパラメータ符号A、適応符号L、ゲイン符号G、雑音符号Kから構成されている。
適応符号帳31は、後で述べる音源信号生成部32からの音源信号を過去の音源信号として符号帳に格納し、適応符号Lに基づいて、適応符号Lに対応するピッチ周期だけ過去の音源信号を適応符号ベクトルとして出力する。
パルス位置設定部34は、雑音符号Kに対応する雑音符号ベクトルを生成するもので、ここでは所定の代数符号帳(代数的符号帳とも言う)を用いて雑音符号ベクトルを生成することができる。雑音符号ベクトルは、小数のパルスから構成され、雑音符号ベクトルを構成するそれぞれのパルスについてのパルス振幅と極性、およびパルス位置が雑音符号Kに基づいて生成される。パルス数や、パルスを立てることができる位置の候補(パルス位置候補)や、その位置でのパルス振幅、およびパルスの極性は、代数符号帳を予めどのように設定しておくかによってきまるものであり、従来法では、AMR−WBのような可変ビットレートの符号化方式については、ビットレート毎に代数符号帳の構造の設定が一意に定められている。一方、本発明の第1の実施形態においては、同じビットレートであっても、帯域情報に応じて、代数符号帳の構造の設定が変わるようになっている。
すなわち、図3において、制御部35は、内蔵する復号化部パラメータ用メモリに、2種類のパルス位置候補を持ち、帯域情報に応じたパルス位置候補をパルス位置設定部34に与えることにより、パルス位置設定部34の代数符号帳のパルス位置の設定を制御する。こうして設定されたパルス位置候補を用いて、雑音符号Kに応じたパルス位置にパルスが立てられて、雑音符号ベクトルがパルス位置設定部34において生成され出力される。図3の例では、2種類のパルス位置候補として、「偶数サンプル位置のパルス位置候補」と、「整数サンプル位置のパルス位置候補」を切り替える構成を示している。帯域情報が広帯域を示す場合には、従来法と同様に、整数サンプル位置のパルス位置候補を設定する。一方、帯域情報が狭帯域を示す場合には、再生される音声信号の帯域は高い周波数を持たない狭帯域信号であるので、音源信号を生成する基となる雑音符号ベクトルを表すためのサンプリングレートは広帯域信号に対応したものよりも低いサンプリングレートで十分表現することができる。従って、帯域情報が狭帯域を示す場合には、間引かれたサンプル位置のパルス位置候補(図3の例では偶数サンプル位置のパルス位置候補)を設定するようにする。間引かれたサンプル位置のパルス位置候補としては、例えば奇数サンプル位置のパルス位置候補であってもよいし、これに限られるものではないことは言うまでもない。こうすることで、帯域情報が狭帯域を示す場合にパルスの位置情報を表すために必要なビット数を削減できるので、符号化側で送信するビット数を低減できる効果がある。もしくは、同じビットレートで符号化送信する場合には、他の情報を伝送することにより音質を改善することや、パルスの位置情報で削減できたビットを符号誤り耐性を上げるために使うことができる効果がある。あるいは、パルスの位置情報について削減したビットは、より多くの数のパルスを立てるためや、もしくは、パルス振幅の量子化の解像度を上げるために使うことが可能である。こうすることで、低ビットレートの広帯域復号化で、狭帯域信号を復号して再生する場合でも、音質を改善することができる。
音源信号生成部32は、ゲイン符号Gを用いて、適応符号帳31からの適応符号ベクトルに用いるゲインと、パルス位置設定部34からの雑音符号ベクトルに用いるゲインを求め、ゲインを付与された適応符号ベクトルと雑音符号ベクトルを加算することにより音源信号を生成する。音源信号は合成フィルタ部33と適応符号帳31に入力される。
合成フィルタ33は、スペクトルパラメータ符号Aから音声信号のスペクトルの概形を表すスペクトルパラメータを復号し、これを用いて合成フィルタのフィルタ係数を求める。こうして求められたフィルタ係数を用いて構成された合成フィルタに、音源信号生成部32からの音源信号を入力することにより、合成フィルタ33の出力として音声信号が生成される。後処理フィルタ部38は、合成フィルタ33で生成された音声信号のスペクトルの形状を整形するもので、これにより、主観的な音質が改善された音声信号を音声復号化部の出力とすることができる。図3には明示していないが、典型的な後処理フィルタ部38では、スペクトルパラメータまたは合成フィルタのフィルタ係数を用いることにより、音声信号のスペクトルの概形を整形することが行われる。音声信号のスペクトルの概形に基づき、スペクトルの形状の凹凸のうち、谷の部分の周波数に存在する符号化雑音を抑圧し、山の部分の周波数に存在する符号化雑音をある程度許容することで、符号化雑音が音声信号にマスクされて人間の耳に聞こえにくくするような整形が行われる。
こうして、音声復号化部36から再生された音声信号が出力される。
図1に戻り、サンプリングレート変換部14は、音声復号化部からの音声信号を入力し、制御部15からの帯域情報に基づいて、帯域情報が広帯域を示す場合には、音声復号化部からの音声信号のサンプリングレート変換を行わずにそのまま音声出力部12に出力する。
一方、制御部15からの帯域情報が狭帯域を示す場合には、サンプリングレート変換部14に入力される音声復号化部からの音声信号は、高い周波数を持たない狭帯域信号であることがわかる。この場合には、サンプリングレート変換部14は、広帯域信号に対応したサンプリングレート(典型的には16kHzサンプリング)で音声復号化部から入力された音声信号を、狭帯域信号用の低いサンプリングレート(典型的には8kHzサンプリング)に変換して出力するようにする。
このように検出した帯域情報に応じて、音声復号化部からの音声信号のサンプリングレートを変換(上記の例ではダウンサンプリング)することにより、音声信号に含まれる実質的な周波数帯域に見合っただけのサンプリングレートでの音声信号をデータとして獲得することができる。言い換えると、本来は狭帯域音声信号であるが、広帯域音声復号化をすることにより、広帯域音声用の過度に高いサンプリングレートで表されてしまうことで音声信号データが大きくなってしまうことを、本発明を用いることで回避することが可能になる効果がある。
音声出力部12は、サンプリングレート変換部14からの音声信号を入力し、制御部15からの帯域情報に対応するサンプリングレートに応じたタイミングでサンプル毎に出力音声11を出力する。音声出力部12は、例えば、DA変換部とドライバであり、制御部15からの帯域の広狭の識別情報に基づいてサンプリングレート変換部14からの音声信号をアナログ電気信号に変換し、図1に図示しないスピーカを駆動して音声を出力する。なおこの他に、出力音声をディジタルでメモリ等に記録または転送する際には、狭帯域音声信号であるか広帯域音声信号であるかの情報を基に、狭帯域音声信号である場合には、音声信号を8kHzにダウンサンプリングすることによりデータ量を削減できるので、メモリの有効利用や転送時間の短縮を図ることができる。また、サンプリングレート等の帯域情報も音声信号と関連づけて記録または転送することで、記録または転送した音声信号を正しいサンプリングレートで正確に再生することができる。
図6は、本発明の第1の実施形態に係る音声復号化装置の骨子となる動作を示すフローチャートである。
以下、同図を用いて音声復号化装置の動作について説明する。
まず、処理を開始すると、帯域検出部13において符号化データに組み入れて送られた帯域情報を取得し(ステップS1)、この帯域情報に基づいて、広帯域用または狭帯域用のいずれの処理を行うかを決定する(ステップS2)。
狭帯域用の処理を行うと決定した場合、制御部15は、音声復号化部16での復号化に用いる所定パラメータを狭帯域用に修正し、入力された符号化データから音声復号化部16で音声信号を生成し(ステップS3)、処理をその後終了する。
一方、広帯域用の処理を行うと決定した場合は、制御部15は、音声復号化部16での復号化に用いる所定パラメータを広帯域用にし、入力された符号化データから音声復号化部16で音声信号を生成し(ステップS4)、処理をその後終了する。
本発明の実施例1によれば、帯域情報に基づき適切な復号化パラメータを選択することにより、広帯域音声復号化処理で広帯域又は狭帯域のいずれの音声信号が生成される場合であっても、帯域情報に応じた音声信号を高品質に復号化することができる。
以下、図4を参照して、本発明の第2の実施形態を説明する。
第2の実施形態は、検出された帯域情報の広帯域又は狭帯域の区別に応じて、復号化において生成される音源信号を修正することが特徴である。音源信号の修正の方法の例としては、検出された帯域情報の広帯域又は狭帯域の区別に応じて、ピッチの周期性又はホルマントの強調の強弱又は有無を選択することができるようにする。図4は音声復号化部46と、復号化において生成される音源信号を修正するために用いる制御部45の構成を表すブロック図である。
図4における音声復号化部46の構成は、音源信号生成部42と合成フィルタ部43との間に音源修正部47を設けている点に特徴がある。第2の実施形態では、パルス位置設定部44は従来法のパルス位置候補の設定とした。その他の構成は図3と同じである。ここで音源修正部47は、音源信号生成部42で生成された音源信号について、量子化に起因する聴感上の雑音感を軽減するため、ピッチの周期性又はホルマントの強調の強弱又は有無を調整するものである。
また、制御部45に内蔵する復号化パラメータ用メモリ45aには、広帯域音声信号の復号化に用いる「音源修正用パラメータ(広帯域用)」と、狭帯域音声信号の復号化に用いる「音源修正用パラメータ(狭帯域用)」とが、選択して読み出せるように記憶されている。つまり、制御部45は帯域の広狭の識別情報に基づいて、内蔵する復号化パラメータ用メモリ45aから「音源修正用パラメータ(広帯域用)」又は「音源修正用パラメータ(狭帯域用)」を選択して読み出し、音源修正部47に送る。
音源修正部47は、広帯域音声信号又は狭帯域音声信号を復号化する場合に、それぞれ対応するピッチの周期性又はホルマントの強調の強弱又は有無を設定することができる。その結果、それぞれ適切に量子化雑音の影響を低減させることができる。
より具体的には、帯域の識別情報により狭帯域音声信号が復号されることがわかる場合には、帯域の識別情報により広帯域音声信号が復号されることがわかる場合に比べ、広帯域音声復号化で生成される音源信号の劣化が大きいと推定されるので、音源信号の修正を比較的強く行うことが好ましい。
検出された帯域情報が広帯域を示すか狭帯域を示すかに応じて、復号化において生成される音源信号を修正する方法は図4の構成に限られるものではなく、例えば、図11や図12に示す構成であってもよい。
図11は、音源修正部47aが適応符号帳41からの適応符号ベクトルを修正し、この修正された適応符号ベクトルを用いることにより、修正された音源信号が生成される構成を表している。この場合、音源信号を構成する基となる適応符号ベクトルを帯域情報が広帯域を示すか狭帯域を示すかに応じて修正されるので、結果的に、帯域情報が広帯域か狭帯域かに応じて、音源信号が修正されることになる。
また、図12は、音源修正部47bがパルス位置設定部44からの雑音符号ベクトル(この例では代数符号帳から生成される符号ベクトル)を修正し、この修正された雑音符号ベクトルを用いることにより、修正された音源信号が生成される構成を表している。この場合、音源信号を構成する基となる雑音符号ベクトルを帯域情報が広帯域を示すか狭帯域を示すかに応じて修正されるので、結果的に、帯域情報が広帯域か狭帯域かに応じて、音源信号が修正されることになる。
このように、様々な実現の方法があるが、本旨とするところは、帯域情報が広帯域か狭帯域かに応じ、音源信号が修正されるようになっていれば発明法に含まれることは言うまでも無い。
本発明の第2実施形態によれば、再生される音声信号の帯域の広狭に合わせて音源信号を適応的に修正することができるので、適切に量子化雑音の影響を低減させることができる。
以下、図5を参照して、本発明の第3の実施形態を説明する。第3の実施形態は、合成後の音声信号の後処理フィルタによるピッチの周期性又はホルマントの強調の強弱又は有無を、帯域の識別情報から得られる広帯域又は狭帯域の区別に応じて選択することができるように第2の実施形態における音声復号化部を構成したもので、図5は当該音声復号化部56及びこれに関連のある復号化パラメータ用メモリ55aを含む制御部55の構成を表すブロック図である。
図5における音声復号化部56は、適応符号帳51、音源信号生成部52、合成フィルタ部53、パルス位置設定部54、後処理フィルタ部58から構成される。
パルス位置設定部54は図4のパルス位置設定部44と同じであり、適応符号帳51、音源信号生成部52、合成フィルタ部53は、それぞれ、図3の適応符号帳31、音源信号生成部32、合成フィルタ部33と同じである。また、制御部55に内蔵する復号化パラメータ用メモリ55aには、広帯域音声信号の復号化に用いる「後処理用パラメータ(広帯域用)」と、狭帯域音声信号の復号化に用いる「後処理用パラメータ(狭帯域用)」とが、選択して読み出せるように記憶されている。つまり、制御部55は帯域の広狭の識別情報に基づいて、内蔵する復号化パラメータ用メモリ55aから「後処理用パラメータ(広帯域用)」又は「後処理用パラメータ(狭帯域用)」を選択して読み出し、後処理フィルタ部58に送る。
後処理フィルタ部58は、合成フィルタ部53からの広帯域音声信号又は狭帯域音声信号を処理する場合に、それぞれ対応するピッチの周期性又はホルマントの強調の強弱又は有無を設定することができる。その結果、復号された音声信号が広帯域音声信号であっても狭帯域音声信号であっても、適切に量子化雑音の影響を低減させることができる。
具体的な例としては、帯域の識別情報により狭帯域音声信号が復号されることがわかる場合には、帯域の識別情報により広帯域音声信号が復号されることがわかる場合に比べ、広帯域音声復号化において合成フィルタから出力される音声信号の劣化が大きいと推定されるので、音声信号の修正を比較的強く行うように後処理フィルタで用いるパラメータを制御することが好ましい。
後処理フィルタ部58の詳細な具体例として、ここでは適応ポストフィルタを用いて説明する。適応ポストフィルタは、例えば、図13に示すように、フォルマントポストフィルタ90、傾き補償フィルタ91、ゲイン調整部92から構成されるがこれに限られるものではない。適応ポストフィルタの構成としては、さらにピッチ強調フィルタを含む構成であってもよい。
適応ポストフィルタの処理は一例として、以下のように行われる。
最初に、合成フィルタからの音声信号をフォルマントポストフィルタ90に通し、この出力信号を傾き補償フィルタ91に通し、傾き補償フィルタからの出力信号をゲイン調整部92に入力してゲイン調整を行うことにより適応ポストフィルタの出力となる音声信号が得られる。なお、適応ポストフィルタ内部の処理順についてはこれに限られるものではなく、合成フィルタからの音声信号を、まず初めに傾き補償フィルタに通過させる構成や、ゲイン補償処理を適応ポストフィルタの処理の初段または中段で行う構成など、様々な構成を採用することが可能である。
図13の例は、帯域の識別情報に応じてフォルマントポストフィルタ90で使用するパラメータが制御部55によって制御されることにより、音声のスペクトルの概形を強調する度合いが制御される構成を示している。
ポストフィルタは、フレームを分割したサブフレームごとに更新される場合が多い。例えば音声復号化のフレームが20msのときの典型的な例としては、サブフレーム長として5msや10msを用いることが多い。
フォルマントポストフィルタ60(Hf(z))は、例えば次式で与えられる。
Figure 2005258226
ここでA^(z)は、スペクトルパラメータAから求められるLPC係数a^i(i=1,…,p;pはLPCの次数で典型的には8〜16程度)を用いて次式で表される。
Figure 2005258226
1/A^(z)は再生された音声信号のスペクトルの概形(スペクトル包絡とも言う)を表しており、パラメータγnおよびγdによって、フォルマントポストフィルタHf(z)の特性が決まる。通常パラメータγnおよびγdは、0<γn<1、および、0<γd<1であり、特に、γn<γdとすることにより、フォルマントポストフィルタHf(z)は音声信号のスペクトルの概形を強調する特性となる。また、γnとγdの値に応じて、音声信号のスペクトルの概形を強調する度合いを変えることができる。
例えば、第1のパラメータセットとしてγn=0.5、γd=0.55とし、第2のパラメータセットとしてγn=0.5、γd=0.7とすると、第2のパラメータセットの方が、第1のパラメータセットに比べて、音声信号のスペクトルの概形を強調する(修正する)度合いが大きいフォルマントポストフィルタとなる。このようにパラメータ(セット)を切り替えることにより、適応ポストフィルタの特性を修正する(変える)ことができる。本発明では、狭帯域信号であることが検出されたときには、適応ポストフィルタによる強調(修正)の度合いが大きくなるようにパラメータ(セット)を切り替えるようにする。上記の例では、狭帯域信号であることが検出されたときには、音声信号のスペクトルの概形を強調する(修正する)度合いが大きい第2のパラメータセット(例えばγn=0.5、γd=0.7)を用いるようにする。一方、広帯域信号であることが検出されたときには、音声信号のスペクトルの概形を強調する(修正する)度合いが比較的小さい第1のパラメータセット(例えば、γn=0.5、γd=0.55)を用いるようにする。
このようにすることで、品質が劣化しやすい狭帯域の音声信号を復号化処理で生成する場合に、スペクトルの概形を適切な強さで強調して音質を改善することができるようになる。一方、広帯域の音声信号については、品質劣化が少ない傾向にあるので、スペクトルの概形をあまり強調する必要が少ない。このため、スペクトルの概形を強調する度合いのより少ないパラメータ(セット)を用いるようにする。こうすることで、狭帯域音声が生成されるか広帯域音声が生成されるかに応じて、スペクトルの概形を適切に強調できるので、低ビットレートでも、高品質な音声を安定して提供することができるようになる。
上記で説明した第1、第2のパラメータセットの数値はこれに限られるものでないことは言うまでもない。例えば、広帯域用の後処理フィルタに用いる第1のパラメータセットとしてγn=0.5、γd=0.5などとγnとγdを同じ値にしたものを使用することも可能であり、この場合には、実質的にスペクトルの概形を強調(修正)しないことと等しく、強調の度合いが小さいようにする方法として、このような使い方も有効である。
フォルマントポストフィルタ90からの出力信号は傾き補償フィルタ91に通される。傾き補償フィルタHt(z)はフォルマントポストフィルタHf(z)の傾きを補償するもので、一例としては、次の式で与えられる。
Figure 2005258226
ここでμ=γtk1’であり、k1’はフィルタA^(z/γn)/A^(z/γd)のインパルス応答hf(n)を用いて、次の式で求められる。
Figure 2005258226
上記の例ではインパルス応答を長さLh(例えば20程度)で打ち切ったものからk1’を求めるが、これに限られるものではない。
ゲイン調整部92は傾き補償フィルタからの出力信号を入力してゲイン調整を行う。ゲイン調整部92は、ポストフィルタの入力信号である合成フィルタからの音声信号とポストフィルタで処理された後の出力信号の利得の違いを補償するためのゲイン値を計算し、ポストフィルタ自体のゲインを調整する。こうすることにより、ポストフィルタに入力される音声信号とポストフィルタから出力される音声信号の大きさが同じ程度になるようにすることができる。
上記の例では、後処理フィルタを用いた音声信号の修正として、フォルマントポストフィルタを用いたが、これに限られるものではなく、音声信号のピッチ周期性を強調するためのピッチ強調フィルタ、傾き補償フィルタ、または、ゲイン調整処理の何れかに関連するパラメータを帯域情報が広帯域か狭帯域かに応じて修正することにより音声信号が修正される構成によっても適応化は可能である。本発明の本旨とするところは、帯域情報が広帯域か狭帯域かに応じて、適応的に音声信号が修正されることが特徴であり、この本旨に従う適応的な後処理の構成であれば発明法に含まれることは言うまでも無い。
本発明の第3の実施形態によれば、検出される音声信号の帯域情報が広帯域であるか狭帯域であるかに応じて後処理フィルタにより音声信号のスペクトルの概形を適応的に整形するので、音声信号に含まれる量子化雑音の影響を適切に低減させることができる効果がある。
以下、図14を参照して、本発明の第4の実施形態を説明する。
第4の実施形態における本発明の特徴は、音声復号化部66がLower−Band生成部66a(低域側の音声信号を生成。典型的には約6kHz以下の低域側の音声信号を生成する)と、Higher−Band生成部66b(高域信号を生成。典型的には約6kHz〜7kHzの帯域の高域側の音声信号を生成する)から構成されており、検出された帯域情報の広帯域又は狭帯域の区別に応じて、Higher−Band生成部を制御することにより、音声復号化部における高域信号を修正するか、もしくは、高域信号の生成処理を修正することにある。
高域信号を修正する方法としては、検出された帯域情報が狭帯域であることを示す場合に、Higher−Band生成部からの高域信号がLower−Band生成部からの信号に付与されないような修正を行うことを骨子とする。
以下、図14を用いて第4の実施形態の特徴となる各部について説明する。
Lower−Band生成部66aは、適応符号帳61、パルス位置設定部64、音源信号生成部62、合成フィルタ部63、後処理フィルタ部68、アップサンプリング部69から構成される。Lower−Band生成部66aにおいて、適応符号帳61、パルス位置設定部64、音源信号生成部62、合成フィルタ部63を用いて音声信号を生成し、これを後処理フィルタ部68で処理することにより、音声信号に含まれる符号化雑音の雑音整形がなされた低域側の音声信号を生成する。ここでの音声信号のサンプリングレート、典型的には、12.8kHz程度が用いられる。次に、この音声信号はアップサンプリング部69に入力され、Higher−Band信号と同じサンプリングレート(典型的には、16kHz)にアップサンプリングされる。こうして16kHzにアップサンプリングされた低域側の音声信号が、Lower−Band生成部66aから出力され、Higher−Band生成部66bに入力される。
Higher−Band生成部66bはHigher−Band信号生成部66b1とHigher−Band信号付加部66b2から構成される。Higher−Band信号生成部66b1は、合成フィルタ部63で使用した低域側の音声信号のスペクトル形状の概形を表す合成フィルタの情報を用いて、高域信号のスペクトルの形状を表す高域用の合成フィルタを生成し、これにゲインが調整された高域用の音源信号を入力して合成された信号を所定のバンドパスフィルタに通過させることにより高域信号を生成する。高域用の音源信号のゲインは、低域側の音源信号のエネルギと、低域側の音声信号のスペクトルの傾きを基に調整される。
Higher−Band信号付加部66b2は、Lower−Band生成部66aから入力された低域側の音声信号にHigher−Band信号生成部66b1で生成された高域信号を付加した信号を生成し、これを音声復号化部66からの出力として、サンプリングレート変換部104に入力する。
サンプリングレート変換部104は、図1のサンプリングレート変換部14と同様の機能を有するものであり、音声復号化部66からの音声信号を入力し、制御部65からの帯域情報に基づいて、帯域情報が広帯域を示す場合には、サンプリングレート変換を行わずに、音声復号化部からの音声信号をそのまま音声出力部に出力する。
一方、制御部65からの帯域情報が狭帯域を示す場合には、サンプリングレート変換部104に入力される音声復号化部からの音声信号は、高い周波数を持たない狭帯域信号であることがわかる。この場合には、サンプリングレート変換部104は、音声復号化部から入力された音声信号(典型的には16kHzサンプリング)を、狭帯域信号用の低いサンプリングレート(典型的には8kHzサンプリング)に変換して出力するようにする。
図14の例を用いて、より具体的に発明法の動作について説明すると、次のようになる。制御部65に入力された帯域情報が狭帯域であることを示す場合に、制御部65はHigher−Band生成部66bを制御して、Higher−Band生成部からの高域信号がLower−Band生成部からの信号に付与されないようにする。より具体的な方法としては、Higher−Band信号生成部66b1においてHigher−Band信号を生成するための処理を行わないか、もしくは、生成したHigher−Band信号を零か小さな値になるように修正して出力する。また、Higher−Band信号付加部66b2においてLower−Band生成部からの信号にHigher−Band信号の付加を行わずに、Lower−Band生成部からの信号をそのまま出力する方法でもよい。
さらに、図14の構成において、低域側の音声復号化部(図14ではLower−Band生成部66a)に第1、第2、第3の実施形態で示したそれぞれの発明法を用いることが可能であることは言うまでも無い。すなわち、検出された帯域情報を基に、低域側の音声復号化部(図14ではLower−Band生成部66a)を制御することにより、生成される狭帯域音声の音質を改善できる効果がある。この場合、制御部65からの制御信号(図14に点線矢印で表示)がLower−Band部66aに入力される構成となる。Lower−Band部66a内に入力された制御信号(点線矢印で図示)を表した例は、図16(パルス位置設定部を制御)、図17(音源信号を制御)、図18(後処理フィルタ部を制御)となる。これらは、第1の実施形態における図3、第2の実施形態における図4、第3の実施形態における図5、にそれぞれ対応しているため、詳細な説明は省略する。
また、広帯域音声復号化部がLower−Band生成部(低域側の音声信号を生成)と、Higher−Band生成部(高域信号を生成)から構成されている場合、Lower−Band生成部に第1、第2、第3の実施形態で示した発明法のいずれかを用いて、Higher−Band生成部の制御を行わない方法であってもよく、第1、第2、第3の実施形態で示した発明法の効果が得られる。このような場合の発明法の構成例は、図14、図16、図17、図18において制御部65から出力される点線矢印で示した制御信号(Lower−Band生成部に対する制御)があって、実線矢印で示した制御信号(Higher−Band生成部に対する制御)が無いものとなる。
以下、図15を参照して、本発明の第5の実施形態を説明する。第5の実施形態では、
帯域情報を基にサンプリングレート変換部における処理が制御される点は、上述したサンプリングレート変換部14と同様であるが、本発明においては、サンプリングレート変換部におけるダウンサンプリング処理に特徴がある。この際、使用する帯域情報は帯域検出部からのものを用いる。
従来のダウンサンプリング処理では、ダウンサンプリングによる周波数折り返し(エイリアジング)を防止するために、帯域制限フィルタを用いて信号の帯域制限を行ってからダウンサンプリングすることが必要であることが知られている。このため、帯域制限フィルタがもたらす遅延により出力信号が遅延することや、帯域制限フィルタの処理で計算量が増加するという問題がある。また、フィルタで帯域制限を高性能に行うためには、高次の帯域制限フィルタが必要となり、フィルタ出力の遅延や計算量が増加するという問題がある。
一方、本発明では、帯域情報を基にサンプリングレート変換部を制御してダウンサンプリングを行うことが可能となるため、帯域情報が狭帯域を示す場合には、サンプリングレート変換部に入力される音声信号は狭帯域信号であることが保証されることを利用し、そのときには、フィルタによる帯域制限を行わないで信号を間引いてダウンサンプリングすることが特徴である。こうすることで、帯域制限フィルタを用いないため、ダウンサンプリング処理による出力信号の遅延が生じないという効果がある。また、帯域制限フィルタを用いないので計算量を低減できる効果がある。しかも、検出した帯域情報を基に、サンプリングレート変換部に入力される音声信号が狭帯域に帯域制限されていることを確認した上で、信号を間引いてダウンサンプリングするので、ダウンサンプリングによる周波数折り返し(エイリアジング)の影響を非常に小さいものにできる効果がある。
ここで、図15を用いて、第5の実施形態の動作を説明する。
図15は制御部65とサンプリングレート変換部104の構成を示すものである。帯域検出部からの帯域情報は制御部65に入力される。この帯域情報は復号化部で生成される音声信号(典型的には16kHzサンプリングの音声信号)が狭帯域信号であるか広帯域信号であるかを示すものである。帯域情報は、帯域検出部において帯域の識別情報から求められたものを用いる。帯域の識別情報は、一例としては、図10に示すように、符号化データとは別に、サイド情報としてとして送信側から伝送されたものを使用するが、これに限られるものではなく、帯域の識別情報が符号化データの一部に組み入れて送られたものを用いる構成でもよいし、もしくは、帯域の識別情報が符号化データに付随したデータとして送られたものを用いる構成でもよい。
あるいは、図9のように音声復号化部の内部で再生される信号(例えば、音声信号や音源信号など)もしくは、音声信号のスペクトルの概形を表すスペクトルパラメータを基に、帯域の識別情報を求めることも一方法であることは既に述べた通りである。
制御部65に入力された帯域情報が狭帯域を示す場合には、制御部65は、切り替え部107を制御して切り替え部内のスイッチをダウンサンプリング部106の側に接続することにより、サンプリングレート変換部104に入力された音声信号がダウンサンプリング部106に入力される。ダウンサンプリング部106は、入力された音声信号(典型的には16kHzサンプリングの音声信号)を間引いてダウンサンプリングされた音声信号(典型的には8kHzサンプリングの音声信号)を生成し、音声出力部に出力する。このとき、ダウンサンプリング部106における信号の間引き処理は、帯域制限フィルタ処理を用いないで単純に信号の間引きを行う。例えば、16kHzサンプリングの音声信号をダウンサンプリング部106で8kHにダウンサンプリングする場合には、入力された16kHzサンプリングの音声信号を2:1の割合で規則的に信号を間引くことで8kHzサンプリングの音声信号を生成することができる。言い換えると、16kHzサンプリングの音声信号の奇数サンプル、もしくは偶数サンプルだけをそのまま用いて8kHzサンプリングの音声信号として出力する。
一方、制御部65に入力された帯域情報が広帯域を示す場合には、制御部65は、サンプリングレート変換部104に入力された音声信号(典型的には16kHzサンプリングの音声信号)をそのまま音声出力部に出力するように切り替え部107のスイッチを制御する。
図8は、第5の実施形態に係る発明法の処理例をフローチャートに表したものである。
ステップS81で、帯域情報を取得する。次に、ステップS82で広帯域音声復号処理を行う。これと前後して、ステップS83で帯域情報が狭帯域を示すかどうかを判定する。このとき、狭帯域と判定されると、広帯域音声復号処理により生成された音声信号に対し、ステップS84で、帯域制限フィルタを用いないで信号の間引きを行いダウンサンプリングされた信号を生成し出力する。一方、ステップS83で狭帯域でないと判定されると、広帯域音声復号処理により生成された音声信号をそのまま出力する。
なお、第5の実施形態は、上述した第1、第2、第3、第4の実施形態で示したそれぞれの方法と共に用いることが可能である。すなわち、それぞれの実施形態で示した方法はそれぞれ単独で用いることが可能であるし、あるいは、複数の方法を組み合わせて用いることも可能である。
図7は、第5の実施形態に係る方法と第1の実施形態に係る方法を併用したときの処理例をフローチャートに表したものである。ステップS71で、帯域情報を取得する。次に、ステップS72で帯域情報が狭帯域を示すかどうかを判定する。このとき、狭帯域でないと判定されると、ステップS73で第1の広帯域音声復号化処理(広帯域用のパラメータを用いた通常の広帯域音声復号化処理)を行う。一方、ステップS72で帯域情報が狭帯域でないと判定されると、ステップS74で第2の広帯域音声復号化処理(狭帯域用にパラメータを修正した広帯域音声復号化処理)を行い、この処理により生成された音声信号に対し、ステップS75で、帯域制限フィルタを用いない間引き処理によりダウンサンプリングされた音声信号を生成し出力する。
第5の実施形態における方法は、第4の実施形態における方法とあわせて用いると、より効果的である。すなわち、第4の実施形態における方法を用いると、検出した帯域情報を基に、復号化部で生成される音声信号が狭帯域信号であることがわかると、復号化部66から出力される音声信号にHigher−Band生成部66bからの高域信号(狭帯域音声信号が生成される場合でも完全にゼロの信号ではない)が混入しないように制御部が制御するので、高域信号成分が更に少ない狭帯域の音声信号を復号化部の出力として生成することができる。この狭帯域の音声信号をサンプリングレート変換部104に入力するので、帯域制限フィルタ処理をしないで間引いてダウンサンプリングしたときに生じる周波数折り返し(エイリアジング)は、第5の実施形態における方法を単独で用いた場合よりも、より小さくなるので、音質が改善されるという効果がある。
本発明の第1の実施形態に係る音声復号化装置を示すブロック図。 符号化データを生成するための音声符号化装置の例を示すブロック図。 本発明の第1の実施形態に係る帯域情報を基に音声復号化部を制御する方法の一例を示すブロック図。 本発明の第2の実施形態に係る帯域情報を基に音声復号化部を制御する方法の一例を示すブロック図。 本発明の第3の実施形態に係る帯域情報を基に音声復号化部を制御する方法の一例を示すブロック図。 本発明の第1の実施形態に係る音声復号化の動作を示すフローチャート。 本発明の第5の実施形態に係る音声復号化部を制御する方法と第1の実施形態に係る音声復号化部を制御する方法を併用したときの処理を表すフローチャート。 本発明の第5の実施形態に係る音声復号化部を制御する方法の処理を表すフローチャート。 本発明の実施形態に係る帯域の識別情報を音声復号化部から得る例を示すブロック図。 本発明の実施形態に係る帯域の識別情報をサイド情報として受信する例を示すブロック図。 本発明の第2の実施形態に係る帯域情報を基に音声復号化部を制御する方法の一例を示すブロック図。 本発明の第2の実施形態に係る帯域情報を基に音声復号化部を制御する方法の一例を示すブロック図。 本発明の第3の実施形態に係る後処理フィルタ部の構成例を示すブロック図。 本発明の第4の実施形態に係る音声復号化部と制御部の構成を示すブロック図。 本発明の第5の実施形態に係るサンプリングレート変換部と制御部の構成を示すブロック図。 本発明の実施形態に係る音声復号化部と制御部の構成を示すブロック図。 本発明の実施形態に係る音声復号化部と制御部の構成を示すブロック図。 本発明の実施形態に係る音声復号化部と制御部の構成を示すブロック図。
符号の説明
10・・・音声復号化装置
11・・・出力音声
12・・・音声出力部
13,23・・・帯域検出部
14,24,104・・・サンプリングレート変換部
15,25,65・・・制御部
16・・・音声復号化部
17・・・符号化データ入力部
18・・・復号化データ
21・・・入力音声
22・・・音声入力部
26・・・音声符号化部
27・・・符号化データ出力部
28・・・符号化データ
31,41,51,61・・・適応符号帳
32,42,52,62・・・音源信号生成部
33,43,53,63・・・合成フィルタ部
34,44,54,64・・・パルス位置設定部
35,45・・・復号化部パラメータ用メモリ
36,46,56,66・・・音声復号化部
47,47a,47b・・・音源修正部
48,58・・・後処理フィルタ部
55・・・符号化パラメータ用メモリ
66b・・・Higher−Band生成部
66b1・・・Higher−Band信号生成部
66b2・・・Higher−Band信号不可部
90・・・ホルマウントポストフィルタ
91・・・傾き補償フィルタ
92・・・ゲイン調整部
106・・・ダウンサンプリング部
107・・・切り替え部

Claims (36)

  1. 符号化データから音源信号と合成フィルタを生成し、音源信号と合成フィルタから音声信号を復号する復号処理を用いた広帯域音声復号化方法において、
    復号される音声信号が狭帯域であることを識別する識別情報を取得し、
    前記識別情報を基に復号処理を制御することを特徴とする広帯域音声復号化方法。
  2. Lower−Band生成(低域側の音声信号を生成する)処理と、Higher−Band生成(高域信号を生成する)処理から構成される広帯域音声復号化方法において、
    復号される音声信号が狭帯域であることを識別する識別情報を取得し、
    前記識別情報を基にLower−Band生成処理を制御することを特徴とする広帯域音声復号化方法。
  3. 前記識別情報を基に、前記音源信号の生成に関係する処理を制御することを特徴とする請求項1又は2に記載の広帯域音声復号化方法。
  4. 前記識別情報を基に、前記音源信号の生成に用いるパルスの位置に関係する処理を制御することを特徴とする請求項1乃至3に記載の広帯域音声復号化方法。
  5. 符号化データから音源信号と合成フィルタを生成し、音源信号と合成フィルタから音声信号を復号する広帯域音声復号化方法において、
    復号される音声信号が狭帯域であることを識別する識別情報を取得し、
    前記識別情報を基に、復号された音声信号または音源信号を修正することを特徴とする広帯域音声復号化方法。
  6. Lower−Band生成(低域側の音声信号を生成する)処理と、Higher−Band生成(高域信号を生成する)処理から構成される広帯域音声復号化方法において、
    復号される音声信号が狭帯域であることを識別する識別情報を取得し、
    前記識別情報を基にLower−Band生成処理で生成される音声信号または音源信号を修正することを特徴とする広帯域音声復号化方法。
  7. 前記識別情報を基に、ピッチ周期性又はホルマントの強調の強弱または有無を制御することにより復号された音声信号または音源信号を修正することを特徴とする請求項5又は6に記載の広帯域音声復号化方法。
  8. 前記識別情報は、符号化データと別に受信されることを特徴とする請求項1乃至7に記載の広帯域音声復号化方法。
  9. 前記識別情報は、符号化データまたは符号化データに付随されたデータから取得されることを特徴とする請求項1乃至7に記載の広帯域音声復号化方法。
  10. 前記識別情報は、合成フィルタを表すスペクトルパラメータ情報から取得されることを特徴とする請求項1乃至7に記載の広帯域音声復号化方法。
  11. 前記識別情報は、復号された音声信号から取得されることを特徴とする請求項1乃至7に記載の広帯域音声復号化方法。
  12. 前記識別情報は、復号側の所定の入力手段から取得されることを特徴とする請求項1乃至7に記載の広帯域音声復号化方法。
  13. 前記識別情報から狭帯域であると識別された場合に、復号された音声信号またはこれに由来する信号をダウンサンプリングすることを特徴とする請求項1乃至12に記載の広帯域音声復号化方法。
  14. 符号化データから音源信号と合成フィルタを生成し、音源信号と合成フィルタから音声信号を復号する広帯域音声復号化方法において、
    復号される音声信号が狭帯域であることを識別する識別情報を取得し、
    前記識別情報から狭帯域と識別されて、かつ、復号された音声信号またはこれに由来する信号をダウンサンプリングする場合は、帯域制限フィルタを介さずに信号を間引くことによりダウンサンプリングを行うことを特徴とする広帯域音声復号化方法。
  15. Lower−Band生成(低域側の音声信号を生成する)処理と、Higher−Band生成(高域信号を生成する)処理から構成される広帯域音声復号化方法において、
    復号される音声信号が狭帯域であることを識別する識別情報を取得し、
    前記識別情報から狭帯域と識別されて、かつ、復号された音声信号またはこれに由来する信号をダウンサンプリングする場合は、帯域制限フィルタを介さずに信号を間引くことによりダウンサンプリングを行うことを特徴とする広帯域音声復号化方法。
  16. 符号化データから音源信号を生成する手段、合成フィルタを生成する手段、音源信号と合成フィルタから音声信号を復号する手段を用いた広帯域音声復号化装置において、
    復号される音声信号が狭帯域であることを識別する識別情報を取得する手段と、
    前記識別情報を基に復号手段を制御する手段を有することを特徴とする広帯域音声復号化装置。
  17. Lower−Band生成(低域側の音声信号を生成する)手段と、Higher−Band生成(高域信号を生成する)手段から構成される広帯域音声復号化装置において、
    復号される音声信号が狭帯域であることを識別する識別情報をする手段と、
    前記識別情報を基にLower−Band生成手段を制御する手段を有することを特徴とする広帯域音声復号化装置。
  18. 前記識別情報を基に、前記音源信号の生成手段を制御することを特徴とする請求項16乃至17に記載の広帯域音声復号化装置。
  19. 前記識別情報を基に、前記音源信号の生成に用いるパルスの位置を制御することを特徴とする請求項16乃至18に記載の広帯域音声復号化装置。
  20. 符号化データから音源信号を生成する手段、合成フィルタを生成する手段、音源信号と合成フィルタから音声信号を復号する手段を用いた広帯域音声復号化装置において、
    復号される音声信号が狭帯域であることを識別する識別情報を取得する手段と、
    前記識別情報を基に、復号された音声信号または音源信号を修正する手段を有することを特徴とする広帯域音声復号化装置。
  21. Lower−Band生成(低域側の音声信号を生成する)手段と、Higher−Band生成(高域信号を生成する)手段から構成される広帯域音声復号化装置において、
    復号される音声信号が狭帯域であることを識別する識別情報をする手段と、
    前記識別情報を基にLower−Band生成手段で復号される音声信号または音源信号を修正する手段を有することを特徴とする広帯域音声復号化装置。
  22. 前記修正手段は、前記識別情報を基に、ピッチ周期性又はホルマントの強調の強弱または有無に影響を与える波形修正であることを特徴とする請求項20乃至21に記載の広帯域音声復号化装置。
  23. 前記識別情報は、符号化データと別に受信されることを特徴とする請求項16乃至22に記載の広帯域音声復号化装置。
  24. 前記識別情報は、符号化データまたは符号化データに付随されたデータから取得されることを特徴とする請求項16乃至22に記載の広帯域音声復号化装置。
  25. 前記識別情報は、合成フィルタを表すスペクトルパラメータ情報から取得されることを特徴とする請求項16乃至22に記載の広帯域音声復号化装置。
  26. 前記識別情報は、復号された音声信号から取得されることを特徴とする請求項16乃至22に記載の広帯域音声復号化装置。
  27. 前記識別情報は、復号側の所定の入力手段から取得されることを特徴とする請求項16乃至22に記載の広帯域音声復号化装置。
  28. 前記識別情報から狭帯域であると識別された場合に、復号された音声信号またはこれに由来する信号をダウンサンプリングする手段を有することを特徴とする請求項16乃至か127に記載の広帯域音声復号化装置。
  29. 符号化データから音源信号を生成する手段、合成フィルタを生成する手段、音源信号と合成フィルタから音声信号を復号する手段を用いた広帯域音声復号化装置において、
    復号される音声信号が狭帯域であることを識別する識別情報を取得する手段と、
    前記識別情報から狭帯域と識別されて、かつ、復号された音声信号またはこれに由来する信号をダウンサンプリングする場合は、帯域制限フィルタを介さずに信号を間引くことによりダウンサンプリングを行う手段を有することを特徴とする広帯域音声復号化装置。
  30. Lower−Band生成(低域側の音声信号を生成する)手段と、Higher−Band生成(高域信号を生成する)手段から構成される広帯域音声復号化装置において、
    復号される音声信号が狭帯域であることを識別する識別情報を取得する手段と、
    前記識別情報から狭帯域と識別されて、かつ、復号された音声信号またはこれに由来する信号をダウンサンプリングする場合は、帯域制限フィルタを介さずに信号を間引く手段によりダウンサンプリングを行うことを特徴とする広帯域音声復号化装置。
  31. Lower−Band生成(低域側の音声信号を生成する)処理と、Higher−Band生成(高域信号を生成する)処理から構成される広帯域音声復号化方法において、
    復号される音声信号が狭帯域であることを識別する識別情報を取得し、
    前記識別情報を基にHigher−Band生成処理を制御することを特徴とする広帯域音声復号化方法。
  32. Lower−Band生成(低域側の音声信号を生成する)処理と、Higher−Band生成(高域信号を生成する)処理から構成される広帯域音声復号化方法において、
    復号される音声信号が狭帯域であることを識別する識別情報を取得し、
    前記識別情報を基にHigher−Band生成処理からの信号を修正することを特徴とする広帯域音声復号化方法。
  33. 前記識別情報から狭帯域と識別されて、かつ、復号された音声信号またはこれに由来する信号をダウンサンプリングする場合は、帯域制限フィルタを介さずに信号を間引くことによりダウンサンプリングを行うことを特徴とする請求項31又は32に記載の広帯域音声復号化方法。
  34. Lower−Band生成(低域側の音声信号を生成する)手段と、Higher−Band生成(高域信号を生成する)手段から構成される広帯域音声復号化装置において、
    復号される音声信号が狭帯域であることを識別する識別情報を取得する手段と、
    前記識別情報を基にHigher−Band生成手段を制御する手段を有することを特徴とする広帯域音声復号化装置。
  35. Lower−Band生成(低域側の音声信号を生成する)手段と、Higher−Band生成(高域信号を生成する)手段から構成される広帯域音声復号化装置において、
    復号される音声信号が狭帯域であることを識別する識別情報を取得する手段と、
    前記識別情報を基にHigher−Band生成手段からの信号を修正する手段を有することを特徴とする広帯域音声復号化装置。
  36. 前記識別情報から狭帯域と識別されて、かつ、復号された音声信号またはこれに由来する信号をダウンサンプリングする場合は、帯域制限フィルタを介さずに信号を間引く手段によりダウンサンプリングを行うことを特徴とする請求項34又は35に記載の広帯域音声復号化装置。
JP2004071740A 2003-04-04 2004-03-12 音声復号化方法及び音声復号化装置 Expired - Lifetime JP4047296B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP2004071740A JP4047296B2 (ja) 2004-03-12 2004-03-12 音声復号化方法及び音声復号化装置
PCT/JP2004/004913 WO2004090870A1 (ja) 2003-04-04 2004-04-05 広帯域音声を符号化または復号化するための方法及び装置
US11/240,495 US7788105B2 (en) 2003-04-04 2005-10-03 Method and apparatus for coding or decoding wideband speech
US12/751,292 US8160871B2 (en) 2003-04-04 2010-03-31 Speech coding method and apparatus which codes spectrum parameters and an excitation signal
US12/751,191 US8249866B2 (en) 2003-04-04 2010-03-31 Speech decoding method and apparatus which generates an excitation signal and a synthesis filter
US12/751,421 US8260621B2 (en) 2003-04-04 2010-03-31 Speech coding method and apparatus for coding an input speech signal based on whether the input speech signal is wideband or narrowband
US13/417,906 US8315861B2 (en) 2003-04-04 2012-03-12 Wideband speech decoding apparatus for producing excitation signal, synthesis filter, lower-band speech signal, and higher-band speech signal, and for decoding coded narrowband speech

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004071740A JP4047296B2 (ja) 2004-03-12 2004-03-12 音声復号化方法及び音声復号化装置

Publications (2)

Publication Number Publication Date
JP2005258226A true JP2005258226A (ja) 2005-09-22
JP4047296B2 JP4047296B2 (ja) 2008-02-13

Family

ID=35083974

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004071740A Expired - Lifetime JP4047296B2 (ja) 2003-04-04 2004-03-12 音声復号化方法及び音声復号化装置

Country Status (1)

Country Link
JP (1) JP4047296B2 (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007249075A (ja) * 2006-03-17 2007-09-27 Toshiba Corp 音声再生装置および高域補間処理方法
WO2007114291A1 (ja) * 2006-03-31 2007-10-11 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号化装置、およびこれらの方法
JP2009116245A (ja) * 2007-11-09 2009-05-28 Yamaha Corp 音声強調装置
JP2009530685A (ja) * 2006-03-20 2009-08-27 マインドスピード・テクノロジーズ・インコーポレイテッド Mdct係数を使用する音声後処理
JP2010501080A (ja) * 2006-07-31 2010-01-14 クゥアルコム・インコーポレイテッド 音声信号に関連するパケットに識別子を含めるためのシステムおよび方法
JP2010055002A (ja) * 2008-08-29 2010-03-11 Toshiba Corp 信号帯域拡張装置
WO2010137203A1 (ja) 2009-05-27 2010-12-02 パナソニック株式会社 通信装置および信号処理方法
WO2011039919A1 (ja) * 2009-09-30 2011-04-07 パナソニック株式会社 オーディオデコーダ、オーディオエンコーダ、システム
JP2011514749A (ja) 2008-02-20 2011-05-06 リサーチ イン モーション リミテッド スピーチ符号器の動作レートを選択する装置および関連する方法
WO2012046447A1 (ja) * 2010-10-06 2012-04-12 パナソニック株式会社 符号化装置、復号装置、符号化方法及び復号方法
JP4954069B2 (ja) * 2005-06-17 2012-06-13 パナソニック株式会社 ポストフィルタ、復号化装置及びポストフィルタ処理方法
JP2017152067A (ja) * 2016-02-24 2017-08-31 アルパイン株式会社 オーディオ装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08248997A (ja) * 1995-03-13 1996-09-27 Matsushita Electric Ind Co Ltd 音声帯域拡大装置
JPH09258787A (ja) * 1996-03-21 1997-10-03 Kokusai Electric Co Ltd 狭帯域音声信号の周波数帯域拡張回路
JP2000181497A (ja) * 1998-12-18 2000-06-30 Sony Corp 受信装置及び方法、通信装置及び方法
JP2000206996A (ja) * 1999-01-13 2000-07-28 Sony Corp 受信装置及び方法、通信装置及び方法
JP2002140098A (ja) * 2000-10-31 2002-05-17 Nec Corp 音声復号装置および音声復号プログラムを記録した記録媒体
WO2002043053A1 (en) * 2000-11-22 2002-05-30 Voiceage Corporation Indexing pulse positions and signs in algebraic codebooks for coding of wideband signals
WO2002056295A2 (en) * 2001-01-12 2002-07-18 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
JP2003140696A (ja) * 2001-08-23 2003-05-16 Matsushita Electric Ind Co Ltd 音声処理装置
JP2003256000A (ja) * 2001-12-25 2003-09-10 Matsushita Electric Ind Co Ltd 電話装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08248997A (ja) * 1995-03-13 1996-09-27 Matsushita Electric Ind Co Ltd 音声帯域拡大装置
JPH09258787A (ja) * 1996-03-21 1997-10-03 Kokusai Electric Co Ltd 狭帯域音声信号の周波数帯域拡張回路
JP2000181497A (ja) * 1998-12-18 2000-06-30 Sony Corp 受信装置及び方法、通信装置及び方法
JP2000206996A (ja) * 1999-01-13 2000-07-28 Sony Corp 受信装置及び方法、通信装置及び方法
JP2002140098A (ja) * 2000-10-31 2002-05-17 Nec Corp 音声復号装置および音声復号プログラムを記録した記録媒体
WO2002043053A1 (en) * 2000-11-22 2002-05-30 Voiceage Corporation Indexing pulse positions and signs in algebraic codebooks for coding of wideband signals
WO2002056295A2 (en) * 2001-01-12 2002-07-18 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
JP2003140696A (ja) * 2001-08-23 2003-05-16 Matsushita Electric Ind Co Ltd 音声処理装置
JP2003256000A (ja) * 2001-12-25 2003-09-10 Matsushita Electric Ind Co Ltd 電話装置

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8315863B2 (en) 2005-06-17 2012-11-20 Panasonic Corporation Post filter, decoder, and post filtering method
JP4954069B2 (ja) * 2005-06-17 2012-06-13 パナソニック株式会社 ポストフィルタ、復号化装置及びポストフィルタ処理方法
JP2007249075A (ja) * 2006-03-17 2007-09-27 Toshiba Corp 音声再生装置および高域補間処理方法
US8095360B2 (en) 2006-03-20 2012-01-10 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
JP2009530685A (ja) * 2006-03-20 2009-08-27 マインドスピード・テクノロジーズ・インコーポレイテッド Mdct係数を使用する音声後処理
WO2007114291A1 (ja) * 2006-03-31 2007-10-11 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号化装置、およびこれらの方法
JP4976381B2 (ja) * 2006-03-31 2012-07-18 パナソニック株式会社 音声符号化装置、音声復号化装置、およびこれらの方法
CN104123946A (zh) * 2006-07-31 2014-10-29 高通股份有限公司 用于在与语音信号相关联的包中包含识别符的系统及方法
JP2010501080A (ja) * 2006-07-31 2010-01-14 クゥアルコム・インコーポレイテッド 音声信号に関連するパケットに識別子を含めるためのシステムおよび方法
US8135047B2 (en) 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
JP2009116245A (ja) * 2007-11-09 2009-05-28 Yamaha Corp 音声強調装置
JP2011514749A (ja) 2008-02-20 2011-05-06 リサーチ イン モーション リミテッド スピーチ符号器の動作レートを選択する装置および関連する方法
JP2010055002A (ja) * 2008-08-29 2010-03-11 Toshiba Corp 信号帯域拡張装置
WO2010137203A1 (ja) 2009-05-27 2010-12-02 パナソニック株式会社 通信装置および信号処理方法
JP2011075936A (ja) * 2009-09-30 2011-04-14 Panasonic Corp オーディオエンコーダ及びデコーダ
US8688442B2 (en) 2009-09-30 2014-04-01 Panasonic Corporation Audio decoding apparatus, audio coding apparatus, and system comprising the apparatuses
WO2011039919A1 (ja) * 2009-09-30 2011-04-07 パナソニック株式会社 オーディオデコーダ、オーディオエンコーダ、システム
WO2012046447A1 (ja) * 2010-10-06 2012-04-12 パナソニック株式会社 符号化装置、復号装置、符号化方法及び復号方法
JPWO2012046447A1 (ja) * 2010-10-06 2014-02-24 パナソニック株式会社 符号化装置、復号装置、符号化方法及び復号方法
US9117461B2 (en) 2010-10-06 2015-08-25 Panasonic Corporation Coding device, decoding device, coding method, and decoding method for audio signals
JP2017152067A (ja) * 2016-02-24 2017-08-31 アルパイン株式会社 オーディオ装置

Also Published As

Publication number Publication date
JP4047296B2 (ja) 2008-02-13

Similar Documents

Publication Publication Date Title
US7788105B2 (en) Method and apparatus for coding or decoding wideband speech
JP4658596B2 (ja) 線形予測に基づく音声コーデックにおける効率的なフレーム消失の隠蔽のための方法、及び装置
JP5047268B2 (ja) Mdct係数を使用する音声後処理
KR101406742B1 (ko) 피치 주기 보정을 이용한 디지털 오디오 신호의 손실 블록의 합성 방법
US20080297380A1 (en) Signal decoding apparatus and signal decoding method
US20080208575A1 (en) Split-band encoding and decoding of an audio signal
WO2010031049A1 (en) Improving celp post-processing for music signals
JP4047296B2 (ja) 音声復号化方法及び音声復号化装置
JP3770901B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3748081B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP4447546B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3676801B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3748083B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3770899B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3770900B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3748080B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3773509B2 (ja) 広帯域音声復元装置及び広帯域音声復元方法
JP4087823B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3636327B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3748082B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP2005321828A (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP2005321824A (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP2005284315A (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP2005284317A (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP2005321827A (ja) 広帯域音声復元方法及び広帯域音声復元装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070312

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20070330

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20070509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070515

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070717

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071120

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071121

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101130

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4047296

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101130

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111130

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121130

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131130

Year of fee payment: 6

EXPY Cancellation because of completion of term