JPWO2015129165A1

JPWO2015129165A1 - 復号装置、符号化装置、復号方法、符合化方法、端末装置、および基地局装置

Info

Publication number: JPWO2015129165A1
Application number: JP2016505017A
Authority: JP
Inventors: 河嶋　拓也; 拓也河嶋; 江原　宏幸; 宏幸江原
Original assignee: Panasonic Intellectual Property Corp of America
Current assignee: Panasonic Intellectual Property Corp of America
Priority date: 2014-02-28
Filing date: 2015-02-06
Publication date: 2017-03-30
Also published as: WO2015129165A1; CN111370008B; EP3113181A4; US20180336908A1; CN105659321A; MX2016008718A; KR20160120713A; US11257506B2; EP4325488A2; EP3113181B1; US20160284357A1; US10062389B2; CN111370008A; EP3113181C0; EP4325488A3; US20200160873A1; EP3113181A1; KR102185478B1; MX361028B; RU2016138285A

Abstract

本開示の復号装置は、所定の周波数以下の低域スペクトルを符号化したコア符号化データと、所定の周波数以上の高域スペクトルをコア符号化データに基づき符号化した拡張帯域符号化データを復号する復号装置（１００）であって、コア符号化データを復号したコア復号スペクトルの振幅をコア復号スペクトルの振幅の最大値で正規化し正規化スペクトルを生成する振幅正規化部（１０３）と、雑音スペクトルを生成する雑音生成部（１０４）と、正規化スペクトルに雑音スペクトルを加算して雑音加算正規化スペクトルを生成する第１の加算部（１０５）と、雑音加算正規化スペクトルを用いて前記拡張帯域符号化データを復号し、雑音加算拡張帯域スペクトルを生成する拡張帯域復号部（１０６）と、を有する。

Description

本開示は、音声信号や音楽信号（以下、音声信号等とする。）のミュージカルノイズを低減するように、音声信号等を復号または符号化する技術に関する。

音声信号等を低ビットレートで圧縮する音声符号化技術は、移動体通信における電波等の有効利用を実現する重要な技術である。さらに、近年通話音声の品質向上に対する期待が高まっており、臨場感の高い通話サービスの実現が望まれている。これを実現するためには、周波数帯域の広い音声信号等を高ビットレートで符号化すればよい。しかし、このアプローチは電波や周波数帯域の有効利用と相反する。

周波数帯域の広い信号を低ビットレートで高品質に符号化する方法として、入力信号のスペクトルを低域部と高域部の２つのスペクトルに分割し、高域スペクトルは低域スペクトルを複製しこれと置換する、つまり高域スペクトルを低域スペクトルで代用することにより、全体のビットレートを低減させる技術がある（特許文献１）。

かかる技術を基に、高域スペクトルは低域スペクトルに対してエネルギーの偏りが小さいという特性に鑑み、サブバンド毎に低域スペクトルを正規化（平坦化）してから高域スペクトルとの相関をとるという技術がある。これによれば、ピーク性の高い低域スペクトルをそのままコピーすることによる音質劣化を防止することができる。ただし、この技術には、低域スペクトルが離散的なパルス列で表現されることに起因して、離散的なパルス列のエンベロープを推定する方法では本来の入力信号のエンベロープと乖離してしまうという欠点があった。そこで、この正規化方法に代えて、サブバンド毎に離散的なパルスの最大振幅値で正規化するという方法が提案されている（特許文献２）。

図１１は、特許文献２に記載の符号化装置である。かかる符号化装置において、入力信号は時間―周波数変換部１０１０で周波数領域の信号に変換されて入力信号スペクトルとして出力されるとともに、入力信号スペクトルの低域部はコア符号化部１０２０で符号化されコア符号化データとして出力される。そして、コア符号化データを復号化してコア符号化低域スペクトルを生成し、これをサブバンド振幅正規化部１０３０でサンプルの振幅の最大値で正規化し、正規化低域スペクトルを生成する。そして、正規化低域スペクトルとの相関値が最大となる入力信号スペクトルの高域部の帯域と、かかる帯域での正規化低域スペクトルと入力信号スペクトルの高域部との間のゲインとを求め、これらを拡張帯域符号化部１０６０で符号化して拡張帯域符号化データとして出力する。

図１２は、これに対応する復号装置である。符号化データは分離部２０１０でコア符号化データと拡張帯域符号化データとに分離され、コア符号化データはコア復号部２０２０で復号され、コア符号化低域スペクトルを生成する。コア符号化低域スペクトルは、サブバンド振幅正規化部２０３０で、符号化装置側と同様の処理、つまりサンプルの振幅の最大値で正規化し、正規化低域スペクトルを生成する。そして、正規化低域スペクトルを用いて拡張帯域復号部２０４０で拡張帯域符号化データを復号し、拡張帯域スペクトルを生成する。

また、図１３のように、ピーク性の強さに応じて、サンプルの最大値で正規化するサブバンド振幅正規化部１０３０と、サンプルのスペクトルパワーの包絡で正規化するスペクトル包絡正規化部７０２０とを切り替えて正規化を行う技術も開示されている。

特許文献２に記載のサンプルの最大値で正規化する技術は、低域スペクトルがスパースな場合、つまり一部のサンプルの振幅値のみ大きく、その他のサンプルの振幅値がほぼゼロであるような場合に特に有効である。つまり、特許文献２の技術によれば、スパースなスペクトルであっても極端に振幅が大きいスペクトルの発生を抑止し（均質化）、特性が平坦な正規化低域スペクトルを得ることができる（平滑化）。

特表２００１−５２１６４８号公報国際公開第２０１３／０３５２５７号

しかしながら、パルス列がスパースな場合はスペクトルホールが発生しやすくなり、このスペクトルホールがミュージカルノイズと呼ばれるノイズの原因となる。特許文献２には、低域スペクトルをサンプルの振幅の最大値で正規化する場合に、スペクトルホールに起因するミュージカルノイズに対して、いかなる対策をとるかについては開示されていない。

本開示の一態様は、全体のビットレートを低減させつつも、ミュージカルノイズを抑えて高品質な音声信号等を復号できる復号装置および符号化装置を提供する。
本開示の一態様は、所定の周波数以下の低域スペクトルを符号化して生成されたコア符号化データと、前記入力信号の所定の周波数以上の高域スペクトルを前記コア符号化データとに基づいて生成された拡張帯域符号化データを復号する復号装置に関するものである。この復号装置は、コア符号化データおよび拡張帯域符号化データを分離する分離部と、
コア符号化データを復号してコア復号スペクトルを生成するコア復号部と、コア復号スペクトルの振幅を前記コア復号スペクトルの振幅の最大値で正規化し正規化スペクトルを生成する振幅正規化部と、
雑音スペクトルを生成する雑音生成部と、
正規化スペクトルに前記雑音スペクトルを加算して雑音加算正規化スペクトルを生成する第１の加算部と、
雑音加算正規化スペクトルを用いて前記拡張帯域符号化データを復号し雑音加算拡張帯域スペクトルを生成する拡張帯域復号部と、
コア復号スペクトルと前記雑音加算拡張帯域スペクトルを結合するとともに時間―周波数変換を行い、出力信号を出力する時間―周波数変換部と、
を有する。

なお、これらの包括的または具体的な態様は、システム、方法、集積回路、コンピュータプログラム、または、記録媒体で実現されてもよく、システム、装置、方法、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。

本開示の一態様における復号装置によれば、ミュージカルノイズが抑えられた高品質な音声信号等を復号することができる。

本開示の実施形態１における復号装置の構成図本開示の実施形態２における復号装置の構成図本開示の実施形態２におけるその他の復号装置の構成図本開示の実施形態３における復号装置の構成図本開示の実施形態３における雑音生成部の動作を示す説明図本開示の実施形態４における復号装置の構成図本開示の実施形態４における振幅調整部の動作を示す説明図本開示の実施形態４におけるその他の復号装置の構成図本開示の実施形態４におけるその他の復号装置の振幅再調整部の動作を示す説明図本開示の実施形態５における符号化装置の構成図従来技術の符号化装置の構成図従来技術の復号装置の構成図従来技術の符号化装置の構成図本開示の実施形態６における復号装置の構成図本開示の実施形態６におけるコア復号スペクトル振幅調整部の動作を示す説明図本開示の実施形態６におけるその他１の復号装置の構成図本開示の実施形態６におけるその他２の復号装置の構成図本開示の実施形態７における復号装置の構成図本開示の実施形態７における復号装置の振幅再調整部の構成図

以下、本開示の実施形態の構成および動作について、図面を参照して説明する。なお、本開示の復号装置からの出力信号、および符号化装置への入力信号は、狭義の音声信号のみの場合の他、より帯域の広い音楽信号の場合、さらにはこれらが混在する場合も包含するものとする。

なお、本明細書において、「入力信号」とは、音声信号だけでなく、音声信号より帯域の広い音楽信号や、音声信号と音楽信号が混在した信号も包含する概念である。

「雑音スペクトル」とは、不規則に振幅が上下しているスペクトルである。規則的であっても、周期が長く実質不規則と言えるものは、不規則に含まれる。

雑音スペクトルを「生成する」とは、雑音スペクトルを発生させることの他、予め記憶装置等に保存しておいた雑音スペクトルを出力する場合も含む。

「結合」および「時間―周波数変換」は、時間的に何れが先行するかは任意である。もちろん同時であってもよい。結果的に「結合」と「周波数変換」が行われていれば足りる。

「ビット配分情報」とは、コア復号スペクトルの所定の帯域に配分されるビット数を表す情報である。

「スパース情報」とは、コア復号スペクトル中のゼロスペクトルまたは非ゼロスペクトルの分布状況を表す情報であり、例えば、コア復号スペクトルの所定の帯域において全スペクトルに対する非ゼロスペクトルまたはゼロスペクトルの割合を直接的または間接的に示す情報である。

「相関」とは、２つのスペクトルの近似性を表す。相関値という指標を用いて近似性を定量的に評価する場合も含む。

「端末装置」とは、ユーザ側が用いる装置をいい、例えば携帯電話、スマートフォン、カラオケ装置、パーソナルコンピュータ、テレビ、ＩＣレコーダなどの機器がこれに該当する。

「基地局装置」とは、端末装置に直接的ないし間接的に信号を送信、あるいは端末装置から直接ないし間接的に信号を受信する装置であり、例えばｅＮｏｄｅＢ、各種サーバ、アクセスポイントなどがこれに該当する。

「非ゼロ成分」とは、パルスが立っているとみなされる成分をいう。一定強度以下のパルスであって、パルスが立っているとみなされないようなものはゼロ成分であって、非ゼロ成分ではない。つまり、オリジナルの正規化スペクトルに含まれているパルスは、すべてが非ゼロ成分とは限らない。

（実施形態１）
図１は、実施形態１にかかる復号装置の構成を示すブロック図である。図１に示す復号装置１００は、分離部１０１、コア復号部１０２、振幅正規化部１０３、雑音生成部１０４、第１の加算部１０５、拡張帯域復号部１０６、時間―周波数変換部１０７により構成される。また、分離部１０１には、アンテナＡが接続されている。

アンテナＡでコア符号化データおよび拡張帯域符号化データが受信される。コア符号化データは、符号化装置において入力信号の所定の周波数以下の低域スペクトルを符号化して得られる符号化データである。また、拡張帯域符号化データは、入力信号の所定の周波数以上の高域スペクトルを符号化して得られる符号化データである。そして、拡張帯域符号化データは、入力信号の所定の周波数以上の高域スペクトルを、コア符号化データを復号して得られたコア符号化低域スペクトルに基づき符号化されている。具体例として、高域スペクトルとコア符号化低域スペクトルとの相関が最大となる特定の帯域を示す情報であるラグ情報、および特定の帯域における高域スペクトルとコア符号化低域スペクトルとの間のゲインが符号化される。かかる符号化については、実施形態５で具体例を説明する。なお、本開示の復号装置に入力される振幅帯域符号化データは、この具体例に限定されるものではない。

分離部１０１は、入力されたコア符号化データおよび拡張帯域符号化データを分離する。分離部１０１は、コア符号化データはコア復号部１０２に、拡張帯域符号化データは拡張帯域復号部１０６に出力する。

コア復号部１０２は、コア符号化データを復号して、コア復号スペクトルを生成する。コア復号部１０２は、コア復号スペクトルを振幅正規化部１０３および時間―周波数変換部１０７に出力する。

振幅正規化部１０３は、コア復号スペクトルを正規化して、正規化スペクトルを生成する。具体的には、振幅正規化部１０３は、コア復号スペクトルを複数のサブバンドに分割し、サブバンド毎のスペクトルを、各サブバンドに含まれるスペクトルの振幅（絶対値）の最大値でそれぞれ正規化する。こうすることで、正規化後の各サブバンドにおけるスペクトルの絶対値の最大値はサブバンド間で統一される。これにより、正規化スペクトルでは、極端に振幅が大きなスペクトルは存在しなくなる。

なお、コア復号スペクトルのサブバンドへの分割は任意である。また、サブバンドの分割方法も任意であり、例えばサブバンドの帯域は均一でもよいし、均一でなくてもよい。

そして、振幅正規化部１０３は、正規化スペクトルを第１の加算部１０５および拡張帯域復号部１０６に出力する。

雑音生成部１０４は、雑音スペクトルを生成する。雑音スペクトルは、不規則に振幅が上下しているスペクトルである。具体的には、周波数成分ごとに正負がランダムに割り当てられているスペクトルが例として挙げられる。正負がランダムであれば、振幅は一定値であってもよいし、範囲内でランダムに生成された振幅値であってもよい。

雑音スペクトルの生成方法は、乱数に基づいて都度生成してもよいし、予め生成した雑音スペクトルをメモリ等の記憶装置に保存しておき、これを呼び出して出力してもよい。複数の雑音スペクトルを呼び出して足し合わせたり、偶数成分と奇数成分とで組み合わせたり、足し合わせや組み合わせ時に極性をランダムに割り当てたりしても良い。また、コア復号スペクトルにおけるゼロスペクトル部分を検出して、これを埋めるように雑音スペクトルを生成してもよい。さらに、コア復号スペクトルの特性に応じて雑音スペクトルを生成してもよい。

なお、雑音スペクトルは一つに限らず、所定の条件に従い複数の雑音スペクトルの中から１つを選択して出力してもよい。複数の雑音スペクトルが生成される例は実施形態３で説明する。

そして、雑音生成部１０４は、雑音スペクトルを第１の加算部１０５に出力する。

第１の加算部１０５は、正規化スペクトルと雑音スペクトルを加算して雑音加算正規化スペクトルを生成する。これにより、少なくとも正規化スペクトルのゼロ成分の領域に雑音スペクトルが付加される。

そして、第１の加算部１０５は、雑音加算正規化スペクトルを拡張帯域復号部１０６に出力する。

本実施形態では、雑音スペクトルを振幅正規化部１０３で正規化される前の入力スペクトルであるコア復号スペクトルではなく、振幅正規化部１０３で正規化された後のスペクトルである正規化スペクトルに対して付加しているが、これは以下の理由による。

付加される雑音スペクトルの振幅はコア復号スペクトルの振幅より通常小さく、またコア復号スペクトルはスパースなため、正規化が１５サンプル程度の短いサブバンド毎に行われる場合はオールゼロのサブバンドが多い。この場合、雑音スペクトルを正規化前のコア復号スペクトルに対して付加する場合は、以下の課題がある。

まずオールゼロのサブバンドに対し低レベルの雑音スペクトルが付加される。この雑音スペクトルは、雑音スペクトル自体が最大値となりこれが１として正規化されるので、サブバンド内にピークが存在しない場合は雑音全体が増幅されてしまう。これに対して、サブバンド内にピークが存在する場合は、もともと存在するピークのスペクトルが最大値となるので、雑音成分は正規化によっても低レベルのまま、あるいはむしろ正規化により小さくなる。このため、元々オールゼロの周波数成分を有するサブバンドに振幅の大きな雑音スペクトルが局所的に付加されてしまうことになる。

これに対し、本実施形態では、雑音スペクトルを正規化後の正規化スペクトルに対して付加しているので、正規化により過度に雑音スペクトルが増幅してしまうことを防止することができるものである。

拡張帯域復号部１０６は、雑音加算正規化スペクトルおよび正規化スペクトルを用いて、拡張帯域符号化データの復号を行う。

具体的には、拡張帯域復号部１０６は、拡張帯域符号化データを復号し、ラグ情報およびゲインを得る。拡張帯域復号部１０６は、ラグ情報および正規化スペクトルに基づいて高域部である拡張帯域にコピーする雑音加算正規化スペクトルの帯域を特定し、雑音加算正規化スペクトルの所定帯域を拡張帯域にコピーする。次に、拡張帯域復号部１０６は、コピーされた雑音加算正規化スペクトルに対して復号されたゲインを乗じることで、雑音加算拡張帯域スペクトルを得る。

そして、拡張帯域復号部１０６は、雑音加算拡張帯域スペクトルを時間―周波数変換部１０７に出力する。

時間―周波数変換部１０７は、低域部を構成するコア復号スペクトルおよび高域部を構成する雑音加算拡張帯域スペクトルを結合して復号スペクトルを生成する。そして、時間−周波数変換部１０７は、復号スペクトルに対して直交変換を行うことにより復号スペクトルを時間領域の信号に変換して出力信号として出力する。

復号装置１００から出力された出力信号は、図示しないＤＡコンバータ、アンプおよびスピーカ等を通じて、音声信号や音楽信号、あるいはこれらの混在した信号として出力される。

以上、本実施形態によれば、正規化スペクトルに雑音スペクトルを付加しているので、正規化スペクトルがスパースな場合であってもミュージカルノイズの発生を抑えることができる。つまり、本実施形態によれば、スペクトルの最大値で正規化することで得られる均質化および平滑化の効果を維持しつつ、かかる正規化の方法が有する欠点を補完する効果を発揮するものである。

また、本実施形態によれば、振幅正規化部１０３で正規化された後の正規化スペクトルに対して雑音スペクトルを付加しているので、正規化により過度に雑音スペクトルが増幅されてしまうのを防止することができ、高音質の出力信号を得ることができるという効果を発揮するものである。

（実施形態２）
次に、本開示の実施形態２における復号装置２００の構成を、図２を用いて説明する。図１と同じ構成を有するブロックは、同じ図番を用いている。本実施形態の復号装置２００と実施形態１における復号装置１００との違いは、本実施形態の復号装置２００が、第２の加算部２０１を有していることである。それ以外の構成要素は原則実施形態１と同様なので、説明を省略する。

第２の加算部２０１は、コア復号部１０２から出力されたコア復号スペクトルに、雑音生成部１０４で生成された雑音スペクトルを加算して雑音加算コア復号スペクトルを生成する。そして、第２の加算部２０１は、雑音加算コア復号スペクトルを時間―周波数変換部１０７に出力する。

時間―周波数変換部１０７は、低域部を構成する雑音加算コア復号スペクトルおよび高域部を構成する雑音加算拡張帯域スペクトルを結合して復号スペクトルを生成する。そして、時間−周波数変換部１０７は、復号スペクトルに対して直交変換を行うことにより復号スペクトルを時間領域の信号に変換して出力信号として出力する。

以上、本実施形態によれば、高域部を構成する正規化スペクトルのみならず、低域部を構成するコア復号スペクトルに対しても雑音スペクトルを付加するので、聴覚上重要な低域スペクトルから発生するミュージカルノイズを抑えることができる。もちろん、コア復号スペクトルのみを用いて出力信号を生成する場合においても、ミュージカルノイズを抑えることができる。

（実施形態２の他の例）
次に、本開示の実施形態２の他の例である復号装置２１０の構成を、図３を用いて説明する。図１、２と同じ構成を有するブロックは、同じ図番を用いている。本実施形態の復号装置２１０と実施形態２における復号装置２００との違いは、本実施形態の復号装置２１０が、第１の加算部１０５に出力する雑音スペクトルを雑音生成部１０４から直接出力するのではなく、減算部２０２で雑音加算コア復号スペクトルからコア復号スペクトルを減算して生成し出力していることである。それ以外の構成要素は原則実施形態２と同様なので、説明を省略する。

雑音生成部１０４は、コア復号スペクトルのゼロスペクトル成分を検出して、これを埋めるよう雑音スペクトルを生成する。

第２の加算部２０１は、コア復号部１０２から出力されたコア復号スペクトルに、雑音生成部１０４で生成された雑音スペクトルを加算して雑音加算コア復号スペクトルを生成する。そして、第２の加算部２０１は、雑音加算コア復号スペクトルを時間―周波数変換部１０７および減算部２０２に出力する。

減算部２０２は、雑音加算コア復号スペクトルからコア復号スペクトルを減算し、この差分を雑音スペクトルとして第１の加算部１０５に出力する。

このような処理を行なう理由を以下に説明する。コア復号スペクトルに雑音スペクトルを加算する処理は、コア復号スペクトルに対して独立に生成した雑音スペクトルを加算することにより実現する場合の他、本実施形態のようにコア復号スペクトルのゼロスペクトル部分を検出して、これを埋めるように雑音スペクトル加算することによっても実現することもできる。この場合、雑音スペクトルはコア復号スペクトル上にオンされて直ちにコア復号スペクトルと一体になるので、第１の加算部１０５に出力する雑音スペクトルを別途何らかの方法で得る必要がある。

そこで、本実施形態では、減算部２０２を設け、雑音加算コア復号スペクトルからコア復号スペクトルを減算することにより、雑音スペクトルを取り出している。

この場合、雑音生成部１０４、第２の加算部２０１、および減算部２０２を合わせて、本開示の雑音生成部を構成する。

以上、本実施形態によれば、コア復号スペクトルを構成するスペクトルのうちゼロスペクトル以外のスペクトルに対しては、雑音スペクトルを付加しないようにすることができるので、より正確な復号を行うことができ、高音質の出力信号を得ることができる。

（実施形態３）
次に、本開示の実施形態３の復号装置３００の構成を、図４を用いて説明する。図１、２と同じ構成を有するブロックは、同じ図番を用いている。本実施形態の復号装置３００と実施形態２における復号装置２００との違いは、本実施形態の復号装置３００が雑音生成部１０４に代えて雑音生成部３０１を有することである。それ以外の構成要素は原則実施形態２と同様なので、説明を省略する。

雑音生成部３０１は、複数の異なる雑音スペクトルを生成することが可能であり、コア復号スペクトルの特性に応じて、出力する雑音スペクトルを異ならせることができる。

図５は、雑音生成部３０１の動作を示すフローチャートである。雑音生成部３０１は、コア復号部１０２から帯域ノルム情報（帯域平均振幅情報）、ビット配分情報、およびスパース情報を受け取る（Ｓ１）。ここでビット配分情報とは、コア復号スペクトルの所定の帯域に配分されるビット数を表す情報である。例えば、ＩＴＵ−Ｔ勧告Ｇ．７２２．１や同Ｇ．７１９では、スペクトルのノルム情報（帯域毎の振幅平均値あるいはこれに準じた情報（スケーリング係数、バンドエネルギーなど））が符号化され、このノルム情報に基づいてビット配分が決定される。また、スパース情報とは、コア復号スペクトルの所定の帯域において全スペクトルに対する非ゼロスペクトルの割合（または、その反対にゼロスペクトルの割合と定義しても良い）を示す情報である。

次に、雑音生成部３０１は、ビット配分情報を用いて第１の雑音振幅調整係数Ｃ１を算出する（Ｓ２）。Ｃ１は、例えば配分されたビット数ｂの関数Ｆ（ｂ）によって求められる。Ｆ（ｂ）は、ｂ＝０のとき固定値Ｎｂ、ｂ＞ｎｓのとき０、をそれぞれ出力し、０≦ｂ≦ｎｓではＮｂと０との間の数値を出力し、ｂがｎｓに近づくほど０に近い数値を出力する。例えば、以下の式（１）のような関数である。

ここで、Ｎｂは０〜１．０の定数で、ビットが配分されなかった時に用いられる雑音振幅調整係数の値である。ｎｓは定数で、スペクトルを高品質に量子化するために必要なビット数である。このビット数以上のビットがあれば量子化誤差が問題にならないレベルで量子化が可能であるため、雑音を付加する必要がない。Ｃ１はビットが配分された帯域毎に計算しても良いし、複数の帯域をまとめて、まとめた帯域全体に対して計算しても良い。

さらに、雑音生成部３０１は、スパース情報を用いて第２の雑音振幅調整係数Ｃ２を算出する（Ｓ３）。Ｃ２は、例えば対象とする帯域の全スペクトル数に占めるゼロスペクトルの割合Ｓｐとして以下の式（２）で定義される。

ここで、Ｎｚはゼロスペクトルの本数、Ｌｂは対象帯域の全スペクトル数、をそれぞれ示す。Ｓｐは、ゼロスペクトルの割合が増えるほど大きな値を取り、０〜１．０の変数となる。式（２）の代わりに、以下の式（３）を用いても良い。

最後に、雑音生成部３０１は、第１および第２の雑音振幅調整係数Ｃ１およびＣ２を用いて、以下の式（４）に基づき雑音振幅ＬＮを算出する（Ｓ４）。

ここで、｜Ｅ（ｉ）｜はi番目の帯域の帯域ノルム情報（帯域平均振幅情報）である。なお、ｂとSpは、i番目の帯域に対する配分ビット数とスパース情報を示す。

なお、本実施形態ではＣ１とＣ２の双方を用いたが、いずれか一方のみを用いてＬＮを求めてもよい。

以上、本実施形態では、雑音生成部３０１は、帯域ノルム情報、ビット配分情報、およびスパース情報に基づき、生成する雑音スペクトルの振幅を定める。これにより、量子化の粗さに基づいて適応的に雑音スペクトルを付加できるので、量子化が細かくできている帯域に雑音を付加しすぎて音質劣化を招くことを回避できるという効果を有する。

なお、本実施形態において、ビット配分情報およびスパース情報がコア復号部１０２から出力される例を説明したがこれに限られない。例えば、雑音生成部３０１にコア復号スペクトルが入力され、雑音生成部３０１がコア復号スペクトルを分析して、帯域ノルム情報、ビット配分情報、及びスパース情報を自ら得るようにしてもよい。

なお、本実施形態では、実施形態２の雑音生成部１０４を雑音生成部３０１に置き換えたものについて説明したが、実施形態１の雑音生成部１０４を雑音生成部３０１に置き換えてもよい。

なお、本実施形態では、ＬＮは帯域i毎に計算および適用されるが、複数の帯域をまとめて計算・適用してもよいし、i毎に計算したＬＮの平均値を求めて全帯域に一律のＬＮとして適用してもよい。

（実施形態４）
次に、本開示の実施形態４の復号装置４００の構成を、図６を用いて説明する。図１、２、４と同じ構成を有するブロックは、同じ図番を用いている。本実施形態の復号装置４００と実施形態２における復号装置２００との違いは、本実施形態の復号装置４００が雑音振幅正規化部４０１および振幅調整部４０２を有することである。それ以外の構成要素は原則実施形態２と同様なので、説明を省略する。

雑音振幅正規化部４０１は、雑音生成部１０４で生成された雑音スペクトルを正規化して正規化雑音スペクトルを生成する。雑音振幅正規化部４０１の動作は、振幅正規化部１０３の動作と同じであるが、異なる動作としてもよい。例えば、振幅正規化部１０３において、スパース化を行うために閾値未満のスペクトル成分をゼロにするという処理を行なう場合、雑音振幅正規化部４０１においてはこの閾値を低めの閾値として、雑音スペクトルに対してはスパース化の程度を軽減してもよい。

そして、雑音振幅正規化部４０１は、雑音正規化スペクトルを振幅調整部４０２に出力する。

振幅調整部４０２は、雑音振幅正規化部４０１が出力した正規化雑音スペクトルの振幅を調整する。そして、振幅が調整された正規化雑音スペクトルを第１の加算部１０５に出力する。振幅調整部４０２の動作の詳細は後述する。

第１の加算部１０５は、正規化スペクトルと振幅が調整された正規化雑音スペクトルを加算して雑音加算正規化スペクトルを生成する。

図７は、振幅調整部４０２の動作を示すフローチャートである。
振幅調整部４０２は、コア復号部１０２から出力されたコア復号スペクトルＸ（ｊ）、帯域ノルム情報｜Ｅ（ｉ）｜、ビット配分情報、およびスパース情報を受け取る（Ｓ１）。

そして、振幅調整部４０２は、コア復号スペクトルＸ（ｊ）および帯域ノルム情報｜Ｅ（ｉ）｜を分析し、コア復号スペクトルＸ（ｊ）から求められる平均振幅｜ＸＥ（i）｜と復号ノルム｜Ｅ（i）｜（帯域ノルム情報）との誤差を得る。そして、得られた誤差と復号ノルム（帯域ノルム情報）との比を用いて雑音振幅調整係数Ｃ０を以下の式（５）に従い算出する（Ｓ２）。なお、iは帯域番号を示し、ｊはi番目の帯域に含まれるスペクトルの番号を示す。

ここで、αは調整係数で、０〜１．０の値を取る。

そして、振幅調整部４０２は、ビット配分情報を用いて実施の形態３と同様に、（１）式に従い雑音振幅調整係数Ｃ１を算出する（Ｓ３）。

さらに、振幅調整部４０２は、正規化スペクトルのスパース情報を用いて実施の形態３と同様に、（２）式に従い雑音振幅調整係数Ｃ２を算出する（Ｓ４）。

最後に、振幅調整部４０２は、（Ｓ２）（Ｓ３）（Ｓ４）の結果に基づき、雑音振幅ＬＮを以下の式（６）で求め、正規化雑音スペクトルの振幅を調整する（Ｓ５）。

なお、本実施形態ではＣ０、Ｃ１、Ｃ２のすべてを用いたが、少なくとも一つを用いてＬＮを求めてもよい。

また、本実施形態ではＣ２を求めるために用いるスパース情報は正規化スペクトルのスパース情報を用いているが、コア復号スペクトルから求められるスパース情報を用いたり、あるいは双方を併用したりすることも可能である。

さらに、コア復号スペクトルとコア復号スペクトルに加算される雑音スペクトルの振幅比を雑音振幅調整係数Ｃ３とし、Ｃ３に基づいて以下の式（７）により雑音振幅ＬＮを求めてもよい。もちろん、Ｃ３単独で用いてもよいし、Ｃ０、Ｃ１、Ｃ２、Ｃ３の少なくとも一つを用いてＬＮを求めてもよい。

なお、雑音レベルをフレーム間で安定させるため、ＬＮはフレーム間で平滑化すると良い。平滑化には、ＬＮ（ｆ）＝μ×ＬＮ（ｆ−１）＋（１−μ）×ＬＮ（ｆ）のような式を使えばよい。ここで、ＬＮ（ｆ）はフレーム番号ｆにおけるＬＮを、μは平滑化係数である。μは０〜１の間の値をとる。

以上、本実施形態によれば、コア復号スペクトルは振幅正規化部１０３で正規化されるのに対し、雑音スペクトルは雑音振幅正規化部４０１で正規化されるので、コア復号スペクトルと雑音スペクトルが通るパスを合わせることで共通した性質を持つスペクトル（例えば、振幅がほぼ一律なスペクトルとなる。）となり、両信号を同じ土俵で扱える信号とすることができる。

また、本実施形態によれば、高域部に付加する雑音スペクトル（正規化雑音スペクトル）は雑音振幅正規化部４０１および振幅調整部４０２を介して出力されるのに対し、低域部に付加する雑音スペクトルは雑音振幅正規化部４０１および振幅調整部４０２を介さないので、高域部に付加する雑音スペクトル（正規化雑音スペクトル）と低域部に付加する雑音スペクトルの特性を異ならせることが可能となる。そして、これにより、低域部と高域部との相関を減らすことができるので、よりランダムな特性を持つ雑音スペクトルを生成することができる。

そして、本実施形態によれば、正規化雑音スペクトルは振幅調整部４０２で振幅を調整されるので、雑音を付加しすぎて音質劣化を招くことを回避することができるという効果を有する。

なお、本実施形態において、ビット配分情報およびスパース情報がコア復号部１０２から出力される例を説明したがこれに限られない。例えば、振幅調整部４０２にコア復号スペクトルが入力され、振幅調整部４０２がコア復号スペクトルを分析して、帯域ノルム情報、ビット配分情報及びスパース情報を自ら得るようにしてもよい。

なお、本実施形態では、雑音振幅正規化部４０１および振幅調整部４０２を実施形態２の構成に付加したものについて説明したが、これらを実施形態１、または実施形態３に付加してもよい。

（実施形態４の他の例）
次に、本開示の実施形態４のその他の復号装置４１０の構成を、図８を用いて説明する。図６と同じ構成を有するブロックは、同じ図番を用いている。本実施形態の復号装置４１０と実施形態４における復号装置４００との違いは、本実施形態の復号装置４１０が振幅再調整部４０３を有することである。それ以外の構成要素は原則実施形態４と同様なので、説明を省略する。

振幅再調整部４０３は、雑音を付加したコア復号スペクトルを用いて拡張帯域を生成したのちに、付加した雑音成分の振幅を再調整する。この再調整は図９のように行うことができる。

図９において、（ａ）は振幅正規化部１０３から出力された正規化スペクトルを表し、（ｂ）は第１の加算部１０５から出力された雑音加算正規化スペクトルである。そして（ｃ）のように、雑音加算正規化スペクトルをラグ情報に基づいて拡張帯域にシフトし、ゲインを乗じて拡張帯域のスペクトルが生成される。（ｂ）では、拡張帯域の一番下の帯域であるi番目の帯域のみが示されている。図中E(i)はi番目の帯域の帯域ノルム情報（帯域エネルギー）を示し、破線（ｄ）で囲まれた部分は、ラグ情報で指定される（拡張帯域復号部１０６で特定される）雑音加算正規化スペクトルであり、対応する拡張帯域（ここではi番目の帯域）に適切なゲインGを乗じてコピーされる。また、破線（ｅ）で囲まれた部分は拡張帯域である。付加された雑音成分の振幅再調整は次のようにして行う。

まず、閾値Thを決める。Thは、例えば正規化スペクトルの最大振幅の半分の値にする。正規化スペクトルの振幅がある振幅以上に限定されている場合は、正規化スペクトルの最低振幅値をThとしても良い。また、値を有する正規化スペクトルの平均振幅値としても良い。さらにまた、付加した雑音スペクトルの平均振幅値としても良い。なおまた、これらの値に定数を乗じて調整した値としても良い。

（ｂ）に正規化スペクトルの最低振幅をThとした場合のThとその振幅を示す二点鎖線で表示しているが、このThより小さな振幅を有する成分が雑音成分として定義される。

次に、拡張帯域符号化データを復号して得られるゲインGをThに乗じてG・Thを求める。

次に、帯域拡張によって生成されたi番目の帯域のスペクトルについて、閾値G・Thより小さい振幅のスペクトルを選んでこれを雑音成分と定義し、i番目の帯域の雑音成分エネルギーを算出する（これをEN(i)とする）。

次に、以下の式（８）により、EN(i)を時間軸方向に平滑化したSEN(i)を求める。

ここで、σは平滑化係数で１に近い０〜１の定数、pSEN(i)は１フレーム前のSEN(i)をそれぞれ表す。

そして、i番目の帯域の雑音成分のエネルギーがSEN(i)になるように雑音成分に対して√SEN(i)/√EN(i)を乗じる。

同様に、他の拡張帯域の各帯域の雑音成分に対して振幅の再調整を行う。またさらに、拡張帯域の各帯域のSEN(i)にばらつきがでる場合は、そのばらつきをなくすための振幅再調整をさらに行っても良い。具体的には、拡張帯域の全帯域におけるEN(i)の平均値AENを求め、全帯域のEN(i)がAENに等しくなるように、各帯域の雑音成分にAEN/EN(i)を乗じてから、前述のフレーム間の平滑化処理を適用する。

なお、各帯域の雑音成分のエネルギーを揃える処理とフレーム間の平滑化処理との順番は任意であり、またどちらか一方の処理のみ行うようにしても良い。

（実施形態５）
実施形態１から４においては、復号装置の実施形態を説明した。本開示は、符号化装置にも適用が可能である。以下、本開示の実施形態５の符号化装置５００の構成を、図１０を用いて説明する。

図１０は、実施形態５にかかる符号化装置の構成を示すブロック図である。図１０に示す符号化装置５００は、時間−周波数変換部５０１、コア符号化部５０２、振幅正規化部５０３、雑音生成部５０４、雑音振幅正規化部５０５、振幅調整部５０６、第１の加算部５０７、帯域探索部５０８、ゲイン算出部５０９、拡張帯域符号化部５１０、多重化部５１１、ラグ探索位置候補格納部５１２により構成される。また、多重化部５１１には、アンテナＡが接続されている。

時間周波数変換部５０１は、時間領域の音声信号等である入力信号を周波数領域の信号に変換し、得られる入力信号スペクトルをコア符号化部５０２、帯域探索部５０８、およびゲイン算出部５０９に出力する。

コア符号化部５０２は、入力信号スペクトルのうち低域スペクトルを符号化して、コア符号化データを生成する。符号化の例として、ＣＥＬＰ符号化や変換符号化が挙げられる。コア符号化部５０２は、コア符号化データを多重化部５１１に出力する。また、コア符号化部５０２は、コア符号化データを復号して得られるコア復号スペクトルを振幅正規化部５０３に出力する。

振幅正規化部５０３、雑音生成部５０４、雑音振幅正規化部５０５、および振幅調整部５０６の動作は、実施形態３および４に記載したものと同じなので、説明を省略する。

ラグ探索位置候補格納部５１２は、正規化スペクトルの振幅がゼロでない成分の位置（周波数）を帯域探索の対象となる候補位置として格納する。そして、ラグ探索位置候補格納部５１２は、格納した候補位置情報を帯域探索部５０８に出力する。

第１の加算部５０７は、正規化スペクトルと振幅を調整された正規化雑音スペクトルを加算して雑音加算正規化スペクトルを生成する。

そして、第１の加算部５０７は、雑音加算正規化スペクトルを帯域探索部５０８およびゲイン算出部５０９に出力する。

帯域探索部５０８、ゲイン算出部５０９、および拡張帯域符号化部５１０は、入力信号スペクトルのうち高域スペクトルを符号化する処理を行なう。

帯域探索部５０８は、入力信号スペクトルのうち高域スペクトルと雑音加算正規化スペクトルとの間の相関を最大とする特定の帯域を探索する。探索は、ラグ探索位置候補格納部５１２から入力した候補位置の中から前記相関を最大とする候補を選ぶことによって行われる。そして、帯域探索部５０８は、探索した特定の帯域を示す情報であるラグ情報をゲイン算出部５０９および拡張帯域符号化部５１０に出力する。

ゲイン算出部５０９は、特定の帯域における高域スペクトルと雑音加算正規化スペクトルとの間のゲインを算出し、拡張帯域符号化部５１０に出力する。

拡張帯域符号化部５１０は、ラグ情報およびゲインを符号化して拡張帯域符号化データを生成する。そして、拡張帯域符号化部５１０は、拡張帯域符号化データを多重化部５１１に出力する。

多重化部５１１は、コア符号化データと拡張帯域符号化データとを多重化して、アンテナＡを通じて送信する。

以上、本実施形態によれば、雑音成分が付加されたスペクトルを用いて高域スペクトルの探索（ラグ探索、類似度探索）が行われるので、スペクトル形状のマッチング精度を上げることが可能となる。

なお、本実施形態を示す図として挙げた図１０は、復号装置の実施形態である実施形態３および実施形態４を合わせた構成としているが、実施形態１、２、３、または４に対応する構成としてもよい。さらに、後述の実施形態６に対応する構成としてもよい。

（実施形態６）
次に、本開示の実施形態６の復号装置６００の構成を、図１４を用いて説明する。実施形態４を表す図６の復号装置４００と同じ構成を有するブロックは、同じ図番号を用いている。本実施形態の復号装置６００と復号装置４００との違いは、本実施形態の復号装置６００が新たに閾値計算部６０１、コア復号スペクトル振幅調整部６０２を有し、さらに振幅調整部４０２に代えて雑音スペクトル振幅調整部６０３を有することである。

また、本実施形態の復号装置６００では、雑音生成部１０４に代えて雑音生成・加算部６０４および減算部２０２を有するが、これは実施形態２の他の例で説明した、コア復号スペクトルのゼロスペクトル成分を埋めるよう雑音スペクトルを生成、加算する構成である。それ以外の構成要素は原則実施形態４と同様なので、説明を省略する。

閾値計算部６０１は、正規化スペクトルのスパース情報を用いて、雑音成分と非雑音成分とを区別するスペクトル強度の閾値Ｔｈを計算する。具体的な計算方法は後述する。なお、正規化スペクトルのスパース情報に代えて、コア復号スペクトルのスパース情報を用いてもよい。

そして、閾値計算部６０１は、閾値をコア復号スペクトル振幅調整部６０２および雑音スペクトル振幅調整部６０３に出力する。

コア復号スペクトル振幅調整部６０２は、正規化スペクトルの非ゼロ成分が前記閾値よりも大きくなるように前記正規化スペクトルの振幅を調整する。具体的には、図１５（ａ）のように、正規化スペクトルの非ゼロ成分の最小値が閾値より大きくなるよう、それぞれのスペクトルに一定のオフセットを加えたり、あるいは一定の割合で増幅することにより、正規化スペクトル全体をかさ上げする。

増幅方法の一例として、増幅後の振幅をＹ、増幅前をＸ、閾値をＴｈ、として、Ｙ＝ａＸ＋Ｔｈ、（なお、ａ＝(Ｘmax−Ｔｈ)/Ｘmax，ＸmaxはＸが取り得る最大値）で表されるようなスケーリングが考えられる。

あるいは、図１５（ｂ）のように、一定強度（「ゼロ化閾値」とする。）以上のスペクトルのうち最小ものものが閾値より大きくなるようにしてもよい。例えば、正規化スペクトルの範囲が０から１０に正規化されている場合、ゼロ化閾値を０．９５とし、０．９５以上のスペクトルのうち最小のものを、閾値Ｔｈより大きくなるようにしてもよい。この場合、０．９５以下のスペクトルは、ゼロ化しておく。つまり、この場合は、ゼロ化閾値以上のスペクトルが非ゼロ成分、ゼロ化閾値以下のスペクトルがゼロ成分となる。

なお、上述のようにゼロ化閾値は固定値を用いてもよいが、ゼロ化閾値を他の変数に応じた変動値としてもよい。例えば、ゼロ化閾値＝閾値Ｔｈ×α（αは定数、例えばα＝１／４）としてもよい。また、これとともに、ゼロ化閾値に上限値や下限値を併用してもよい。例えば、ゼロ化閾値が０．９以下になる場合は，０．９をゼロ化閾値するようにしてもよい。

そして、振幅が調整された正規化スペクトルを第１の加算部１０５に出力する。

雑音スペクトル振幅調整部６０３は、正規化雑音スペクトルの最大値が閾値以下になるように正規化雑音スペクトルの振幅を調整する。具体的には、正規化雑音スペクトルの最大値が閾値より小さい場合、それぞれのスペクトルに一定のオフセットを加えたり、あるいは一定の割合で増幅したりして、正規化雑音スペクトルの最大値を閾値、あるいはそれ以下に設定する。正規化雑音スペクトルの最大値が閾値より大きい場合は、負のオフセットを加える、つまり減算（クリッピング）したり、あるいは負の割合で増幅、つまり減衰したりする。この調整は、正規化雑音スペクトルを閾値で正規化することと同義である。

そして、振幅が調整された正規化雑音スペクトルを第１の加算部１０５に出力する。

第１の加算部１０５は、振幅が調整された正規化スペクトルと、振幅が調整された正規化雑音スペクトルを加算し、雑音加算正規化スペクトルとして拡張帯域復号部１０６に出力する。

以下、閾値の求め方について説明する。

閾値は、雑音成分と非雑音成分とを区分する意義を有する。そして、閾値Ｔｈは、式（２）のスパース度Ｓｐを用い、以下の式（９）で求められる。ａは定数で、本実施例では例えば４に設定する。

なお、Ｎｚを用いた式（９）の代わりに、以下の式（１０）を用いて閾値Ｔｈを求めることもできる。

ここで、Ｎｐはゼロでないスペクトルの本数を示す。

なお、これらとともに、閾値Ｔｈに上限や下限を併用してもよい。

つまり、式（９）によれば、スパース度Ｓｐが大きい程、すなわちゼロ成分が多く離散的なパルス列となる程、雑音性が低くなり、閾値Ｔｈは低くなる。逆にスパース度Ｓｐが小さい程、すなわちゼロ成分が少なく密なパルス列になる程、雑音性は高くなり、閾値Ｔｈは高くなる。

そして、スパース度Ｓｐが大きくなる（閾値Ｔｈが低くなる）と、雑音スペクトル振幅調整部６０３で調整される雑音スペクトルの振幅は小さく抑えられ、振幅の小さい雑音スペクトルが加算部１０５で加算される。つまり、正規化スペクトルの信号は雑音性が低いので、この特性を維持するため、加算される雑音スペクトルの振幅は小さくなる。

逆に、スパース度Ｓｐが小さくなる（閾値Ｔｈが高くなる）と、雑音スペクトル振幅調整部６０３で調整される雑音スペクトルの振幅は大きくなり、振幅の大きい雑音スペクトルが加算部１０５で加算される。つまり、正規化スペクトルの信号は雑音性が高いので、この特性を維持するため、加算される雑音スペクトルの振幅は大きくなる。

なお、本実施形態では閾値は１つとし、コア復号スペクトル振幅調整部６０２と雑音スペクトル振幅調整部６０３とで共通に用いた。しかし、コア復号スペクトル振幅調整部６０２と雑音スペクトル振幅調整部６０３とで、別の閾値を用いてもよい。これは、閾値は雑音成分と非雑音成分とを区分する意義を有するものではあるが、正規化スペクトルに元々含まれる低振幅のスペクトルが有する雑音性と、生成された雑音スペクトルが有する雑音性とは、その特性が異なることもあり、この場合同一の基準を用いずにそれぞれの基準を独立して定めた方がより音質を高めることができるからである。例えば、コア復号スペクトル振幅調整部６０２で用いる閾値の方を、雑音スペクトル振幅調整部６０３で用いる閾値よりも高くすることにより、オリジナルの信号である正規化スペクトルに含まれる成分をより強調することができる。

なお、式（９）では、閾値を求めるのにスパース度のみを用いたが、実施形態３や実施形態４のように、帯域ノルム情報やビット配分情報を組み合わせる、あるいは単独で用いるようにしてもよい。例えば、以下の場合は、ビット配分情報を併用することが考えられる。

ビット配分が増えるとパルス数を増やすことができるので、より低振幅のパルスも符号化されるようになり、量子化パルス数が増える。この結果、スパース度が下がることになる。つまり、スパース度は符号化対象の信号の特徴だけでなく、配分されるビット数にも依存する。したがって、配分されるビット数が大きく変わる場合は、ビット配分の変化による影響を補正すべく、スパース度と閾値の関係を調整するようにしてもよい。

また、本実施形態では、雑音生成・加算部は、実施形態２の他の例の構成を用いたが、これに代えて、実施形態１の雑音生成部１０４、実施形態２の雑音生成部１０４および第２の加算部２０１、実施形態３の雑音生成部３０１および第２の加算部２０１を用いるようにしてもよい。

以上の復号装置６００によれば、正規化スペクトルの振幅と正規化雑音スペクトルの振幅に対し、正規化スペクトルと正規化雑音スペクトルの振幅の両方を調整できるとともに、これらを連動して調整することができるので、正規化スペクトルの特性に応じた最適な雑音を付加することができる結果、出力信号の音質の向上を図ることができる。

より具体的には、正規化スペクトルの雑音性が強調され、高周波数帯域のスペクトルを表現するのに適したスペクトルを作り出すことができるので、帯域拡張モデルに基づく復号装置の出力信号の音質を向上することができる。

（実施形態６の他の例１）
次に、本開示の実施形態６の他の例１の復号装置６１０の構成を、図１６を用いて説明する。図１４と同じ構成を有するブロックは、同じ図番を用いている。本実施形態の復号装置６１０と復号装置６００との違いは、主に閾値計算部６０１の動作にある。

本実施形態の復号装置６１０の閾値計算部６０１は、入力されるスパース情報をコア復号スペクトルのスパース情報とし、このスパース情報を基に閾値計算部６０１で式（９）や式（１０）を用いて閾値Ｔｈを求めるとともに、この閾値Ｔｈを用いてゼロ化閾値を、例えば、ゼロ化閾値＝閾値Ｔｈ×αのような演算を用いて求める。

そして、閾値計算部６０１は、閾値Ｔｈをコア復号スペクトル振幅調整部６０２および雑音スペクトル振幅調整部６０３に出力するとともに、ゼロ化閾値を振幅正規化部１０３に出力する。

振幅正規化部１０３は、コア復号スペクトルを正規化するとともに、ゼロ化閾値より小さい、あるいはゼロ化閾値以下のスペクトルをゼロにして（ゼロ化して）して出力する。

なお、本実施形態では、ゼロ化を行うブロックを振幅正規化部１０３としたが、振幅正規化部１０３の前後のいずれかにゼロ化を行う別のブロックを設けてもよいし、コア復号スペクトル振幅調整部６０２で行ってもよい。その場合は、ゼロ化閾値の出力先は、当該ゼロ化を行うブロックとすればよい。

（実施形態６の他の例２）
次に、本開示の実施形態６の他の例２の復号装置６２０の構成を、図１７を用いて説明する。図１６と同じ構成を有するブロックは、同じ図番を用いている。本実施形態の復号装置６２０と復号装置６００や復号装置６１０との違いは、雑音生成・加算部６０５を有することである。

復号装置６００や復号装置６１０では、雑音生成・加算部６０４はコア復号スペクトルのゼロスペクトル成分を埋めるよう雑音スペクトルを生成、加算している。つまり、コア復号スペクトルのゼロスペクトル成分に相当する位置のみに雑音を加算する構成であるから、後発的に振幅正規化部１０３等でゼロ化したスペクトル部分には、最終的に雑音が加算されることはない。

そこで、本実施形態では、ゼロ化したスペクトル部分にも雑音を加算するため、雑音生成・加算部６０５を設けている。雑音生成・加算部６０５は、第１の加算部１０５から出力された雑音加算正規化スペクトルのゼロスペクトルを検出し、それを埋めるようにランダムに雑音を生成し加算する。なお、これまでの説明の通り、加算する振幅の最大値を制御するため、閾値計算部６０１で生成した閾値を雑音生成・加算部に出力し、かかる閾値を用いて振幅の最大値を決定してもよい。また、閾値とは別に、上限値を併用してもよい。

なお、雑音加算正規化スペクトルのゼロスペクトルを検出する代わりに、ゼロ化を行うブロック、例えば振幅正規化部１０３からゼロ化したスペクトルの情報を受け取り、ゼロ化したスペクトルの位置に雑音を加算するようにしてもよい。

また、本実施形態では、雑音生成・加算部６０５を第１の加算部１０５の後に設けたが、これに代えて、雑音スペクトル振幅調整部６０３と第１の加算部１０５の間、あるいは雑音振幅正規化部４０１と雑音スペクトル振幅調整部６０３の間に設けてもよい。この場合、ゼロ化を行うブロックからゼロ化したスペクトルの情報を受け取り、ゼロ化したスペクトルの位置に雑音を加算する。

（実施形態７）
次に、本開示の実施形態７の復号装置７００の構成を、図１８を用いて説明する。本実施形態の復号装置７００は、実施形態６の他の例２における復号装置６２０に実施形態４の他の例で説明した振幅再調整部４０３を付加したものである。そして、これに伴い、閾値計算部６０１で計算された閾値Ｔｈは、振幅再調整部４０３にも出力される。それ以外の構成は実施形態６の他の例２と同様なので、説明を省略する。

拡張帯域復号部１０６で生成した雑音加算拡張帯域スペクトルは、振幅再調整部４０３に出力される。振幅再調整部４０３の動作は、基本的には実施形態４の他の例と同じであるので、以下、実施形態６の他の例２との関係を中心に説明する。また、振幅再調整部４０３の機能毎にブロックを分けて説明する。振幅再調整部４０３は、図１９のように、雑音エネルギー計算部７０１、フレーム間平滑化部７０２、および振幅調整部７０３からなる。

雑音エネルギー計算部７０１は、付加された雑音スペクトルのエネルギーをサブバンド毎に計算する。付加された雑音スペクトルは、実施形態６の閾値Ｔｈを用いることで検出、分離することが可能である。拡張帯域復号部１０６では、拡張帯域符号化データから復号されるラグ情報によって特定される雑音加算正規化スペクトルに対して、同じく拡張帯域符号化データから復号されるゲインを乗じることにより、雑音加算拡張帯域スペクトルを生成する。よって、実施形態６の閾値Ｔｈに前記ゲインを乗じたものが，雑音加算拡張帯域スペクトルにおける雑音成分判定の閾値となる。つまり、閾値計算部６０１で求めた閾値に前記ゲインを乗じて雑音成分判定閾値を求め、雑音成分判定閾値未満(以下)の成分を当該サブバンドにおける雑音成分と判定する。前記ゲインはサブバンド毎に符号化されているので、雑音成分判定閾値もサブバンド毎に算出される。

そして、サブバンド毎の雑音スペクトルのエネルギーをフレーム間平滑化部７０２に出力する。

フレーム間平滑部７０２は、受け取ったサブバンド毎の雑音スペクトルのエネルギーを用いて、サブバンド間で雑音スペクトルのエネルギーの変化がスムーズになるよう、平滑化処理を行なう。平滑化処理は、公知のフレーム間平滑化処理を用いることが可能である。

例えば、フレーム間平滑化処理は、以下の式（１１）により行うことができる。

ここで、ＥＳｃは平滑化処理後の雑音スペクトルのエネルギー、Ｅｃは平滑化処理前の雑音スペクトルのエネルギー、ＥＳｃｐは前フレームにおける平滑化処理後の雑音スペクトルのエネルギー、σは平滑化係数（０＜σ＜１）、をそれぞれ示す。なお、σの値を０に近づけるほど強い平滑化となる。０．１５程度とするのが好適である。

なお、現フレームの信号が前フレームの信号に比べて急に減衰している場合は、強い平滑化を行うと本来信号レベルが下がっているはずのところに高いレベルのノイズが維持されてしまうので問題となる。このような場合に対応するため、別途符号化されているサブバンドエネルギー情報が、前フレームにおける平滑化処理後の雑音スペクトルのサブバンドエネルギー（すなわちＥＳｃｐ）に比べて小さくなっている場合は、σの値を１に近づけて平滑化処理を弱くする。例えば，ＥＳｃｐが、現フレームの復号サブバンドエネルギーの８０％未満である場合はσを０．１５に設定して強い平滑化処理を行う一方、ＥＳｃｐが現フレームの復号サブバンドエネルギーの８０％以上である（つまり，現フレームの復号サブバンドエネルギーが前フレームの平滑化雑音スペクトルサブバンドエネルギーに比べて十分大きくない）場合は、σを０．８に設定して弱い平滑化処理を行うようにする。

振幅調整部７０３は、入力される雑音加算拡張帯域スペクトルに対し、フレーム間平滑化部７０２で計算されたＥＳｃを用いて雑音部分の振幅を再調整する。再調整の方法は、実施形態４の他の例で説明したものと同じである。つまり、実施形態４の他の例で説明したように，（√ＥＳｃ/√Ｅｃ）をスケーリング係数として乗じる。

なお、スケーリングによるエネルギーの変化が大きくなると、雑音成分以外を含めた復号信号全体のエネルギーが本来の大きさから大きくずれてしまう可能性がある。この場合、スケーリング係数を√(√ＥＳｃ/√Ｅｃ）のようにすると、スケーリング係数の変動を非線形に抑えることができるので、スケーリングによる復号信号全体のエネルギーへの悪影響を緩和することができる。

以上、本実施形態によれば、帯域拡張処理によって合成された高域信号の雑音成分を時間方向に平滑化し、振幅変動に対しても変動を抑える処理が行われるため、復号信号の雑音成分のレベルが安定し、聴感上の品質を改善することが可能となる。また，本実施形態の雑音加算正規化スペクトル生成方法と組み合わせて用いれば、雑音成分の判定情報を別途符号化・伝送する必要がなく、効率的な雑音成分の付加と安定化が可能である。

（総括）
以上、実施形態１から７で本開示の復号装置および符号化装置を説明した。本開示の復号装置および符号化装置は、システムボードや半導体素子に代表されるような半完成品や部品レベルの形態でもよいし、端末装置や基地局装置のような完成品レベルの形態も含む概念である。本開示の復号装置および符号化装置が半完成品や部品レベルの形態の場合は、アンテナ、ＤＡ／ＡＤコンバータ、増幅器、スピーカ、およびマイク等と組み合わせることにより完成品レベルの形態となる。

なお、図１から図８、図１０、図１４、および図１６から図１９のブロック図は、専用に設計されたハードウェアの構成および動作（方法）を表すとともに、汎用のハードウェアに本開示の動作（方法）を実行するプログラムをインストールしてプロセッサで実行することにより実現する場合も含む。汎用のハードウェアたる電子計算機として、例えばパーソナルコンピュータ、スマートフォンなどの各種携帯情報端末、および携帯電話などが挙げられる。

また、専用に設計されたハードウェアは、携帯電話や固定電話などの完成品レベル（コンシューマエレクトロニクス）に限らず、システムボードや半導体素子など、半完成品や部品レベルをも含むものである。

本開示にかかる復号装置および符号化装置は、音声信号や音楽信号の記録、伝送、再生に関係する機器に応用が可能である。

１００，２００，２１０，３００，４００，４１０，６００，６１０，６２０，７００復号装置
１０１分離部
１０２コア復号部
１０３，５０３振幅正規化部
１０４，３０１，５０４雑音生成部
１０５，５０７第１の加算部
１０６拡張帯域復号部
１０７，５０１時間−周波数変換部
２０１第２の加算部
２０２減算部
４０１，５０５雑音振幅正規化部
４０２，５０６，７０３振幅調整部
４０３振幅再調整部
５００符号化装置
６０１閾値計算部
６０２コア復号スペクトル振幅調整部
６０３雑音スペクトル振幅調整部
６０４雑音生成・加算部
６０５雑音生成・加算部

Claims

所定の周波数以下の低域スペクトルを符号化したコア符号化データと、所定の周波数以上の高域スペクトルを前記コア符号化データに基づき符号化した拡張帯域符号化データとを復号する復号装置であって、
前記コア符号化データおよび前記拡張帯域符号化データを分離する分離部と、
前記コア符号化データを復号してコア復号スペクトルを生成するコア復号部と、
前記コア復号スペクトルの振幅を前記コア復号スペクトルの振幅の最大値で正規化し、正規化スペクトルを生成する振幅正規化部と、
雑音スペクトルを生成する雑音生成部と、
前記正規化スペクトルに前記雑音スペクトルを加算して雑音加算正規化スペクトルを生成する第１の加算部と、
前記雑音加算正規化スペクトルを用いて前記拡張帯域符号化データを復号し、雑音加算拡張帯域スペクトルを生成する拡張帯域復号部と、
前記コア復号スペクトルと前記雑音加算拡張帯域スペクトルを結合するとともに時間−周波数変換を行い、出力信号を出力する時間−周波数変換部と、
を有する復号装置。
前記コア復号スペクトルに前記雑音スペクトルを加算して雑音加算コア復号スペクトルを生成する第２の加算部を有し、
前記時間−周波数変換部は、前記雑音加算コア復号スペクトルと前記雑音加算拡張帯域スペクトルを結合するとともに時間−周波数変換を行い、出力信号を出力する、
請求項１記載の復号装置。
前記雑音生成部は、前記コア復号スペクトルのビット配分情報、および前記コア復号スペクトルのスパース情報の少なくとも一つに応じて前記雑音スペクトルの振幅を決定する、
請求項１または請求項２に記載の復号装置。
前記雑音スペクトルを正規化して正規化雑音スペクトルを出力する雑音振幅正規化部と、
前記コア復号スペクトルのビット配分情報、前記コア復号スペクトルのスパース情報、および前記正規化スペクトルのスパース情報の少なくとも一つに応じて前記正規化雑音スペクトルの振幅を調整する振幅調整部と、を有し、
前記第１の加算部は、前記正規化スペクトルに振幅を調整された前記正規化雑音スペクトルを加算して雑音加算正規化スペクトルを生成する、
請求項１から請求項３のいずれかに記載の復号装置。
入力信号の所定の周波数以下の低域スペクトルを符号化してコア符号化データを生成するコア符号化部と、
前記コア符号化データを復号して得られるコア復号スペクトルの振幅を前記コア復号スペクトルの振幅の最大値で正規化し正規化スペクトルを生成する振幅正規化部と、
雑音スペクトルを生成する雑音生成部と、
前記正規化スペクトルに前記雑音スペクトルを加算して雑音加算正規化スペクトルを生成する第１の加算部と、
前記雑音加算正規化スペクトルと前記入力信号の所定の周波数以上の高域スペクトルとの間で相関が最大になる特定の帯域を探索する帯域探索手段と、
前記特定の帯域において、前記雑音加算正規化スペクトルと前記高域スペクトルとの間のゲインを算出するゲイン算出手段と、
前記特定の帯域および前記ゲインを符号化して拡張帯域符号化データを生成する拡張帯域符号化部と、
前記コア符号化データおよび前記拡張帯域符号化データを多重化して出力する多重化部と、
を有する符号化装置。
前記コア符号化データおよび前記拡張帯域符号化データを受信して前記分離部に出力するアンテナと、
請求項１または請求項２のいずれかに記載の復号装置と、
を有する端末装置。
前記コア符号化データおよび前記拡張帯域符号化データを受信して前記分離部に出力するアンテナと、
請求項１または請求項２のいずれかに記載の復号装置と、
を有する基地局装置。
請求項５記載の符号化装置と、
前記多重化部から入力された前記コア符号化データおよび前記拡張帯域符号化データを送信するアンテナと、
を有する端末装置。
請求項５記載の符号化装置と、
前記多重化部から入力された前記コア符号化データおよび前記拡張帯域符号化データを送信するするアンテナと、
を有する基地局装置。
所定の周波数以下の低域スペクトルを符号化したコア符号化データと、所定の周波数以上の高域スペクトルを前記コア符号化データに基づき符号化した拡張帯域符号化データとをプロセッサで復号する復号方法であって、
前記コア符号化データおよび前記拡張帯域符号化データを分離し、
前記コア符号化データを復号してコア復号スペクトルを生成し、
前記コア復号スペクトルの振幅を前記コア復号スペクトルの振幅の最大値で正規化し正規化スペクトルを生成し、
雑音スペクトルを生成し、
前記正規化スペクトルに前記雑音スペクトルを加算して雑音加算正規化スペクトルを生成し、
前記雑音加算正規化スペクトルを用いて前記拡張帯域符号化データを復号し、雑音加算拡張帯域スペクトルを生成し、
前記コア復号スペクトルと前記雑音加算拡張帯域スペクトルを結合するとともに時間―周波数変換を行い、出力信号を出力する、
復号方法。
入力信号をプロセッサで符号化する符号化方法であって、
前記入力信号の所定の周波数以下の低域スペクトルを符号化してコア符号化データを生成し、
前記コア符号化データを復号して得られるコア復号スペクトルの振幅を前記コア復号スペクトルの振幅の最大値で正規化し正規化スペクトルを生成し、
雑音スペクトルを生成し、
前記正規化スペクトルに前記雑音スペクトルを加算して雑音加算正規化スペクトルを生成し、
前記雑音加算正規化スペクトルと前記入力信号の所定の周波数以上の高域スペクトルとの間で相関が最大になる特定の帯域を探索し、
前記特定の帯域において、前記雑音加算正規化スペクトルと前記高域スペクトルとの間のゲインを算出し、
前記特定の帯域および前記ゲインを符号化して拡張帯域符号化データを生成し、
前記コア符号化データおよび前記拡張帯域符号化データを多重化して出力する、
符号化方法。
請求項１０の復号方法をプロセッサで実行するプログラム。
請求項１１の符号化方法をプロセッサで実行するプログラム。
前記雑音スペクトルを正規化して正規化雑音スペクトルを出力する雑音振幅正規化部と、
前記正規化スペクトル又は前記コア復号スペクトルのスパース情報を用いて、雑音成分と非雑音成分とを区別するスペクトル強度の閾値を計算する閾値計算部と
前記正規化雑音スペクトルの最大値が前記閾値以下になるように前記正規化雑音スペクトルの振幅を調整する雑音スペクトル振幅調整部と、
前記正規化スペクトルの非ゼロ成分が前記閾値よりも大きくなるように前記正規化スペクトルの振幅を調整するコア復号スペクトル振幅調整部と、を有する、
請求項１から請求項３のいずれかに記載の復号装置。
前記閾値計算部は、さらに前記閾値を用いて前記正規化スペクトルのゼロ成分と非ゼロ成分を区別するゼロ化閾値を計算し、
前記振幅正規化部は、前記ゼロ化閾値に基づき前記正規化スペクトルの前記ゼロ成分をゼロ化する、
請求項１４記載の復号装置。
ゼロ化した前記ゼロ成分の位置に、雑音スペクトルを加算する雑音加算部を有する、
請求項１５記載の復号装置。
前記雑音加算拡張帯域スペクトルの雑音成分の振幅を調整する振幅再調整部を有する、
請求項１から請求項４、または請求項１４のいずれか１つに記載の復号装置。
前記振幅再調整部は、
前記閾値を基準に前記雑音加算拡張帯域スペクトルの雑音成分を検出するとともに、前記雑音成分のエネルギーを計算する雑音エネルギー計算部と、
前記雑音成分のエネルギーを用いて前記雑音加算拡張帯域スペクトルのフレーム間のエネルギー変化を平滑化し、前記雑音成分エネルギーと平滑化処理後の雑音成分のエネルギーとの比を表すスケーリング係数を計算するフレーム間平滑化部と、
前記スケーリング係数を用いて前記雑音加算拡張帯域スペクトルの雑音成分の振幅を調整する振幅調整部と、を有する、
請求項１７記載の復号装置。