JPWO2015129165A1 - 復号装置、符号化装置、復号方法、符合化方法、端末装置、および基地局装置 - Google Patents

復号装置、符号化装置、復号方法、符合化方法、端末装置、および基地局装置 Download PDF

Info

Publication number
JPWO2015129165A1
JPWO2015129165A1 JP2016505017A JP2016505017A JPWO2015129165A1 JP WO2015129165 A1 JPWO2015129165 A1 JP WO2015129165A1 JP 2016505017 A JP2016505017 A JP 2016505017A JP 2016505017 A JP2016505017 A JP 2016505017A JP WO2015129165 A1 JPWO2015129165 A1 JP WO2015129165A1
Authority
JP
Japan
Prior art keywords
spectrum
noise
unit
core
amplitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016505017A
Other languages
English (en)
Inventor
河嶋 拓也
拓也 河嶋
江原 宏幸
宏幸 江原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Corp of America
Original Assignee
Panasonic Intellectual Property Corp of America
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Corp of America filed Critical Panasonic Intellectual Property Corp of America
Publication of JPWO2015129165A1 publication Critical patent/JPWO2015129165A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本開示の復号装置は、所定の周波数以下の低域スペクトルを符号化したコア符号化データと、所定の周波数以上の高域スペクトルをコア符号化データに基づき符号化した拡張帯域符号化データを復号する復号装置(100)であって、コア符号化データを復号したコア復号スペクトルの振幅をコア復号スペクトルの振幅の最大値で正規化し正規化スペクトルを生成する振幅正規化部(103)と、雑音スペクトルを生成する雑音生成部(104)と、正規化スペクトルに雑音スペクトルを加算して雑音加算正規化スペクトルを生成する第1の加算部(105)と、雑音加算正規化スペクトルを用いて前記拡張帯域符号化データを復号し、雑音加算拡張帯域スペクトルを生成する拡張帯域復号部(106)と、を有する。

Description

本開示は、音声信号や音楽信号(以下、音声信号等とする。)のミュージカルノイズを低減するように、音声信号等を復号または符号化する技術に関する。
音声信号等を低ビットレートで圧縮する音声符号化技術は、移動体通信における電波等の有効利用を実現する重要な技術である。さらに、近年通話音声の品質向上に対する期待が高まっており、臨場感の高い通話サービスの実現が望まれている。これを実現するためには、周波数帯域の広い音声信号等を高ビットレートで符号化すればよい。しかし、このアプローチは電波や周波数帯域の有効利用と相反する。
周波数帯域の広い信号を低ビットレートで高品質に符号化する方法として、入力信号のスペクトルを低域部と高域部の2つのスペクトルに分割し、高域スペクトルは低域スペクトルを複製しこれと置換する、つまり高域スペクトルを低域スペクトルで代用することにより、全体のビットレートを低減させる技術がある(特許文献1)。
かかる技術を基に、高域スペクトルは低域スペクトルに対してエネルギーの偏りが小さいという特性に鑑み、サブバンド毎に低域スペクトルを正規化(平坦化)してから高域スペクトルとの相関をとるという技術がある。これによれば、ピーク性の高い低域スペクトルをそのままコピーすることによる音質劣化を防止することができる。ただし、この技術には、低域スペクトルが離散的なパルス列で表現されることに起因して、離散的なパルス列のエンベロープを推定する方法では本来の入力信号のエンベロープと乖離してしまうという欠点があった。そこで、この正規化方法に代えて、サブバンド毎に離散的なパルスの最大振幅値で正規化するという方法が提案されている(特許文献2)。
図11は、特許文献2に記載の符号化装置である。かかる符号化装置において、入力信号は時間―周波数変換部1010で周波数領域の信号に変換されて入力信号スペクトルとして出力されるとともに、入力信号スペクトルの低域部はコア符号化部1020で符号化されコア符号化データとして出力される。そして、コア符号化データを復号化してコア符号化低域スペクトルを生成し、これをサブバンド振幅正規化部1030でサンプルの振幅の最大値で正規化し、正規化低域スペクトルを生成する。そして、正規化低域スペクトルとの相関値が最大となる入力信号スペクトルの高域部の帯域と、かかる帯域での正規化低域スペクトルと入力信号スペクトルの高域部との間のゲインとを求め、これらを拡張帯域符号化部1060で符号化して拡張帯域符号化データとして出力する。
図12は、これに対応する復号装置である。符号化データは分離部2010でコア符号化データと拡張帯域符号化データとに分離され、コア符号化データはコア復号部2020で復号され、コア符号化低域スペクトルを生成する。コア符号化低域スペクトルは、サブバンド振幅正規化部2030で、符号化装置側と同様の処理、つまりサンプルの振幅の最大値で正規化し、正規化低域スペクトルを生成する。そして、正規化低域スペクトルを用いて拡張帯域復号部2040で拡張帯域符号化データを復号し、拡張帯域スペクトルを生成する。
また、図13のように、ピーク性の強さに応じて、サンプルの最大値で正規化するサブバンド振幅正規化部1030と、サンプルのスペクトルパワーの包絡で正規化するスペクトル包絡正規化部7020とを切り替えて正規化を行う技術も開示されている。
特許文献2に記載のサンプルの最大値で正規化する技術は、低域スペクトルがスパースな場合、つまり一部のサンプルの振幅値のみ大きく、その他のサンプルの振幅値がほぼゼロであるような場合に特に有効である。つまり、特許文献2の技術によれば、スパースなスペクトルであっても極端に振幅が大きいスペクトルの発生を抑止し(均質化)、特性が平坦な正規化低域スペクトルを得ることができる(平滑化)。
特表2001−521648号公報 国際公開第2013/035257号
しかしながら、パルス列がスパースな場合はスペクトルホールが発生しやすくなり、このスペクトルホールがミュージカルノイズと呼ばれるノイズの原因となる。特許文献2には、低域スペクトルをサンプルの振幅の最大値で正規化する場合に、スペクトルホールに起因するミュージカルノイズに対して、いかなる対策をとるかについては開示されていない。
本開示の一態様は、全体のビットレートを低減させつつも、ミュージカルノイズを抑えて高品質な音声信号等を復号できる復号装置および符号化装置を提供する。
本開示の一態様は、所定の周波数以下の低域スペクトルを符号化して生成されたコア符号化データと、前記入力信号の所定の周波数以上の高域スペクトルを前記コア符号化データとに基づいて生成された拡張帯域符号化データを復号する復号装置に関するものである。この復号装置は、コア符号化データおよび拡張帯域符号化データを分離する分離部と、
コア符号化データを復号してコア復号スペクトルを生成するコア復号部と、コア復号スペクトルの振幅を前記コア復号スペクトルの振幅の最大値で正規化し正規化スペクトルを生成する振幅正規化部と、
雑音スペクトルを生成する雑音生成部と、
正規化スペクトルに前記雑音スペクトルを加算して雑音加算正規化スペクトルを生成する第1の加算部と、
雑音加算正規化スペクトルを用いて前記拡張帯域符号化データを復号し雑音加算拡張帯域スペクトルを生成する拡張帯域復号部と、
コア復号スペクトルと前記雑音加算拡張帯域スペクトルを結合するとともに時間―周波数変換を行い、出力信号を出力する時間―周波数変換部と、
を有する。
なお、これらの包括的または具体的な態様は、システム、方法、集積回路、コンピュータプログラム、または、記録媒体で実現されてもよく、システム、装置、方法、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。
本開示の一態様における復号装置によれば、ミュージカルノイズが抑えられた高品質な音声信号等を復号することができる。
本開示の実施形態1における復号装置の構成図 本開示の実施形態2における復号装置の構成図 本開示の実施形態2におけるその他の復号装置の構成図 本開示の実施形態3における復号装置の構成図 本開示の実施形態3における雑音生成部の動作を示す説明図 本開示の実施形態4における復号装置の構成図 本開示の実施形態4における振幅調整部の動作を示す説明図 本開示の実施形態4におけるその他の復号装置の構成図 本開示の実施形態4におけるその他の復号装置の振幅再調整部の動作を示す説明図 本開示の実施形態5における符号化装置の構成図 従来技術の符号化装置の構成図 従来技術の復号装置の構成図 従来技術の符号化装置の構成図 本開示の実施形態6における復号装置の構成図 本開示の実施形態6におけるコア復号スペクトル振幅調整部の動作を示す説明図 本開示の実施形態6におけるその他1の復号装置の構成図 本開示の実施形態6におけるその他2の復号装置の構成図 本開示の実施形態7における復号装置の構成図 本開示の実施形態7における復号装置の振幅再調整部の構成図
以下、本開示の実施形態の構成および動作について、図面を参照して説明する。なお、本開示の復号装置からの出力信号、および符号化装置への入力信号は、狭義の音声信号のみの場合の他、より帯域の広い音楽信号の場合、さらにはこれらが混在する場合も包含するものとする。
なお、本明細書において、「入力信号」とは、音声信号だけでなく、音声信号より帯域の広い音楽信号や、音声信号と音楽信号が混在した信号も包含する概念である。
「雑音スペクトル」とは、不規則に振幅が上下しているスペクトルである。規則的であっても、周期が長く実質不規則と言えるものは、不規則に含まれる。
雑音スペクトルを「生成する」とは、雑音スペクトルを発生させることの他、予め記憶装置等に保存しておいた雑音スペクトルを出力する場合も含む。
「結合」および「時間―周波数変換」は、時間的に何れが先行するかは任意である。もちろん同時であってもよい。結果的に「結合」と「周波数変換」が行われていれば足りる。
「ビット配分情報」とは、コア復号スペクトルの所定の帯域に配分されるビット数を表す情報である。
「スパース情報」とは、コア復号スペクトル中のゼロスペクトルまたは非ゼロスペクトルの分布状況を表す情報であり、例えば、コア復号スペクトルの所定の帯域において全スペクトルに対する非ゼロスペクトルまたはゼロスペクトルの割合を直接的または間接的に示す情報である。
「相関」とは、2つのスペクトルの近似性を表す。相関値という指標を用いて近似性を定量的に評価する場合も含む。
「端末装置」とは、ユーザ側が用いる装置をいい、例えば携帯電話、スマートフォン、カラオケ装置、パーソナルコンピュータ、テレビ、ICレコーダなどの機器がこれに該当する。
「基地局装置」とは、端末装置に直接的ないし間接的に信号を送信、あるいは端末装置から直接ないし間接的に信号を受信する装置であり、例えばeNodeB、各種サーバ、アクセスポイントなどがこれに該当する。
「非ゼロ成分」とは、パルスが立っているとみなされる成分をいう。一定強度以下のパルスであって、パルスが立っているとみなされないようなものはゼロ成分であって、非ゼロ成分ではない。つまり、オリジナルの正規化スペクトルに含まれているパルスは、すべてが非ゼロ成分とは限らない。
(実施形態1)
図1は、実施形態1にかかる復号装置の構成を示すブロック図である。図1に示す復号装置100は、分離部101、コア復号部102、振幅正規化部103、雑音生成部104、第1の加算部105、拡張帯域復号部106、時間―周波数変換部107により構成される。また、分離部101には、アンテナAが接続されている。
アンテナAでコア符号化データおよび拡張帯域符号化データが受信される。コア符号化データは、符号化装置において入力信号の所定の周波数以下の低域スペクトルを符号化して得られる符号化データである。また、拡張帯域符号化データは、入力信号の所定の周波数以上の高域スペクトルを符号化して得られる符号化データである。そして、拡張帯域符号化データは、入力信号の所定の周波数以上の高域スペクトルを、コア符号化データを復号して得られたコア符号化低域スペクトルに基づき符号化されている。具体例として、高域スペクトルとコア符号化低域スペクトルとの相関が最大となる特定の帯域を示す情報であるラグ情報、および特定の帯域における高域スペクトルとコア符号化低域スペクトルとの間のゲインが符号化される。かかる符号化については、実施形態5で具体例を説明する。なお、本開示の復号装置に入力される振幅帯域符号化データは、この具体例に限定されるものではない。
分離部101は、入力されたコア符号化データおよび拡張帯域符号化データを分離する。分離部101は、コア符号化データはコア復号部102に、拡張帯域符号化データは拡張帯域復号部106に出力する。
コア復号部102は、コア符号化データを復号して、コア復号スペクトルを生成する。コア復号部102は、コア復号スペクトルを振幅正規化部103および時間―周波数変換部107に出力する。
振幅正規化部103は、コア復号スペクトルを正規化して、正規化スペクトルを生成する。具体的には、振幅正規化部103は、コア復号スペクトルを複数のサブバンドに分割し、サブバンド毎のスペクトルを、各サブバンドに含まれるスペクトルの振幅(絶対値)の最大値でそれぞれ正規化する。こうすることで、正規化後の各サブバンドにおけるスペクトルの絶対値の最大値はサブバンド間で統一される。これにより、正規化スペクトルでは、極端に振幅が大きなスペクトルは存在しなくなる。
なお、コア復号スペクトルのサブバンドへの分割は任意である。また、サブバンドの分割方法も任意であり、例えばサブバンドの帯域は均一でもよいし、均一でなくてもよい。
そして、振幅正規化部103は、正規化スペクトルを第1の加算部105および拡張帯域復号部106に出力する。
雑音生成部104は、雑音スペクトルを生成する。雑音スペクトルは、不規則に振幅が上下しているスペクトルである。具体的には、周波数成分ごとに正負がランダムに割り当てられているスペクトルが例として挙げられる。正負がランダムであれば、振幅は一定値であってもよいし、範囲内でランダムに生成された振幅値であってもよい。
雑音スペクトルの生成方法は、乱数に基づいて都度生成してもよいし、予め生成した雑音スペクトルをメモリ等の記憶装置に保存しておき、これを呼び出して出力してもよい。複数の雑音スペクトルを呼び出して足し合わせたり、偶数成分と奇数成分とで組み合わせたり、足し合わせや組み合わせ時に極性をランダムに割り当てたりしても良い。また、コア復号スペクトルにおけるゼロスペクトル部分を検出して、これを埋めるように雑音スペクトルを生成してもよい。さらに、コア復号スペクトルの特性に応じて雑音スペクトルを生成してもよい。
なお、雑音スペクトルは一つに限らず、所定の条件に従い複数の雑音スペクトルの中から1つを選択して出力してもよい。複数の雑音スペクトルが生成される例は実施形態3で説明する。
そして、雑音生成部104は、雑音スペクトルを第1の加算部105に出力する。
第1の加算部105は、正規化スペクトルと雑音スペクトルを加算して雑音加算正規化スペクトルを生成する。これにより、少なくとも正規化スペクトルのゼロ成分の領域に雑音スペクトルが付加される。
そして、第1の加算部105は、雑音加算正規化スペクトルを拡張帯域復号部106に出力する。
本実施形態では、雑音スペクトルを振幅正規化部103で正規化される前の入力スペクトルであるコア復号スペクトルではなく、振幅正規化部103で正規化された後のスペクトルである正規化スペクトルに対して付加しているが、これは以下の理由による。
付加される雑音スペクトルの振幅はコア復号スペクトルの振幅より通常小さく、またコア復号スペクトルはスパースなため、正規化が15サンプル程度の短いサブバンド毎に行われる場合はオールゼロのサブバンドが多い。この場合、雑音スペクトルを正規化前のコア復号スペクトルに対して付加する場合は、以下の課題がある。
まずオールゼロのサブバンドに対し低レベルの雑音スペクトルが付加される。この雑音スペクトルは、雑音スペクトル自体が最大値となりこれが1として正規化されるので、サブバンド内にピークが存在しない場合は雑音全体が増幅されてしまう。これに対して、サブバンド内にピークが存在する場合は、もともと存在するピークのスペクトルが最大値となるので、雑音成分は正規化によっても低レベルのまま、あるいはむしろ正規化により小さくなる。このため、元々オールゼロの周波数成分を有するサブバンドに振幅の大きな雑音スペクトルが局所的に付加されてしまうことになる。
これに対し、本実施形態では、雑音スペクトルを正規化後の正規化スペクトルに対して付加しているので、正規化により過度に雑音スペクトルが増幅してしまうことを防止することができるものである。
拡張帯域復号部106は、雑音加算正規化スペクトルおよび正規化スペクトルを用いて、拡張帯域符号化データの復号を行う。
具体的には、拡張帯域復号部106は、拡張帯域符号化データを復号し、ラグ情報およびゲインを得る。拡張帯域復号部106は、ラグ情報および正規化スペクトルに基づいて高域部である拡張帯域にコピーする雑音加算正規化スペクトルの帯域を特定し、雑音加算正規化スペクトルの所定帯域を拡張帯域にコピーする。次に、拡張帯域復号部106は、コピーされた雑音加算正規化スペクトルに対して復号されたゲインを乗じることで、雑音加算拡張帯域スペクトルを得る。
そして、拡張帯域復号部106は、雑音加算拡張帯域スペクトルを時間―周波数変換部107に出力する。
時間―周波数変換部107は、低域部を構成するコア復号スペクトルおよび高域部を構成する雑音加算拡張帯域スペクトルを結合して復号スペクトルを生成する。そして、時間−周波数変換部107は、復号スペクトルに対して直交変換を行うことにより復号スペクトルを時間領域の信号に変換して出力信号として出力する。
復号装置100から出力された出力信号は、図示しないDAコンバータ、アンプおよびスピーカ等を通じて、音声信号や音楽信号、あるいはこれらの混在した信号として出力される。
以上、本実施形態によれば、正規化スペクトルに雑音スペクトルを付加しているので、正規化スペクトルがスパースな場合であってもミュージカルノイズの発生を抑えることができる。つまり、本実施形態によれば、スペクトルの最大値で正規化することで得られる均質化および平滑化の効果を維持しつつ、かかる正規化の方法が有する欠点を補完する効果を発揮するものである。
また、本実施形態によれば、振幅正規化部103で正規化された後の正規化スペクトルに対して雑音スペクトルを付加しているので、正規化により過度に雑音スペクトルが増幅されてしまうのを防止することができ、高音質の出力信号を得ることができるという効果を発揮するものである。
(実施形態2)
次に、本開示の実施形態2における復号装置200の構成を、図2を用いて説明する。図1と同じ構成を有するブロックは、同じ図番を用いている。本実施形態の復号装置200と実施形態1における復号装置100との違いは、本実施形態の復号装置200が、第2の加算部201を有していることである。それ以外の構成要素は原則実施形態1と同様なので、説明を省略する。
第2の加算部201は、コア復号部102から出力されたコア復号スペクトルに、雑音生成部104で生成された雑音スペクトルを加算して雑音加算コア復号スペクトルを生成する。そして、第2の加算部201は、雑音加算コア復号スペクトルを時間―周波数変換部107に出力する。
時間―周波数変換部107は、低域部を構成する雑音加算コア復号スペクトルおよび高域部を構成する雑音加算拡張帯域スペクトルを結合して復号スペクトルを生成する。そして、時間−周波数変換部107は、復号スペクトルに対して直交変換を行うことにより復号スペクトルを時間領域の信号に変換して出力信号として出力する。
以上、本実施形態によれば、高域部を構成する正規化スペクトルのみならず、低域部を構成するコア復号スペクトルに対しても雑音スペクトルを付加するので、聴覚上重要な低域スペクトルから発生するミュージカルノイズを抑えることができる。もちろん、コア復号スペクトルのみを用いて出力信号を生成する場合においても、ミュージカルノイズを抑えることができる。
(実施形態2の他の例)
次に、本開示の実施形態2の他の例である復号装置210の構成を、図3を用いて説明する。図1、2と同じ構成を有するブロックは、同じ図番を用いている。本実施形態の復号装置210と実施形態2における復号装置200との違いは、本実施形態の復号装置210が、第1の加算部105に出力する雑音スペクトルを雑音生成部104から直接出力するのではなく、減算部202で雑音加算コア復号スペクトルからコア復号スペクトルを減算して生成し出力していることである。それ以外の構成要素は原則実施形態2と同様なので、説明を省略する。
雑音生成部104は、コア復号スペクトルのゼロスペクトル成分を検出して、これを埋めるよう雑音スペクトルを生成する。
第2の加算部201は、コア復号部102から出力されたコア復号スペクトルに、雑音生成部104で生成された雑音スペクトルを加算して雑音加算コア復号スペクトルを生成する。そして、第2の加算部201は、雑音加算コア復号スペクトルを時間―周波数変換部107および減算部202に出力する。
減算部202は、雑音加算コア復号スペクトルからコア復号スペクトルを減算し、この差分を雑音スペクトルとして第1の加算部105に出力する。
このような処理を行なう理由を以下に説明する。コア復号スペクトルに雑音スペクトルを加算する処理は、コア復号スペクトルに対して独立に生成した雑音スペクトルを加算することにより実現する場合の他、本実施形態のようにコア復号スペクトルのゼロスペクトル部分を検出して、これを埋めるように雑音スペクトル加算することによっても実現することもできる。この場合、雑音スペクトルはコア復号スペクトル上にオンされて直ちにコア復号スペクトルと一体になるので、第1の加算部105に出力する雑音スペクトルを別途何らかの方法で得る必要がある。
そこで、本実施形態では、減算部202を設け、雑音加算コア復号スペクトルからコア復号スペクトルを減算することにより、雑音スペクトルを取り出している。
この場合、雑音生成部104、第2の加算部201、および減算部202を合わせて、本開示の雑音生成部を構成する。
以上、本実施形態によれば、コア復号スペクトルを構成するスペクトルのうちゼロスペクトル以外のスペクトルに対しては、雑音スペクトルを付加しないようにすることができるので、より正確な復号を行うことができ、高音質の出力信号を得ることができる。
(実施形態3)
次に、本開示の実施形態3の復号装置300の構成を、図4を用いて説明する。図1、2と同じ構成を有するブロックは、同じ図番を用いている。本実施形態の復号装置300と実施形態2における復号装置200との違いは、本実施形態の復号装置300が雑音生成部104に代えて雑音生成部301を有することである。それ以外の構成要素は原則実施形態2と同様なので、説明を省略する。
雑音生成部301は、複数の異なる雑音スペクトルを生成することが可能であり、コア復号スペクトルの特性に応じて、出力する雑音スペクトルを異ならせることができる。
図5は、雑音生成部301の動作を示すフローチャートである。雑音生成部301は、コア復号部102から帯域ノルム情報(帯域平均振幅情報)、ビット配分情報、およびスパース情報を受け取る(S1)。ここでビット配分情報とは、コア復号スペクトルの所定の帯域に配分されるビット数を表す情報である。例えば、ITU−T勧告G.722.1や同G.719では、スペクトルのノルム情報(帯域毎の振幅平均値あるいはこれに準じた情報(スケーリング係数、バンドエネルギーなど))が符号化され、このノルム情報に基づいてビット配分が決定される。また、スパース情報とは、コア復号スペクトルの所定の帯域において全スペクトルに対する非ゼロスペクトルの割合(または、その反対にゼロスペクトルの割合と定義しても良い)を示す情報である。
次に、雑音生成部301は、ビット配分情報を用いて第1の雑音振幅調整係数C1を算出する(S2)。C1は、例えば配分されたビット数bの関数F(b)によって求められる。F(b)は、b=0のとき固定値Nb、b>nsのとき0、をそれぞれ出力し、0≦b≦nsではNbと0との間の数値を出力し、bがnsに近づくほど0に近い数値を出力する。例えば、以下の式(1)のような関数である。
Figure 2015129165
ここで、Nbは0〜1.0の定数で、ビットが配分されなかった時に用いられる雑音振幅調整係数の値である。nsは定数で、スペクトルを高品質に量子化するために必要なビット数である。このビット数以上のビットがあれば量子化誤差が問題にならないレベルで量子化が可能であるため、雑音を付加する必要がない。C1はビットが配分された帯域毎に計算しても良いし、複数の帯域をまとめて、まとめた帯域全体に対して計算しても良い。
さらに、雑音生成部301は、スパース情報を用いて第2の雑音振幅調整係数C2を算出する(S3)。C2は、例えば対象とする帯域の全スペクトル数に占めるゼロスペクトルの割合Spとして以下の式(2)で定義される。
Figure 2015129165
ここで、Nzはゼロスペクトルの本数、Lbは対象帯域の全スペクトル数、をそれぞれ示す。Spは、ゼロスペクトルの割合が増えるほど大きな値を取り、0〜1.0の変数となる。式(2)の代わりに、以下の式(3)を用いても良い。
Figure 2015129165
最後に、雑音生成部301は、第1および第2の雑音振幅調整係数C1およびC2を用いて、以下の式(4)に基づき雑音振幅LNを算出する(S4)。
Figure 2015129165
ここで、|E(i)|はi番目の帯域の帯域ノルム情報(帯域平均振幅情報)である。なお、bとSpは、i番目の帯域に対する配分ビット数とスパース情報を示す。
なお、本実施形態ではC1とC2の双方を用いたが、いずれか一方のみを用いてLNを求めてもよい。
以上、本実施形態では、雑音生成部301は、帯域ノルム情報、ビット配分情報、およびスパース情報に基づき、生成する雑音スペクトルの振幅を定める。これにより、量子化の粗さに基づいて適応的に雑音スペクトルを付加できるので、量子化が細かくできている帯域に雑音を付加しすぎて音質劣化を招くことを回避できるという効果を有する。
なお、本実施形態において、ビット配分情報およびスパース情報がコア復号部102から出力される例を説明したがこれに限られない。例えば、雑音生成部301にコア復号スペクトルが入力され、雑音生成部301がコア復号スペクトルを分析して、帯域ノルム情報、ビット配分情報、及びスパース情報を自ら得るようにしてもよい。
なお、本実施形態では、実施形態2の雑音生成部104を雑音生成部301に置き換えたものについて説明したが、実施形態1の雑音生成部104を雑音生成部301に置き換えてもよい。
なお、本実施形態では、LNは帯域i毎に計算および適用されるが、複数の帯域をまとめて計算・適用してもよいし、i毎に計算したLNの平均値を求めて全帯域に一律のLNとして適用してもよい。
(実施形態4)
次に、本開示の実施形態4の復号装置400の構成を、図6を用いて説明する。図1、2、4と同じ構成を有するブロックは、同じ図番を用いている。本実施形態の復号装置400と実施形態2における復号装置200との違いは、本実施形態の復号装置400が雑音振幅正規化部401および振幅調整部402を有することである。それ以外の構成要素は原則実施形態2と同様なので、説明を省略する。
雑音振幅正規化部401は、雑音生成部104で生成された雑音スペクトルを正規化して正規化雑音スペクトルを生成する。雑音振幅正規化部401の動作は、振幅正規化部103の動作と同じであるが、異なる動作としてもよい。例えば、振幅正規化部103において、スパース化を行うために閾値未満のスペクトル成分をゼロにするという処理を行なう場合、雑音振幅正規化部401においてはこの閾値を低めの閾値として、雑音スペクトルに対してはスパース化の程度を軽減してもよい。
そして、雑音振幅正規化部401は、雑音正規化スペクトルを振幅調整部402に出力する。
振幅調整部402は、雑音振幅正規化部401が出力した正規化雑音スペクトルの振幅を調整する。そして、振幅が調整された正規化雑音スペクトルを第1の加算部105に出力する。振幅調整部402の動作の詳細は後述する。
第1の加算部105は、正規化スペクトルと振幅が調整された正規化雑音スペクトルを加算して雑音加算正規化スペクトルを生成する。
そして、第1の加算部105は、雑音加算正規化スペクトルを拡張帯域復号部106に出力する。
図7は、振幅調整部402の動作を示すフローチャートである。
振幅調整部402は、コア復号部102から出力されたコア復号スペクトルX(j)、帯域ノルム情報|E(i)|、ビット配分情報、およびスパース情報を受け取る(S1)。
そして、振幅調整部402は、コア復号スペクトルX(j)および帯域ノルム情報|E(i)|を分析し、コア復号スペクトルX(j)から求められる平均振幅|XE(i)|と復号ノルム|E(i)|(帯域ノルム情報)との誤差を得る。そして、得られた誤差と復号ノルム(帯域ノルム情報)との比を用いて雑音振幅調整係数C0を以下の式(5)に従い算出する(S2)。なお、iは帯域番号を示し、jはi番目の帯域に含まれるスペクトルの番号を示す。
Figure 2015129165
ここで、αは調整係数で、0〜1.0の値を取る。
そして、振幅調整部402は、ビット配分情報を用いて実施の形態3と同様に、(1)式に従い雑音振幅調整係数C1を算出する(S3)。
さらに、振幅調整部402は、正規化スペクトルのスパース情報を用いて実施の形態3と同様に、(2)式に従い雑音振幅調整係数C2を算出する(S4)。
最後に、振幅調整部402は、(S2)(S3)(S4)の結果に基づき、雑音振幅LNを以下の式(6)で求め、正規化雑音スペクトルの振幅を調整する(S5)。
Figure 2015129165
なお、本実施形態ではC0、C1、C2のすべてを用いたが、少なくとも一つを用いてLNを求めてもよい。
また、本実施形態ではC2を求めるために用いるスパース情報は正規化スペクトルのスパース情報を用いているが、コア復号スペクトルから求められるスパース情報を用いたり、あるいは双方を併用したりすることも可能である。
さらに、コア復号スペクトルとコア復号スペクトルに加算される雑音スペクトルの振幅比を雑音振幅調整係数C3とし、C3に基づいて以下の式(7)により雑音振幅LNを求めてもよい。もちろん、C3単独で用いてもよいし、C0、C1、C2、C3の少なくとも一つを用いてLNを求めてもよい。
Figure 2015129165
なお、雑音レベルをフレーム間で安定させるため、LNはフレーム間で平滑化すると良い。平滑化には、LN(f)=μ×LN(f−1)+(1−μ)×LN(f)のような式を使えばよい。ここで、LN(f)はフレーム番号fにおけるLNを、μは平滑化係数である。μは0〜1の間の値をとる。
以上、本実施形態によれば、コア復号スペクトルは振幅正規化部103で正規化されるのに対し、雑音スペクトルは雑音振幅正規化部401で正規化されるので、コア復号スペクトルと雑音スペクトルが通るパスを合わせることで共通した性質を持つスペクトル(例えば、振幅がほぼ一律なスペクトルとなる。)となり、両信号を同じ土俵で扱える信号とすることができる。
また、本実施形態によれば、高域部に付加する雑音スペクトル(正規化雑音スペクトル)は雑音振幅正規化部401および振幅調整部402を介して出力されるのに対し、低域部に付加する雑音スペクトルは雑音振幅正規化部401および振幅調整部402を介さないので、高域部に付加する雑音スペクトル(正規化雑音スペクトル)と低域部に付加する雑音スペクトルの特性を異ならせることが可能となる。そして、これにより、低域部と高域部との相関を減らすことができるので、よりランダムな特性を持つ雑音スペクトルを生成することができる。
そして、本実施形態によれば、正規化雑音スペクトルは振幅調整部402で振幅を調整されるので、雑音を付加しすぎて音質劣化を招くことを回避することができるという効果を有する。
なお、本実施形態において、ビット配分情報およびスパース情報がコア復号部102から出力される例を説明したがこれに限られない。例えば、振幅調整部402にコア復号スペクトルが入力され、振幅調整部402がコア復号スペクトルを分析して、帯域ノルム情報、ビット配分情報及びスパース情報を自ら得るようにしてもよい。
なお、本実施形態では、雑音振幅正規化部401および振幅調整部402を実施形態2の構成に付加したものについて説明したが、これらを実施形態1、または実施形態3に付加してもよい。
(実施形態4の他の例)
次に、本開示の実施形態4のその他の復号装置410の構成を、図8を用いて説明する。図6と同じ構成を有するブロックは、同じ図番を用いている。本実施形態の復号装置410と実施形態4における復号装置400との違いは、本実施形態の復号装置410が振幅再調整部403を有することである。それ以外の構成要素は原則実施形態4と同様なので、説明を省略する。
振幅再調整部403は、雑音を付加したコア復号スペクトルを用いて拡張帯域を生成したのちに、付加した雑音成分の振幅を再調整する。この再調整は図9のように行うことができる。
図9において、(a)は振幅正規化部103から出力された正規化スペクトルを表し、(b)は第1の加算部105から出力された雑音加算正規化スペクトルである。そして(c)のように、雑音加算正規化スペクトルをラグ情報に基づいて拡張帯域にシフトし、ゲインを乗じて拡張帯域のスペクトルが生成される。(b)では、拡張帯域の一番下の帯域であるi番目の帯域のみが示されている。図中E(i)はi番目の帯域の帯域ノルム情報(帯域エネルギー)を示し、破線(d)で囲まれた部分は、ラグ情報で指定される(拡張帯域復号部106で特定される)雑音加算正規化スペクトルであり、対応する拡張帯域(ここではi番目の帯域)に適切なゲインGを乗じてコピーされる。また、破線(e)で囲まれた部分は拡張帯域である。付加された雑音成分の振幅再調整は次のようにして行う。
まず、閾値Thを決める。Thは、例えば正規化スペクトルの最大振幅の半分の値にする。正規化スペクトルの振幅がある振幅以上に限定されている場合は、正規化スペクトルの最低振幅値をThとしても良い。また、値を有する正規化スペクトルの平均振幅値としても良い。さらにまた、付加した雑音スペクトルの平均振幅値としても良い。なおまた、これらの値に定数を乗じて調整した値としても良い。
(b)に正規化スペクトルの最低振幅をThとした場合のThとその振幅を示す二点鎖線で表示しているが、このThより小さな振幅を有する成分が雑音成分として定義される。
次に、拡張帯域符号化データを復号して得られるゲインGをThに乗じてG・Thを求める。
次に、帯域拡張によって生成されたi番目の帯域のスペクトルについて、閾値G・Thより小さい振幅のスペクトルを選んでこれを雑音成分と定義し、i番目の帯域の雑音成分エネルギーを算出する(これをEN(i)とする)。
次に、以下の式(8)により、EN(i)を時間軸方向に平滑化したSEN(i)を求める。
Figure 2015129165
ここで、σは平滑化係数で1に近い0〜1の定数、pSEN(i)は1フレーム前のSEN(i)をそれぞれ表す。
そして、i番目の帯域の雑音成分のエネルギーがSEN(i)になるように雑音成分に対して√SEN(i)/√EN(i)を乗じる。
同様に、他の拡張帯域の各帯域の雑音成分に対して振幅の再調整を行う。またさらに、拡張帯域の各帯域のSEN(i)にばらつきがでる場合は、そのばらつきをなくすための振幅再調整をさらに行っても良い。具体的には、拡張帯域の全帯域におけるEN(i)の平均値AENを求め、全帯域のEN(i)がAENに等しくなるように、各帯域の雑音成分にAEN/EN(i)を乗じてから、前述のフレーム間の平滑化処理を適用する。
なお、各帯域の雑音成分のエネルギーを揃える処理とフレーム間の平滑化処理との順番は任意であり、またどちらか一方の処理のみ行うようにしても良い。
(実施形態5)
実施形態1から4においては、復号装置の実施形態を説明した。本開示は、符号化装置にも適用が可能である。以下、本開示の実施形態5の符号化装置500の構成を、図10を用いて説明する。
図10は、実施形態5にかかる符号化装置の構成を示すブロック図である。図10に示す符号化装置500は、時間−周波数変換部501、コア符号化部502、振幅正規化部503、雑音生成部504、雑音振幅正規化部505、振幅調整部506、第1の加算部507、帯域探索部508、ゲイン算出部509、拡張帯域符号化部510、多重化部511、ラグ探索位置候補格納部512により構成される。また、多重化部511には、アンテナAが接続されている。
時間周波数変換部501は、時間領域の音声信号等である入力信号を周波数領域の信号に変換し、得られる入力信号スペクトルをコア符号化部502、帯域探索部508、およびゲイン算出部509に出力する。
コア符号化部502は、入力信号スペクトルのうち低域スペクトルを符号化して、コア符号化データを生成する。符号化の例として、CELP符号化や変換符号化が挙げられる。コア符号化部502は、コア符号化データを多重化部511に出力する。また、コア符号化部502は、コア符号化データを復号して得られるコア復号スペクトルを振幅正規化部503に出力する。
振幅正規化部503、雑音生成部504、雑音振幅正規化部505、および振幅調整部506の動作は、実施形態3および4に記載したものと同じなので、説明を省略する。
ラグ探索位置候補格納部512は、正規化スペクトルの振幅がゼロでない成分の位置(周波数)を帯域探索の対象となる候補位置として格納する。そして、ラグ探索位置候補格納部512は、格納した候補位置情報を帯域探索部508に出力する。
第1の加算部507は、正規化スペクトルと振幅を調整された正規化雑音スペクトルを加算して雑音加算正規化スペクトルを生成する。
そして、第1の加算部507は、雑音加算正規化スペクトルを帯域探索部508およびゲイン算出部509に出力する。
帯域探索部508、ゲイン算出部509、および拡張帯域符号化部510は、入力信号スペクトルのうち高域スペクトルを符号化する処理を行なう。
帯域探索部508は、入力信号スペクトルのうち高域スペクトルと雑音加算正規化スペクトルとの間の相関を最大とする特定の帯域を探索する。探索は、ラグ探索位置候補格納部512から入力した候補位置の中から前記相関を最大とする候補を選ぶことによって行われる。そして、帯域探索部508は、探索した特定の帯域を示す情報であるラグ情報をゲイン算出部509および拡張帯域符号化部510に出力する。
ゲイン算出部509は、特定の帯域における高域スペクトルと雑音加算正規化スペクトルとの間のゲインを算出し、拡張帯域符号化部510に出力する。
拡張帯域符号化部510は、ラグ情報およびゲインを符号化して拡張帯域符号化データを生成する。そして、拡張帯域符号化部510は、拡張帯域符号化データを多重化部511に出力する。
多重化部511は、コア符号化データと拡張帯域符号化データとを多重化して、アンテナAを通じて送信する。
以上、本実施形態によれば、雑音成分が付加されたスペクトルを用いて高域スペクトルの探索(ラグ探索、類似度探索)が行われるので、スペクトル形状のマッチング精度を上げることが可能となる。
なお、本実施形態を示す図として挙げた図10は、復号装置の実施形態である実施形態3および実施形態4を合わせた構成としているが、実施形態1、2、3、または4に対応する構成としてもよい。さらに、後述の実施形態6に対応する構成としてもよい。
(実施形態6)
次に、本開示の実施形態6の復号装置600の構成を、図14を用いて説明する。実施形態4を表す図6の復号装置400と同じ構成を有するブロックは、同じ図番号を用いている。本実施形態の復号装置600と復号装置400との違いは、本実施形態の復号装置600が新たに閾値計算部601、コア復号スペクトル振幅調整部602を有し、さらに振幅調整部402に代えて雑音スペクトル振幅調整部603を有することである。
また、本実施形態の復号装置600では、雑音生成部104に代えて雑音生成・加算部604および減算部202を有するが、これは実施形態2の他の例で説明した、コア復号スペクトルのゼロスペクトル成分を埋めるよう雑音スペクトルを生成、加算する構成である。それ以外の構成要素は原則実施形態4と同様なので、説明を省略する。
閾値計算部601は、正規化スペクトルのスパース情報を用いて、雑音成分と非雑音成分とを区別するスペクトル強度の閾値Thを計算する。具体的な計算方法は後述する。なお、正規化スペクトルのスパース情報に代えて、コア復号スペクトルのスパース情報を用いてもよい。
そして、閾値計算部601は、閾値をコア復号スペクトル振幅調整部602および雑音スペクトル振幅調整部603に出力する。
コア復号スペクトル振幅調整部602は、正規化スペクトルの非ゼロ成分が前記閾値よりも大きくなるように前記正規化スペクトルの振幅を調整する。具体的には、図15(a)のように、正規化スペクトルの非ゼロ成分の最小値が閾値より大きくなるよう、それぞれのスペクトルに一定のオフセットを加えたり、あるいは一定の割合で増幅することにより、正規化スペクトル全体をかさ上げする。
増幅方法の一例として、増幅後の振幅をY、増幅前をX、閾値をTh、として、Y=aX+Th、(なお、a=(Xmax−Th)/Xmax,XmaxはXが取り得る最大値)で表されるようなスケーリングが考えられる。
あるいは、図15(b)のように、一定強度(「ゼロ化閾値」とする。)以上のスペクトルのうち最小ものものが閾値より大きくなるようにしてもよい。例えば、正規化スペクトルの範囲が0から10に正規化されている場合、ゼロ化閾値を0.95とし、0.95以上のスペクトルのうち最小のものを、閾値Thより大きくなるようにしてもよい。この場合、0.95以下のスペクトルは、ゼロ化しておく。つまり、この場合は、ゼロ化閾値以上のスペクトルが非ゼロ成分、ゼロ化閾値以下のスペクトルがゼロ成分となる。
なお、上述のようにゼロ化閾値は固定値を用いてもよいが、ゼロ化閾値を他の変数に応じた変動値としてもよい。例えば、ゼロ化閾値=閾値Th×α(αは定数、例えばα=1/4)としてもよい。また、これとともに、ゼロ化閾値に上限値や下限値を併用してもよい。例えば、ゼロ化閾値が0.9以下になる場合は,0.9をゼロ化閾値するようにしてもよい。
そして、振幅が調整された正規化スペクトルを第1の加算部105に出力する。
雑音スペクトル振幅調整部603は、正規化雑音スペクトルの最大値が閾値以下になるように正規化雑音スペクトルの振幅を調整する。具体的には、正規化雑音スペクトルの最大値が閾値より小さい場合、それぞれのスペクトルに一定のオフセットを加えたり、あるいは一定の割合で増幅したりして、正規化雑音スペクトルの最大値を閾値、あるいはそれ以下に設定する。正規化雑音スペクトルの最大値が閾値より大きい場合は、負のオフセットを加える、つまり減算(クリッピング)したり、あるいは負の割合で増幅、つまり減衰したりする。この調整は、正規化雑音スペクトルを閾値で正規化することと同義である。
そして、振幅が調整された正規化雑音スペクトルを第1の加算部105に出力する。
第1の加算部105は、振幅が調整された正規化スペクトルと、振幅が調整された正規化雑音スペクトルを加算し、雑音加算正規化スペクトルとして拡張帯域復号部106に出力する。
以下、閾値の求め方について説明する。
閾値は、雑音成分と非雑音成分とを区分する意義を有する。そして、閾値Thは、式(2)のスパース度Spを用い、以下の式(9)で求められる。aは定数で、本実施例では例えば4に設定する。
Figure 2015129165
なお、Nzを用いた式(9)の代わりに、以下の式(10)を用いて閾値Thを求めることもできる。
Figure 2015129165
ここで、Npはゼロでないスペクトルの本数を示す。
なお、これらとともに、閾値Thに上限や下限を併用してもよい。
つまり、式(9)によれば、スパース度Spが大きい程、すなわちゼロ成分が多く離散的なパルス列となる程、雑音性が低くなり、閾値Thは低くなる。逆にスパース度Spが小さい程、すなわちゼロ成分が少なく密なパルス列になる程、雑音性は高くなり、閾値Thは高くなる。
そして、スパース度Spが大きくなる(閾値Thが低くなる)と、雑音スペクトル振幅調整部603で調整される雑音スペクトルの振幅は小さく抑えられ、振幅の小さい雑音スペクトルが加算部105で加算される。つまり、正規化スペクトルの信号は雑音性が低いので、この特性を維持するため、加算される雑音スペクトルの振幅は小さくなる。
逆に、スパース度Spが小さくなる(閾値Thが高くなる)と、雑音スペクトル振幅調整部603で調整される雑音スペクトルの振幅は大きくなり、振幅の大きい雑音スペクトルが加算部105で加算される。つまり、正規化スペクトルの信号は雑音性が高いので、この特性を維持するため、加算される雑音スペクトルの振幅は大きくなる。
なお、本実施形態では閾値は1つとし、コア復号スペクトル振幅調整部602と雑音スペクトル振幅調整部603とで共通に用いた。しかし、コア復号スペクトル振幅調整部602と雑音スペクトル振幅調整部603とで、別の閾値を用いてもよい。これは、閾値は雑音成分と非雑音成分とを区分する意義を有するものではあるが、正規化スペクトルに元々含まれる低振幅のスペクトルが有する雑音性と、生成された雑音スペクトルが有する雑音性とは、その特性が異なることもあり、この場合同一の基準を用いずにそれぞれの基準を独立して定めた方がより音質を高めることができるからである。例えば、コア復号スペクトル振幅調整部602で用いる閾値の方を、雑音スペクトル振幅調整部603で用いる閾値よりも高くすることにより、オリジナルの信号である正規化スペクトルに含まれる成分をより強調することができる。
なお、式(9)では、閾値を求めるのにスパース度のみを用いたが、実施形態3や実施形態4のように、帯域ノルム情報やビット配分情報を組み合わせる、あるいは単独で用いるようにしてもよい。例えば、以下の場合は、ビット配分情報を併用することが考えられる。
ビット配分が増えるとパルス数を増やすことができるので、より低振幅のパルスも符号化されるようになり、量子化パルス数が増える。この結果、スパース度が下がることになる。つまり、スパース度は符号化対象の信号の特徴だけでなく、配分されるビット数にも依存する。したがって、配分されるビット数が大きく変わる場合は、ビット配分の変化による影響を補正すべく、スパース度と閾値の関係を調整するようにしてもよい。
また、本実施形態では、雑音生成・加算部は、実施形態2の他の例の構成を用いたが、これに代えて、実施形態1の雑音生成部104、実施形態2の雑音生成部104および第2の加算部201、実施形態3の雑音生成部301および第2の加算部201を用いるようにしてもよい。
以上の復号装置600によれば、正規化スペクトルの振幅と正規化雑音スペクトルの振幅に対し、正規化スペクトルと正規化雑音スペクトルの振幅の両方を調整できるとともに、これらを連動して調整することができるので、正規化スペクトルの特性に応じた最適な雑音を付加することができる結果、出力信号の音質の向上を図ることができる。
より具体的には、正規化スペクトルの雑音性が強調され、高周波数帯域のスペクトルを表現するのに適したスペクトルを作り出すことができるので、帯域拡張モデルに基づく復号装置の出力信号の音質を向上することができる。
(実施形態6の他の例1)
次に、本開示の実施形態6の他の例1の復号装置610の構成を、図16を用いて説明する。図14と同じ構成を有するブロックは、同じ図番を用いている。本実施形態の復号装置610と復号装置600との違いは、主に閾値計算部601の動作にある。
本実施形態の復号装置610の閾値計算部601は、入力されるスパース情報をコア復号スペクトルのスパース情報とし、このスパース情報を基に閾値計算部601で式(9)や式(10)を用いて閾値Thを求めるとともに、この閾値Thを用いてゼロ化閾値を、例えば、ゼロ化閾値=閾値Th×αのような演算を用いて求める。
そして、閾値計算部601は、閾値Thをコア復号スペクトル振幅調整部602および雑音スペクトル振幅調整部603に出力するとともに、ゼロ化閾値を振幅正規化部103に出力する。
振幅正規化部103は、コア復号スペクトルを正規化するとともに、ゼロ化閾値より小さい、あるいはゼロ化閾値以下のスペクトルをゼロにして(ゼロ化して)して出力する。
なお、本実施形態では、ゼロ化を行うブロックを振幅正規化部103としたが、振幅正規化部103の前後のいずれかにゼロ化を行う別のブロックを設けてもよいし、コア復号スペクトル振幅調整部602で行ってもよい。その場合は、ゼロ化閾値の出力先は、当該ゼロ化を行うブロックとすればよい。
(実施形態6の他の例2)
次に、本開示の実施形態6の他の例2の復号装置620の構成を、図17を用いて説明する。図16と同じ構成を有するブロックは、同じ図番を用いている。本実施形態の復号装置620と復号装置600や復号装置610との違いは、雑音生成・加算部605を有することである。
復号装置600や復号装置610では、雑音生成・加算部604はコア復号スペクトルのゼロスペクトル成分を埋めるよう雑音スペクトルを生成、加算している。つまり、コア復号スペクトルのゼロスペクトル成分に相当する位置のみに雑音を加算する構成であるから、後発的に振幅正規化部103等でゼロ化したスペクトル部分には、最終的に雑音が加算されることはない。
そこで、本実施形態では、ゼロ化したスペクトル部分にも雑音を加算するため、雑音生成・加算部605を設けている。雑音生成・加算部605は、第1の加算部105から出力された雑音加算正規化スペクトルのゼロスペクトルを検出し、それを埋めるようにランダムに雑音を生成し加算する。なお、これまでの説明の通り、加算する振幅の最大値を制御するため、閾値計算部601で生成した閾値を雑音生成・加算部に出力し、かかる閾値を用いて振幅の最大値を決定してもよい。また、閾値とは別に、上限値を併用してもよい。
なお、雑音加算正規化スペクトルのゼロスペクトルを検出する代わりに、ゼロ化を行うブロック、例えば振幅正規化部103からゼロ化したスペクトルの情報を受け取り、ゼロ化したスペクトルの位置に雑音を加算するようにしてもよい。
また、本実施形態では、雑音生成・加算部605を第1の加算部105の後に設けたが、これに代えて、雑音スペクトル振幅調整部603と第1の加算部105の間、あるいは雑音振幅正規化部401と雑音スペクトル振幅調整部603の間に設けてもよい。この場合、ゼロ化を行うブロックからゼロ化したスペクトルの情報を受け取り、ゼロ化したスペクトルの位置に雑音を加算する。
(実施形態7)
次に、本開示の実施形態7の復号装置700の構成を、図18を用いて説明する。本実施形態の復号装置700は、実施形態6の他の例2における復号装置620に実施形態4の他の例で説明した振幅再調整部403を付加したものである。そして、これに伴い、閾値計算部601で計算された閾値Thは、振幅再調整部403にも出力される。それ以外の構成は実施形態6の他の例2と同様なので、説明を省略する。
拡張帯域復号部106で生成した雑音加算拡張帯域スペクトルは、振幅再調整部403に出力される。振幅再調整部403の動作は、基本的には実施形態4の他の例と同じであるので、以下、実施形態6の他の例2との関係を中心に説明する。また、振幅再調整部403の機能毎にブロックを分けて説明する。振幅再調整部403は、図19のように、雑音エネルギー計算部701、フレーム間平滑化部702、および振幅調整部703からなる。
雑音エネルギー計算部701は、付加された雑音スペクトルのエネルギーをサブバンド毎に計算する。付加された雑音スペクトルは、実施形態6の閾値Thを用いることで検出、分離することが可能である。拡張帯域復号部106では、拡張帯域符号化データから復号されるラグ情報によって特定される雑音加算正規化スペクトルに対して、同じく拡張帯域符号化データから復号されるゲインを乗じることにより、雑音加算拡張帯域スペクトルを生成する。よって、実施形態6の閾値Thに前記ゲインを乗じたものが,雑音加算拡張帯域スペクトルにおける雑音成分判定の閾値となる。つまり、閾値計算部601で求めた閾値に前記ゲインを乗じて雑音成分判定閾値を求め、雑音成分判定閾値未満(以下)の成分を当該サブバンドにおける雑音成分と判定する。前記ゲインはサブバンド毎に符号化されているので、雑音成分判定閾値もサブバンド毎に算出される。
そして、サブバンド毎の雑音スペクトルのエネルギーをフレーム間平滑化部702に出力する。
フレーム間平滑部702は、受け取ったサブバンド毎の雑音スペクトルのエネルギーを用いて、サブバンド間で雑音スペクトルのエネルギーの変化がスムーズになるよう、平滑化処理を行なう。平滑化処理は、公知のフレーム間平滑化処理を用いることが可能である。
例えば、フレーム間平滑化処理は、以下の式(11)により行うことができる。
Figure 2015129165
ここで、EScは平滑化処理後の雑音スペクトルのエネルギー、Ecは平滑化処理前の雑音スペクトルのエネルギー、EScpは前フレームにおける平滑化処理後の雑音スペクトルのエネルギー、σは平滑化係数(0<σ<1)、をそれぞれ示す。なお、σの値を0に近づけるほど強い平滑化となる。0.15程度とするのが好適である。
なお、現フレームの信号が前フレームの信号に比べて急に減衰している場合は、強い平滑化を行うと本来信号レベルが下がっているはずのところに高いレベルのノイズが維持されてしまうので問題となる。このような場合に対応するため、別途符号化されているサブバンドエネルギー情報が、前フレームにおける平滑化処理後の雑音スペクトルのサブバンドエネルギー(すなわちEScp)に比べて小さくなっている場合は、σの値を1に近づけて平滑化処理を弱くする。例えば,EScpが、現フレームの復号サブバンドエネルギーの80%未満である場合はσを0.15に設定して強い平滑化処理を行う一方、EScpが現フレームの復号サブバンドエネルギーの80%以上である(つまり,現フレームの復号サブバンドエネルギーが前フレームの平滑化雑音スペクトルサブバンドエネルギーに比べて十分大きくない)場合は、σを0.8に設定して弱い平滑化処理を行うようにする。
振幅調整部703は、入力される雑音加算拡張帯域スペクトルに対し、フレーム間平滑化部702で計算されたEScを用いて雑音部分の振幅を再調整する。再調整の方法は、実施形態4の他の例で説明したものと同じである。つまり、実施形態4の他の例で説明したように,(√ESc/√Ec)をスケーリング係数として乗じる。
なお、スケーリングによるエネルギーの変化が大きくなると、雑音成分以外を含めた復号信号全体のエネルギーが本来の大きさから大きくずれてしまう可能性がある。この場合、スケーリング係数を√(√ESc/√Ec)のようにすると、スケーリング係数の変動を非線形に抑えることができるので、スケーリングによる復号信号全体のエネルギーへの悪影響を緩和することができる。
以上、本実施形態によれば、帯域拡張処理によって合成された高域信号の雑音成分を時間方向に平滑化し、振幅変動に対しても変動を抑える処理が行われるため、復号信号の雑音成分のレベルが安定し、聴感上の品質を改善することが可能となる。また,本実施形態の雑音加算正規化スペクトル生成方法と組み合わせて用いれば、雑音成分の判定情報を別途符号化・伝送する必要がなく、効率的な雑音成分の付加と安定化が可能である。
(総括)
以上、実施形態1から7で本開示の復号装置および符号化装置を説明した。本開示の復号装置および符号化装置は、システムボードや半導体素子に代表されるような半完成品や部品レベルの形態でもよいし、端末装置や基地局装置のような完成品レベルの形態も含む概念である。本開示の復号装置および符号化装置が半完成品や部品レベルの形態の場合は、アンテナ、DA/ADコンバータ、増幅器、スピーカ、およびマイク等と組み合わせることにより完成品レベルの形態となる。
なお、図1から図8、図10、図14、および図16から図19のブロック図は、専用に設計されたハードウェアの構成および動作(方法)を表すとともに、汎用のハードウェアに本開示の動作(方法)を実行するプログラムをインストールしてプロセッサで実行することにより実現する場合も含む。汎用のハードウェアたる電子計算機として、例えばパーソナルコンピュータ、スマートフォンなどの各種携帯情報端末、および携帯電話などが挙げられる。
また、専用に設計されたハードウェアは、携帯電話や固定電話などの完成品レベル(コンシューマエレクトロニクス)に限らず、システムボードや半導体素子など、半完成品や部品レベルをも含むものである。
本開示にかかる復号装置および符号化装置は、音声信号や音楽信号の記録、伝送、再生に関係する機器に応用が可能である。
100,200,210,300,400,410,600,610,620,700 復号装置
101 分離部
102 コア復号部
103,503 振幅正規化部
104,301,504 雑音生成部
105,507 第1の加算部
106 拡張帯域復号部
107,501 時間−周波数変換部
201 第2の加算部
202 減算部
401,505 雑音振幅正規化部
402,506,703 振幅調整部
403 振幅再調整部
500 符号化装置
601 閾値計算部
602 コア復号スペクトル振幅調整部
603 雑音スペクトル振幅調整部
604 雑音生成・加算部
605 雑音生成・加算部

Claims (18)

  1. 所定の周波数以下の低域スペクトルを符号化したコア符号化データと、所定の周波数以上の高域スペクトルを前記コア符号化データに基づき符号化した拡張帯域符号化データとを復号する復号装置であって、
    前記コア符号化データおよび前記拡張帯域符号化データを分離する分離部と、
    前記コア符号化データを復号してコア復号スペクトルを生成するコア復号部と、
    前記コア復号スペクトルの振幅を前記コア復号スペクトルの振幅の最大値で正規化し、正規化スペクトルを生成する振幅正規化部と、
    雑音スペクトルを生成する雑音生成部と、
    前記正規化スペクトルに前記雑音スペクトルを加算して雑音加算正規化スペクトルを生成する第1の加算部と、
    前記雑音加算正規化スペクトルを用いて前記拡張帯域符号化データを復号し、雑音加算拡張帯域スペクトルを生成する拡張帯域復号部と、
    前記コア復号スペクトルと前記雑音加算拡張帯域スペクトルを結合するとともに時間−周波数変換を行い、出力信号を出力する時間−周波数変換部と、
    を有する復号装置。
  2. 前記コア復号スペクトルに前記雑音スペクトルを加算して雑音加算コア復号スペクトルを生成する第2の加算部を有し、
    前記時間−周波数変換部は、前記雑音加算コア復号スペクトルと前記雑音加算拡張帯域スペクトルを結合するとともに時間−周波数変換を行い、出力信号を出力する、
    請求項1記載の復号装置。
  3. 前記雑音生成部は、前記コア復号スペクトルのビット配分情報、および前記コア復号スペクトルのスパース情報の少なくとも一つに応じて前記雑音スペクトルの振幅を決定する、
    請求項1または請求項2に記載の復号装置。
  4. 前記雑音スペクトルを正規化して正規化雑音スペクトルを出力する雑音振幅正規化部と、
    前記コア復号スペクトルのビット配分情報、前記コア復号スペクトルのスパース情報、および前記正規化スペクトルのスパース情報の少なくとも一つに応じて前記正規化雑音スペクトルの振幅を調整する振幅調整部と、を有し、
    前記第1の加算部は、前記正規化スペクトルに振幅を調整された前記正規化雑音スペクトルを加算して雑音加算正規化スペクトルを生成する、
    請求項1から請求項3のいずれかに記載の復号装置。
  5. 入力信号の所定の周波数以下の低域スペクトルを符号化してコア符号化データを生成するコア符号化部と、
    前記コア符号化データを復号して得られるコア復号スペクトルの振幅を前記コア復号スペクトルの振幅の最大値で正規化し正規化スペクトルを生成する振幅正規化部と、
    雑音スペクトルを生成する雑音生成部と、
    前記正規化スペクトルに前記雑音スペクトルを加算して雑音加算正規化スペクトルを生成する第1の加算部と、
    前記雑音加算正規化スペクトルと前記入力信号の所定の周波数以上の高域スペクトルとの間で相関が最大になる特定の帯域を探索する帯域探索手段と、
    前記特定の帯域において、前記雑音加算正規化スペクトルと前記高域スペクトルとの間のゲインを算出するゲイン算出手段と、
    前記特定の帯域および前記ゲインを符号化して拡張帯域符号化データを生成する拡張帯域符号化部と、
    前記コア符号化データおよび前記拡張帯域符号化データを多重化して出力する多重化部と、
    を有する符号化装置。
  6. 前記コア符号化データおよび前記拡張帯域符号化データを受信して前記分離部に出力するアンテナと、
    請求項1または請求項2のいずれかに記載の復号装置と、
    を有する端末装置。
  7. 前記コア符号化データおよび前記拡張帯域符号化データを受信して前記分離部に出力するアンテナと、
    請求項1または請求項2のいずれかに記載の復号装置と、
    を有する基地局装置。
  8. 請求項5記載の符号化装置と、
    前記多重化部から入力された前記コア符号化データおよび前記拡張帯域符号化データを送信するアンテナと、
    を有する端末装置。
  9. 請求項5記載の符号化装置と、
    前記多重化部から入力された前記コア符号化データおよび前記拡張帯域符号化データを送信するするアンテナと、
    を有する基地局装置。
  10. 所定の周波数以下の低域スペクトルを符号化したコア符号化データと、所定の周波数以上の高域スペクトルを前記コア符号化データに基づき符号化した拡張帯域符号化データとをプロセッサで復号する復号方法であって、
    前記コア符号化データおよび前記拡張帯域符号化データを分離し、
    前記コア符号化データを復号してコア復号スペクトルを生成し、
    前記コア復号スペクトルの振幅を前記コア復号スペクトルの振幅の最大値で正規化し正規化スペクトルを生成し、
    雑音スペクトルを生成し、
    前記正規化スペクトルに前記雑音スペクトルを加算して雑音加算正規化スペクトルを生成し、
    前記雑音加算正規化スペクトルを用いて前記拡張帯域符号化データを復号し、雑音加算拡張帯域スペクトルを生成し、
    前記コア復号スペクトルと前記雑音加算拡張帯域スペクトルを結合するとともに時間―周波数変換を行い、出力信号を出力する、
    復号方法。
  11. 入力信号をプロセッサで符号化する符号化方法であって、
    前記入力信号の所定の周波数以下の低域スペクトルを符号化してコア符号化データを生成し、
    前記コア符号化データを復号して得られるコア復号スペクトルの振幅を前記コア復号スペクトルの振幅の最大値で正規化し正規化スペクトルを生成し、
    雑音スペクトルを生成し、
    前記正規化スペクトルに前記雑音スペクトルを加算して雑音加算正規化スペクトルを生成し、
    前記雑音加算正規化スペクトルと前記入力信号の所定の周波数以上の高域スペクトルとの間で相関が最大になる特定の帯域を探索し、
    前記特定の帯域において、前記雑音加算正規化スペクトルと前記高域スペクトルとの間のゲインを算出し、
    前記特定の帯域および前記ゲインを符号化して拡張帯域符号化データを生成し、
    前記コア符号化データおよび前記拡張帯域符号化データを多重化して出力する、
    符号化方法。
  12. 請求項10の復号方法をプロセッサで実行するプログラム。
  13. 請求項11の符号化方法をプロセッサで実行するプログラム。
  14. 前記雑音スペクトルを正規化して正規化雑音スペクトルを出力する雑音振幅正規化部と、
    前記正規化スペクトル又は前記コア復号スペクトルのスパース情報を用いて、雑音成分と非雑音成分とを区別するスペクトル強度の閾値を計算する閾値計算部と
    前記正規化雑音スペクトルの最大値が前記閾値以下になるように前記正規化雑音スペクトルの振幅を調整する雑音スペクトル振幅調整部と、
    前記正規化スペクトルの非ゼロ成分が前記閾値よりも大きくなるように前記正規化スペクトルの振幅を調整するコア復号スペクトル振幅調整部と、を有する、
    請求項1から請求項3のいずれかに記載の復号装置。
  15. 前記閾値計算部は、さらに前記閾値を用いて前記正規化スペクトルのゼロ成分と非ゼロ成分を区別するゼロ化閾値を計算し、
    前記振幅正規化部は、前記ゼロ化閾値に基づき前記正規化スペクトルの前記ゼロ成分をゼロ化する、
    請求項14記載の復号装置。
  16. ゼロ化した前記ゼロ成分の位置に、雑音スペクトルを加算する雑音加算部を有する、
    請求項15記載の復号装置。
  17. 前記雑音加算拡張帯域スペクトルの雑音成分の振幅を調整する振幅再調整部を有する、
    請求項1から請求項4、または請求項14のいずれか1つに記載の復号装置。
  18. 前記振幅再調整部は、
    前記閾値を基準に前記雑音加算拡張帯域スペクトルの雑音成分を検出するとともに、前記雑音成分のエネルギーを計算する雑音エネルギー計算部と、
    前記雑音成分のエネルギーを用いて前記雑音加算拡張帯域スペクトルのフレーム間のエネルギー変化を平滑化し、前記雑音成分エネルギーと平滑化処理後の雑音成分のエネルギーとの比を表すスケーリング係数を計算するフレーム間平滑化部と、
    前記スケーリング係数を用いて前記雑音加算拡張帯域スペクトルの雑音成分の振幅を調整する振幅調整部と、を有する、
    請求項17記載の復号装置。
JP2016505017A 2014-02-28 2015-02-06 復号装置、符号化装置、復号方法、符合化方法、端末装置、および基地局装置 Pending JPWO2015129165A1 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
JP2014039431 2014-02-28
JP2014039431 2014-02-28
US201461974689P 2014-04-03 2014-04-03
US61/974,689 2014-04-03
JP2014137861 2014-07-03
JP2014137861 2014-07-03
PCT/JP2015/000537 WO2015129165A1 (ja) 2014-02-28 2015-02-06 復号装置、符号化装置、復号方法、符合化方法、端末装置、および基地局装置

Publications (1)

Publication Number Publication Date
JPWO2015129165A1 true JPWO2015129165A1 (ja) 2017-03-30

Family

ID=54008503

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016505017A Pending JPWO2015129165A1 (ja) 2014-02-28 2015-02-06 復号装置、符号化装置、復号方法、符合化方法、端末装置、および基地局装置

Country Status (9)

Country Link
US (3) US10062389B2 (ja)
EP (2) EP4325488A3 (ja)
JP (1) JPWO2015129165A1 (ja)
KR (1) KR102185478B1 (ja)
CN (2) CN111370008B (ja)
ES (1) ES2969736T3 (ja)
MX (1) MX361028B (ja)
RU (1) RU2662693C2 (ja)
WO (1) WO2015129165A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2969736T3 (es) * 2014-02-28 2024-05-22 Fraunhofer Ges Forschung Dispositivo de decodificación y método de decodificación
JP6795093B2 (ja) 2017-06-02 2020-12-02 富士通株式会社 判定装置、判定方法及び判定プログラム
US11682406B2 (en) * 2021-01-28 2023-06-20 Sony Interactive Entertainment LLC Level-of-detail audio codec
KR102457573B1 (ko) * 2021-03-02 2022-10-21 국방과학연구소 잡음 신호 생성 장치 및 방법, 컴퓨터 판독 가능한 기록 매체 및 컴퓨터 프로그램
JP2022167670A (ja) * 2021-04-23 2022-11-04 富士通株式会社 情報処理プログラム、情報処理方法、および情報処理装置

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5680972A (en) 1996-01-16 1997-10-28 Clarke; George Garment hanger system
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3751225B2 (ja) * 2001-06-14 2006-03-01 松下電器産業株式会社 オーディオ帯域拡張装置
JP2003323199A (ja) * 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法
JP4296753B2 (ja) * 2002-05-20 2009-07-15 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
RU2500043C2 (ru) * 2004-11-05 2013-11-27 Панасоник Корпорэйшн Кодер, декодер, способ кодирования и способ декодирования
US7983904B2 (en) * 2004-11-05 2011-07-19 Panasonic Corporation Scalable decoding apparatus and scalable encoding apparatus
KR20070115637A (ko) * 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
ES2898865T3 (es) 2008-03-20 2022-03-09 Fraunhofer Ges Forschung Aparato y método para sintetizar una representación parametrizada de una señal de audio
RU2538334C2 (ru) * 2009-02-26 2015-01-10 Панасоник Интеллекчуал Проперти Корпорэйшн оф Америка Кодер, декодер и способ для них
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
US10269363B2 (en) 2010-03-09 2019-04-23 Nippon Telegraph And Telephone Corporation Coding method, decoding method, apparatus, program, and recording medium
CN102222505B (zh) * 2010-04-13 2012-12-19 中兴通讯股份有限公司 可分层音频编解码方法系统及瞬态信号可分层编解码方法
CA2984936C (en) * 2011-02-18 2019-10-29 Ntt Docomo, Inc. Speech decoder, speech encoder, speech decoding method, speech encoding method, speech decoding program, and speech encoding program
WO2012157931A2 (en) * 2011-05-13 2012-11-22 Samsung Electronics Co., Ltd. Noise filling and audio decoding
CN102208188B (zh) * 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
US9384749B2 (en) * 2011-09-09 2016-07-05 Panasonic Intellectual Property Corporation Of America Encoding device, decoding device, encoding method and decoding method
CN102543086B (zh) * 2011-12-16 2013-08-14 大连理工大学 一种基于音频水印的语音带宽扩展的装置和方法
TWI591620B (zh) * 2012-03-21 2017-07-11 三星電子股份有限公司 產生高頻雜訊的方法
GB2506207B (en) * 2012-09-25 2020-06-10 Grass Valley Ltd Image process with spatial periodicity measure
MX355630B (es) * 2012-11-05 2018-04-25 Panasonic Ip Corp America Dispositivo de codificacion de voz audio, dispositivo de decodificacion de voz audio, metodo de codificacion de voz audio y metodo de decodificacion de voz audio.
ES2969736T3 (es) * 2014-02-28 2024-05-22 Fraunhofer Ges Forschung Dispositivo de decodificación y método de decodificación

Also Published As

Publication number Publication date
WO2015129165A1 (ja) 2015-09-03
CN111370008B (zh) 2024-04-09
EP3113181A4 (en) 2017-03-08
US20180336908A1 (en) 2018-11-22
CN105659321A (zh) 2016-06-08
MX2016008718A (es) 2016-10-13
KR20160120713A (ko) 2016-10-18
US11257506B2 (en) 2022-02-22
EP4325488A2 (en) 2024-02-21
EP3113181B1 (en) 2024-01-03
US20160284357A1 (en) 2016-09-29
US10062389B2 (en) 2018-08-28
CN111370008A (zh) 2020-07-03
EP3113181C0 (en) 2024-01-03
EP4325488A3 (en) 2024-05-15
US20200160873A1 (en) 2020-05-21
EP3113181A1 (en) 2017-01-04
KR102185478B1 (ko) 2020-12-02
MX361028B (es) 2018-11-26
RU2016138285A (ru) 2018-03-29
RU2662693C2 (ru) 2018-07-26
RU2016138285A3 (ja) 2018-03-29
CN105659321B (zh) 2020-07-28
US10672409B2 (en) 2020-06-02
ES2969736T3 (es) 2024-05-22

Similar Documents

Publication Publication Date Title
US11257506B2 (en) Decoding device, encoding device, decoding method, and encoding method
JP6306565B2 (ja) 帯域幅拡張のための高周波数符号化/復号化方法及びその装置
JP5267362B2 (ja) オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置
JP6717746B2 (ja) 音響信号符号化装置、音響信号復号装置、音響信号符号化方法および音響信号復号方法
US11232803B2 (en) Encoding device, decoding device, encoding method, decoding method, and non-transitory computer-readable recording medium
JP2006018023A (ja) オーディオ信号符号化装置、および符号化プログラム
JP6957444B2 (ja) 音響信号符号化装置、音響信号復号装置、音響信号符号化方法および音響信号復号方法
BR112016016373B1 (pt) Dispositivo de decodificação, método de decodificação e meio de armazenamento não transitório
JP2008015357A (ja) 符号化装置
JP2011242788A (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP2009103974A (ja) マスキングレベル算出装置、符号化装置、マスキングレベル算出方法およびマスキングレベル算出プログラム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20180323

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180704

A917 Reason for reinstatement of right to file examination request

Free format text: JAPANESE INTERMEDIATE CODE: A917

Effective date: 20180704

A917 Reason for reinstatement of right to file examination request

Free format text: JAPANESE INTERMEDIATE CODE: A917

Effective date: 20181130

A59 Written plea

Free format text: JAPANESE INTERMEDIATE CODE: A59

Effective date: 20190613