JPWO2015151451A1 - 符号化装置、復号装置、符号化方法、復号方法、およびプログラム - Google Patents

符号化装置、復号装置、符号化方法、復号方法、およびプログラム Download PDF

Info

Publication number
JPWO2015151451A1
JPWO2015151451A1 JP2016511368A JP2016511368A JPWO2015151451A1 JP WO2015151451 A1 JPWO2015151451 A1 JP WO2015151451A1 JP 2016511368 A JP2016511368 A JP 2016511368A JP 2016511368 A JP2016511368 A JP 2016511368A JP WO2015151451 A1 JPWO2015151451 A1 JP WO2015151451A1
Authority
JP
Japan
Prior art keywords
signal
frequency
tonal
high frequency
low
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016511368A
Other languages
English (en)
Inventor
スリカンス ナギセティ
スリカンス ナギセティ
ゾンシアン リウ
ゾンシアン リウ
江原 宏幸
宏幸 江原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Corp of America
Original Assignee
Panasonic Intellectual Property Corp of America
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Corp of America filed Critical Panasonic Intellectual Property Corp of America
Publication of JPWO2015151451A1 publication Critical patent/JPWO2015151451A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Abstract

本開示の符号化装置は、音声またはオーディオの入力信号の所定周波数以下の低域信号を含む信号を符号化した第1符号化信号と低域復号信号とを生成する第1符号化部と、前記低域復号信号に基づいて、前記低域信号より高域の信号を符号化して高域符号化信号を生成する第2符号化部と、前記第1符号化信号と前記高域符号化信号とを多重化して符号化信号を出力する第1の多重化部、とを有する。前記第2符号化部は、前記高域信号の雑音成分である高域雑音成分と、前記低域復号信号から生成された高域復号信号のうちの高域非トーナル信号とのエネルギー比率を算出して、高域符号化信号として出力する。

Description

本開示は、音声信号やオーディオ信号(以下、音声信号等とする。)を符号化する装置、復号化する装置に関する。
音声信号等を低ビットレートで圧縮する音声符号化技術は、移動体通信における電波等の有効利用を実現する重要な技術である。さらに、近年通話音声の品質向上に対する期待が高まっており、臨場感の高い通話サービスの実現が望まれている。これを実現するためには、周波数帯域の広い音声信号等を高ビットレートで符号化すればよい。しかし、このアプローチは電波や周波数帯域の有効利用と相反する。
周波数帯域の広い信号を低ビットレートで高品質に符号化する方法として、入力信号のスペクトルを低域部と高域部の2つのスペクトルに分割し、高域スペクトルは低域スペクトルを複製しこれと置換する、つまり高域スペクトルを低域スペクトルで代用することにより、全体のビットレートを低減させる技術がある(特許文献1)。この技術は、低域スペクトルの符号化に多くのビットを配分して高品質に符号化し、一方高域スペクトルは符号化後の低域スペクトルを複製することを基本の処理として、少ないビット配分で符号化が行われる。
特許文献1の技術をそのまま用いた場合、低域スペクトルに見られるピーク性の強い信号が高域にそのまま複製されることにより、鈴が鳴るように聞こえるノイズが発生し、主観的な品質が低下する。そこで、低域スペクトルのダイナミックレンジを適切に調整したものを高域スペクトルとする、という技術がある(特許文献2)。
特表2001−521648号公報 国際公開第2005/111568号
特許文献2の技術によれば、ダイナミックレンジは低域スペクトルを構成する要素全体を考慮して定めている。しかし、音声信号等のスペクトルは、ピーク性の強い成分、すなわち振幅が大きい成分(トーナル成分)と、ピーク性の弱い成分、すなわち振幅が小さい成分(非トーナル成分)とからなっており、特許文献2の技術によれば両者を合わせた全体での評価となるため、必ずしも最良の結果を得られるわけではなかった。
本開示の一態様は、全体のビットレートを低減させつつも、トーナル成分と非トーナル成分とを分離し、独立して符号化に用いることにより、さらなる高品質の音声信号等を符号化、復号化できる装置を提供する。
本開示の符号化装置は、音声またはオーディオの入力信号の所定の周波数以下の低域信号を符号化して生成した第1符号化信号と、第1符号化信号を復号した低域復号信号とを生成する第1符号化部と、低域復号信号に基づいて、低域信号より高域の信号を符号化して高域符号化信号を生成する第2符号化部と、第1符号化信号と前記高域符号化信号とを多重化して符号化信号を出力する第1の多重化部、とを備え、第2符号化部は、高域信号の雑音成分である高域雑音成分と、低域復号信号から生成された高域復号信号の高域非トーナル成分とのエネルギー比率を算出して、高域符号化信号として出力する、構成を採る。
なお、これらの包括的または具体的な態様は、システム、方法、集積回路、コンピュータプログラム、または、記録媒体で実現されてもよく、システム、装置、方法、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。
本開示の一態様の符号化装置および復号装置によれば、さらなる高品質の音声信号等を符号化、復号化することができる。
本開示の符号化装置の全体構成図 本開示の実施形態1における符号化装置の第2レイヤ符号化部の構成図 本開示の実施形態2における符号化装置の第2レイヤ符号化部の構成図 本開示の実施形態における他の符号化装置の全体構成図 本開示の復号装置の全体構成図 本開示の実施形態3における復号装置の第2レイヤ復号部の構成図 本開示の実施形態4における復号装置の第2レイヤ復号部の構成図 本開示の実施形態における他の復号装置の全体構成図 本開示の実施形態における他の符号化装置の全体構成図 本開示の実施形態における他の復号装置の全体構成図
以下、本開示の実施形態の構成および動作について、図面を参照して説明する。なお、本開示の符号化装置へ入力される入力信号、および復号装置からの出力される出力信号は、狭義の音声信号のみの場合の他、より帯域の広いオーディオ信号の場合、さらに、これらが混在する場合も包含するものとする。
(実施形態1)
図1は、実施形態1にかかる音声信号等の符号化装置の構成を示すブロック図である。ここでは、符号化信号が複数のレイヤからなる階層構造を有する場合、すなわち階層符号化(スケーラブル符号化)を行う場合を例として説明する。階層符号化以外を含む例としては、後述の図4で説明する。図1に示す符号化装置100は、ダウンサンプリング部101、第1レイヤ符号化部102、多重化部103、第1レイヤ復号部104、遅延部105、第2レイヤ符号化部106より構成される。また、多重化部103には図示しないアンテナが接続されている。
ダウンサンプリング部101は、入力信号からサンプリングレートの低い信号を生成し、所定の周波数以下の低域信号として第1レイヤ符号化部102に出力する。
第1レイヤ符号化部102は、第1符号化部を構成する要素の一形態であり、低域信号を符号化する。符号化の例として、CELP符号化や変換符号化が挙げられる。符号化された低域信号は、第1符号化信号たる低域符号化信号として第1レイヤ復号部104および多重化部103に出力する。
第1レイヤ復号部104は、同じく第1符号化部を構成する要素の一形態であり、低域符号化信号を復号し、低域復号信号を生成する。そして、第1レイヤ復号部104は、低域復号信号S1を第2レイヤ符号化部106に出力する。
一方、遅延部105は、入力信号に対し所定の時間、遅延させる。この遅延時間は、ダウンサンプリング部101、第1レイヤ符号化部102、および第1レイヤ復号部104で生じる時間遅れを補正するためのものである。遅延部105は、遅延させた入力信号S2を第2レイヤ符号化部106に出力する。
第2レイヤ符号化部106は、第2符号化部の一形態であり、第1レイヤ復号部104で生成された低域復号信号S1に基づいて、入力信号S2のうち所定の周波数以上の高域信号を符号化して高域符号化信号を生成する。第2レイヤ符号化部に入力される低域復号信号S1、入力信号S2は、MDCT等の周波数変換を施されて入力される。そして、第2レイヤ符号化部106は、高域符号化信号を多重化部103に出力する。第2レイヤ符号化部106の詳細は後述する。
多重化部103は、低域符号化信号および高域符号化信号を多重化して符号化信号を生成し、これを図示しないアンテナを通じて復号装置に送信する。
図2は、本実施形態における第2レイヤ符号化部106の構成を示すブロック図である。第2レイヤ符号化部106は、雑音加算部201、分離部202、帯域拡張部203、雑音成分エネルギー算出部204(第1計算部)、ゲイン算出部205(第2計算部)、エネルギー計算部206、多重化部207、帯域拡張部208より構成される。
雑音加算部201は、第1レイヤ復号部104から入力された低域復号信号S1に対し、雑音信号を加算する。なお、雑音信号は、ランダムな性質を持つ信号をいい、例えば時間軸あるいは周波数軸に対し不規則に信号強度の振幅が上下している信号である。雑音信号の生成は、乱数に基づいて都度生成してもよいし、予め生成した雑音信号(例えば、ホワイトノイズ、ガウスノイズ、ピンクノイズ等)をメモリ等の記憶装置に保存しておき、これを呼び出して出力してもよい。また、雑音信号は一つに限らず、所定の条件に従い複数の雑音信号の中から1つを選択して出力してもよい。
入力信号を符号化するに際し、割り当て可能なビット数が少ないと、ごく一部の周波数成分しか量子化できず、主観品質が劣化するという問題があるが、雑音加算部201で雑音を加算することにより、量子化されずにゼロになってしまう成分を雑音信号で埋めることで劣化を緩和するという効果が期待できる。
なお、雑音加算部201は任意の構成である。そして、雑音加算部201は、雑音信号が加算された低域復号信号を分離部202に出力する。
分離部202は、雑音信号が加算された低域復号信号を、非トーナル成分である低域非トーナル信号と、トーナル成分である低域トーナル信号とに分離する。ここで、トーナル成分とは、所定の閾値よりも振幅の大きい成分、あるいはパルス量子化器で量子化された成分をいう。また、非トーナル成分とは、所定の閾値以下の振幅を有する成分、あるいはパルス量子化器で量子化されずゼロとなっている成分をいう。
トーナル成分と非トーナル成分とを所定の閾値を用いて区別する場合は、低域復号信号を構成する成分について所定の閾値よりも振幅が大きいかどうかで分離する。トーナル成分と非トーナル成分とをパルス量子化器で量子化されたか否かで区別する場合は、所定の閾値がゼロの場合に相当するので、雑音加算部201で雑音が加算された低域復号信号から、低域復号信号S1を減算することにより、低域トーナル信号を生成することができる。
そして、分離部202は、低域非トーナル信号を帯域拡張部203に、低域トーナル信号を帯域拡張部208に出力する。
帯域拡張部208は、入力信号S2の高域信号をターゲットとして、帯域拡張用に生成された低域トーナル信号との間の相関を最大とする低域トーナル信号の特定の帯域を探索する。探索は、予め準備した特定の候補位置の中から前記相関を最大とする候補を選択することによって行ってもよい。帯域拡張用に生成された低域トーナル信号は、分離部202で分離した(量子化された)低域トーナル信号をそのまま用いてもよいし、平滑化ないし正規化されたトーナル信号を用いてもよい。
そして、帯域拡張部208は、探索した特定の帯域の位置を示す情報、すなわち拡張帯域の生成に用いられる低域スペクトルの位置(周波数)を特定する情報であるラグ情報を多重化部207、および帯域拡張部203に出力する。なお、ラグ情報は、すべての拡張帯域に対応するものが揃っている必要はなく、一部の拡張帯域に対応するものだけを送るようにしてもよい。例えば、帯域拡張によって生成されるサブバンドのうち一部についてはラグ情報が符号化され、残りは符号化されず、復号装置側でラグ情報を用いて生成されたスペクトルを折り返して生成するようにしてもよい。
また、帯域拡張部208は、入力信号S2の高域信号の中から振幅の大きいものを選択し、この選択した成分のみを用いて前記相関の計算を行うことで、相関演算の計算量を削減するとともに、選択した成分の周波数位置情報を高域トーナル成分周波数位置情報として雑音成分エネルギー算出部204(第1計算部)に出力する。
帯域拡張部203は、ラグ情報で特定される特定の帯域の位置を基準に、低域非トーナル信号を切り出して高域非トーナル信号とし、この高域非トーナル信号をゲイン算出部205に出力する。
雑音成分エネルギー算出部204は、高域トーナル成分周波数位置情報を用いて、入力信号S2の高域信号の雑音成分である高域雑音成分のエネルギーを算出して、ゲイン算出部205に出力する。具体的には、入力信号S2の高域部分全体のエネルギーから高域部分のうち高域トーナル成分周波数位置の成分のエネルギーを減算することにより高域トーナル成分でない成分のエネルギーを求め、これを高域雑音成分エネルギーとしてゲイン算出部205に出力する。
ゲイン算出部205は、帯域拡張部203から出力された高域非トーナル信号のエネルギーを算出し、このエネルギーと、雑音成分エネルギー算出部204から出力された高域雑音成分のエネルギーとの間の比率を算出し、これをスケールファクタとして多重化部207に出力する。
エネルギー計算部206は、入力信号S2のサブバンド毎のエネルギーを計算する。例えば、入力信号S2をサブバンドに分割した場合の、サブバンド内のスペクトルの2乗和で計算することができる。例えば、次式で定義することができる。
Figure 2015151451
ここで、XはMDCT係数であり、bはサブバンドの番号であり、Epsilonはスカラー量子化のための定数、である。
そして、エネルギー計算部206は、求めた量子化バンドエネルギーの大きさを示す指標を量子化バンドエネルギーとして多重化部207に出力する。
多重化部207は、ラグ情報、スケールファクタ、および量子化バンドエネルギーを符号化し、これを多重化する。そして、多重化により得られた信号を高域符号化信号として出力する。なお、多重化部207と多重化部103は別に設けてもよいし、一体として設けてもよい。
このように、本実施形態では、ゲイン算出部205(第2計算部)で、入力信号の高域信号のうちの高域非トーナル(雑音)成分のエネルギーと、低域復号信号から生成された高域復号信号のうちの高域非トーナル(雑音)信号のエネルギーとの比率を求めているので、復号信号における非トーナル(雑音)成分のエネルギーをより正確に再現できるという効果を有する。
つまり、トーナル成分に比べて小さく、誤差が出やすい非トーナル成分のエネルギーをより正確に再現でき、復号信号における非トーナル成分のエネルギーが安定する。また、バンドエネルギーと非トーナル成分のエネルギーを用いて計算されるトーナル成分のエネルギーもより正確に再現できる。そして、高域符号化信号を少ないビット数で符号化できる。
(実施形態2)
次に、本開示の実施形態2における符号化装置の構成について、図3を用いて説明する。なお、本実施形態における符号化装置100全体の構成は、実施形態1と同様、図1の構成を有している。
図3は、本実施形態における第2レイヤ符号化部106の構成を示すブロック図である。実施形態1の第2レイヤ符号化部106との違いは、雑音加算部と分離部の位置関係が逆転して、分離部302、雑音加算部301を有することである。
分離部302は、低域復号信号を、非トーナル成分である低域非トーナル信号と、トーナル成分である低域トーナル信号とに分離する。分離方法は、実施形態1で説明したものと同様、所定の閾値を基準に振幅の大小で分離する。閾値をゼロに設定してもよい。
雑音加算部301は、分離部302から出力された低域非トーナル信号に対し、雑音信号を加算する。既に振幅を有している成分には雑音信号を加算しないようにするために、低域復号信号S1を参照してもよい。
なお、実施形態1、2について階層符号化を用いた例を説明したが、実施形態1、2は階層符号化以外を用いたものにも適用することができる。図4および図9は、その他の符号化装置110,610の例である。まず図4の符号化装置110について説明する。
図4に示す符号化装置110は、時間―周波数変換部111、第1符号化部112、多重化部113、バンドエネルギー正規化部114、第2符号化部115より構成される。
時間―周波数変換部111は、入力信号に対しMDCT等を用いて周波数変換を行う。
バンドエネルギー正規化部114は、周波数変換を施された入力信号である入力スペクトルに対し、所定のバンド毎にバンドエネルギーの算出・量子化・符号化を行い、バンドエネルギー符号化信号を多重化部113に出力する。また、バンドエネルギー正規化部114は、量子化されたバンドエネルギーを用いて、第1符号化部および第2符号化部に割り当てるビット配分情報B1およびB2を計算し、第1符号化部112および第2符号化部115へそれぞれ出力する。また、さらに,バンドエネルギー正規化部114は、量子化されたバンドエネルギーで各バンドの入力スペクトルの正規化を行い、正規化入力スペクトルS2を第1符号化部112および第2符号化部115へ出力する。
第1符号化部112は、入力したビット配分情報B1に基づき、所定の周波数以下の低域信号を含む正規化入力スペクトルS2に対し、第1の符号化を行う。そして、第1符号化部112は、符号化の結果生成された第1符号化信号を多重化部113に出力する。また、第1符号化部112は、符号化の過程で得られる低域復号信号S1を第2符号化部115へ出力する。
第2符号化部115は、正規化入力スペクトルS2のうち第1符号化部112で符号化できていない部分につき、第2の符号化を行う。第2符号化部115は、図2、3で説明した第2レイヤ符号化部106の構成を用いることが可能である。
次に、図9の符号化装置610について説明する。図9に示す符号化装置610は、時間―周波数変換部611、第1符号化部612、多重化部613、第2符号化部614より構成される。
時間―周波数変換部611は、入力信号に対しMDCT等を用いて周波数変換を行う。
第1符号化部612は、周波数変化を施された入力信号である入力スペクトルに対し、所定のバンド毎にバンドエネルギーの算出と量子化と符号化を行い、バンドエネルギー符号化信号を多重化部613に出力する。また,第1符号化部612は、量子化されたバンドエネルギーを用いて、第1符号化信号および第2符号化信号に割り当てるビット配分情報を計算し、ビット配分情報に基づき,所定の周波数以下の低域信号を含む正規化入力スペクトルS2に対し、第1の符号化を行う。そして、第1符号化部612は、第1符号化信号を多重化部613へ出力するとともに、第1符号化信号の復号信号のうち、低域成分である低域復号信号を第2符号化部614へ出力する。ここで,第1の符号化は入力信号を量子化バンドエネルギーで正規化したものに対して行っても良い。この場合、第1符号化信号の復号化信号は量子化バンドエネルギーで逆正規化したものになる。また、第1符号化部612は、第2符号化信号に割り当てるビット配分情報、および、高域の量子化バンドエネルギー情報を第2符号化部614へ出力する。
第2符号化部614は、入力スペクトルS2のうち第1符号化部612で符号化できていない部分につき、第2の符号化を行う。第2符号化部614は、図2、3で説明した第2レイヤ符号化部106の構成を用いることが可能である。なお,図2,3では明記していないが、ビット配分情報は、ラグ情報を符号化する帯域拡張部208、および、スケールファクタを符号化するゲイン算出部に入力される。また、図2,3では、入力信号を用いてバンドエネルギーを算出、量子化するエネルギー計算部206が示されているが、図9では、第1符号化部612にてこの処理を行っているので必要ない。
(実施形態3)
図5は、実施形態3にかかる音声信号復号装置の構成を示すブロック図である。ここでは、符号化信号が複数のレイヤからなる階層構造を有する符号化装置から送信された信号であり、この符号化信号を復号する復号装置を例として説明する。なお、階層構造を有さない例については、図8で説明する。
図5に示す復号装置400は、分離部401、第1レイヤ復号部402、第2レイヤ復号部403より構成される。また、分離部401には、図示しないアンテナが接続されている。
分離部401は、図示しないアンテナを介して入力された符号化信号を、第1符号化信号たる低域符号化信号、および高域符号化信号に分離する。分離部401は、低域符号化信号を第1レイヤ復号部402に、高域符号化信号を第2レイヤ復号部403に出力する。
第1レイヤ復号部402は、第1復号部の一形態であり、低域符号化信号を復号して、低域復号信号S1を生成する。第1レイヤ復号部402の復号の例として、CELP復号が挙げられる。第1レイヤ復号部402は、低域復号信号を第2レイヤ復号部403に出力する。
第2レイヤ復号部403は、第2復号部の一形態であり、高域符号化信号を復号し、低域復号信号を用いて広帯域復号信号を生成、出力する。第2レイヤ復号部403の詳細は後述する。
そして、低域復号信号、または/および、広帯域復号信号は、図示しない増幅器やスピーカを通じて再生される。
図6は、本実施形態における第2レイヤ復号部403の構成を示すブロック図である。第2レイヤ復号部403は、復号・分離部501、雑音加算部502、分離部503、帯域拡張部504、スケーリング部505、結合部506、加算部507、帯域拡張部508、結合部509、トーナル信号エネルギー推定部510、スケーリング部511より構成される。
復号・分離部501は、高域符号化信号を復号し、量子化バンドエネルギーA、スケールファクタB、およびラグ情報Cに分離する。なお、分離部401と復号・分離部501は別に設けてもよいし、一体として設けてもよい。
雑音加算部502は、第1レイヤ復号部402から入力された低域復号信号S1に対し、雑音信号を加算する。雑音信号は、符号化装置100の雑音加算部201で加算した雑音信号と同じものを用いる。そして、雑音加算部502は、雑音信号が加算された低域復号信号を分離部503に出力する。
分離部503は、雑音信号が加算された低域復号信号から、非トーナル成分とトーナル成分を分離し、それぞれ低域非トーナル信号および低域トーナル信号として出力する。低域非トーナル信号と低域トーナル信号に分離する方法は、符号化装置100の分離部202で説明したものと同様である。
帯域拡張部504は、ラグ情報Cを用いて特定の帯域の低域非トーナル信号を高域にコピーして高域非トーナル信号を生成する。
スケーリング部505は、帯域拡張部504で生成した高域非トーナル信号に対し、スケールファクタBを乗算することにより高域非トーナル信号の振幅を調整する。
そして、結合部506で、低域非トーナル信号と、スケーリング部505で振幅を調整された高域非トーナル信号とを結合し、広帯域非トーナル信号を生成する。
一方、分離部503で分離された低域トーナル信号は、帯域拡張部508に入力される。そして、帯域拡張部508は、帯域拡張部504と同じく、ラグ情報Cを用いて特定の帯域の低域トーナル信号を高域にコピーして高域トーナル信号を生成する。
トーナル信号エネルギー推定部510は、スケーリング部505から入力される振幅を調整された高域非トーナル信号のエネルギーを算出するとともに、量子化バンドエネルギーAの値から高域非トーナル信号のエネルギーを減算して高域トーナル信号のエネルギーを求める。そして、高域非トーナル信号のエネルギーと高域トーナル信号のエネルギーとの比をスケーリング部511に出力する。
スケーリング部511は、高域トーナル信号に、高域非トーナル信号のエネルギーと高域トーナル信号のエネルギーとの比を乗算することにより、高域トーナル信号の振幅を調整する。
そして、結合部509で、低域トーナル信号と、振幅を調整された高域トーナル信号とを結合し、広帯域トーナル信号を生成する。
最後に、加算部507で広帯域非トーナル信号と広帯域トーナル信号とを加算し、広帯域復号信号を生成、出力する。
このように、本実施形態では、低域量子化スペクトルを用いて非トーナル成分を少ないビットで生成し、スケールファクタで適切なエネルギーを持つよう調整し、この調整した非トーナル成分のエネルギーを用いて高域トーナル信号のエネルギーを調整する構成を有しているので、少ない情報量で音楽信号等を符号化、伝送、復号化し、高域の非トーナル成分のエネルギーを適切に再現できるものである。また、量子化バンドエネルギー情報と非トーナル成分のエネルギー情報とを用いてトーナル成分のエネルギーを決定することにより、適正なトーナル成分のエネルギーも再現することができるものである。
(実施形態4)
次に、本開示の実施形態4における復号装置の構成を図7を用いて説明する。なお、本実施形態における復号装置400全体の構成は、実施形態1と同様、図4の構成を有している。
図7は、本実施形態における第2レイヤ復号部403の構成を示すブロック図である。実施形態3の第2レイヤ復号部403との違いは、実施形態1と実施形態2との関係と同様、雑音加算部と分離部の位置関係が逆転して、分離部603、雑音加算部602を有することである。なお、図7において、復号・分離部501は記載を省略している。
分離部603は、低域復号信号を、非トーナル成分である低域非トーナル信号と、トーナル成分である低域トーナル信号とに分離する。
雑音加算部602は、分離部603から出力された低域非トーナル信号に対し、雑音信号を加算する。
なお、実施形態3、4について階層符号化を用いた例を説明したが、実施形態3、4は階層符号化以外を用いたものにも適用することができる。図8および図10、その他の復号装置410、620の例である。まず、図8に示す復号装置410について説明する。
図8に示す復号装置410は、分離部411、第1復号部412、第2復号部413、周波数―時間変換部414、バンドエネルギー逆正規化部415、合成部116より構成される。
分離部411は、図示しないアンテナを介して入力された符号化信号を、第1符号化信号,高域符号化信号およびバンドエネルギー符号化信号に分離する。分離部411は、第1符号化信号を第1復号部412に、高域符号化信号を第2復号部413に,バンドエネルギー符号化信号をバンドエネルギー逆正規化部415に出力する。
バンドエネルギー逆量子化部415は、バンドエネルギー符号化信号を復号して、量子化バンドエネルギーを生成する。バンドエネルギー逆量子化部415は、量子化バンドエネルギーに基づいて、第1復号部および第2復号部へのビット配分情報B1およびB2を計算し、それぞれ出力する。また、バンドエネルギー逆量子化部415は、生成した量子化バンドエネルギーを、合成部416から入力する正規化広帯域復号信号に乗算して逆正規化を行い、最終的な広帯域復号信号を生成し、周波数−時間変換部414へ出力する。
第1復号部412は、ビット配分情報B1に従って第1符号化信号を復号して、低域復号信号S1および高域復号信号を生成する。第1復号部412は、低域復号信号を第2復号部413に、高域復号信号を合成部416に、それぞれ出力する。
第2復号部413は、ビット配分情報B2に従って高域符号化信号を復号し、低域復号信号を用いて広帯域復号信号を生成、出力する。第2復号部413は、図6、図7で説明した第2レイヤ復号部403と同じ構成を用いることが可能である。
合成部416は、第1復号部で復号された高域復号信号を第2復号部から入力した広帯域復号信号に加えて、正規化広帯域復号信号を生成し、バンドエネルギー逆正規化部415へ出力する。
そして、バンドエネルギー逆正規化部415から出力された広帯域復号信号は、周波数―時間変換部414で時間領域の信号に変換されて、図示しない増幅器やスピーカを通じて再生される。
次に、図10に示す復号装置620について説明する。図10は、その他の復号装置620の例である。図10に示す復号装置620は、第1復号部621、第2復号部622、合成部623,周波数―時間変換部624より構成される。
第1復号部621は、図示しないアンテナを介して入力された符号化信号(第1符号化信号、高域符号化信号およびバンドエネルギー符号化信号を含む)を入力し、まずバンドエネルギーを分離、復号する。復号したバンドエネルギーの高域部を高域バンドエネルギー(A)として第2復号部622へ出力する。次に、第1復号部621は復号したバンドエネルギーに基づいてビット配分情報を計算し、第1符号化信号を分離、復号する。この復号処理は、前記復号したバンドエネルギーを用いた逆正規化処理を含んでいても良い。復号した第1復号信号の低域部を低域復号信号として第2復号部621へ出力する。続いて、第1復号部621は前記ビット配分情報に基づいて高域符号化信号を分離、復号する。復号した高域復号信号は、スケールファクタ(B)とラグ情報(C)を含み、これらを第2復号部622へ出力する。また,第1復号部621は、前記第1復号信号の高域部を高域復号信号として合成部623へ出力する。高域復号信号がゼロになる場合もある。
第2復号部622は、第1復号部621から入力した、低域復号信号、復号した量子化バンドエネルギー、スケールファクタ、ラグ情報を用いて広帯域復号信号を生成、出力する。第2復号部622は、図6,図7で説明した第2レイヤ復号部403と同じ構成を用いてもよい。
合成部623は、第1復号部621で復号された高域復号信号を第2復号部622から入力した広帯域復号信号に加えて、広帯域復号信号を生成し、周波数―時間変換部624で時間領域の信号に変換されて、図示しない増幅器やスピーカを通じて再生される。
(総括)
以上、実施形態1から4で本開示の符号化装置および復号装置を説明した。本開示の符号化装置および復号装置は、システムボードや半導体素子に代表されるような半完成品や部品レベルの形態でもよいし、端末装置や基地局装置のような完成品レベルの形態も含む概念である。本開示の復号装置および符号化装置が半完成品や部品レベルの形態の場合は、アンテナ、DA/ADコンバータ、増幅器、スピーカ、およびマイク等と組み合わせることにより完成品レベルの形態となる。
なお、図1から図10のブロック図は、専用に設計されたハードウェアの構成および動作(方法)を表すとともに、汎用のハードウェアに本開示の動作(方法)を実行するプログラムをインストールしてプロセッサで実行することにより実現する場合も含む。汎用のハードウェアたる電子計算機として、例えばパーソナルコンピュータ、スマートフォンなどの各種携帯情報端末、および携帯電話などが挙げられる。
また、専用に設計されたハードウェアは、携帯電話や固定電話などの完成品レベル(コンシューマエレクトロニクス)に限らず、システムボードや半導体素子など、半完成品や部品レベルをも含むものである。
なお、本開示を基地局で用いる場合の例として、基地局で音声符号化方式を変更するトランスコーディングを行う場合が挙げられる。なお、基地局とは、通信回線の途中に存在する各種ノードを包含する概念である。
本開示にかかる符号化装置および復号装置は、音声信号やオーディオ信号の記録、伝送、再生に関係する機器に応用が可能である。
100,110,610 符号化装置
101 ダウンサンプリング部
102 第1レイヤ符号化部
103,113,613 多重化部
104 第1レイヤ復号部
105 遅延部
106 第2レイヤ符号化部
201,301 雑音加算部
202,302 分離部
203 帯域拡張部
204 雑音成分エネルギー算出部(第1計算部)
205 ゲイン算出部(第2計算部)
206 エネルギー計算部
207 多重化部
208 帯域拡張部
400,410,620 復号装置
401,411 分離部
402 第1レイヤ復号部
403 第2レイヤ復号部
501 復号・分離部
502,602 雑音加算部
503,603 分離部
504 帯域拡張部
505 スケーリング部
506 結合部
507 加算部
508 帯域拡張部
509 結合部
510 トーナル信号エネルギー推定部
511 スケーリング部
112,612 第1符号化部
115,614 第2符号化部
412,621 第1復号部
413,622 第2復号部

Claims (17)

  1. 音声またはオーディオ入力信号の所定周波数以下の低域信号を符号化して第1符号化信号を生成し、前記第1符号化信号を復号して低域復号信号を生成する第1符号化部と、
    前記低域復号信号に基づいて、前記低域信号より高域の信号を符号化して高域符号化信号を生成する第2符号化部と、
    前記第1符号化信号と前記高域符号化信号とを多重化して符号化信号を出力する第1の多重化部、とを有し、
    前記第2符号化部は、
    前記高域信号の雑音成分である高域雑音成分と、前記低域復号信号から生成された高域復号信号の高域非トーナル成分とのエネルギー比率を算出して、高域符号化信号として出力する、
    符号化装置。
  2. 前記音声またはオーディオ入力信号のエネルギーを計算して量子化バンドエネルギーとして出力するエネルギー計算部と、を更に備え、
    前記第1の多重化部は、前記量子化バンドエネルギーと前記第1符号化信号と前記高域符号化信号とを多重化して出力する、
    請求項1に記載の符号化装置。
  3. 前記第2符号化部は、
    前記低域復号信号を、前記低域復号信号の非トーナル成分である低域非トーナル信号と、前記低域復号信号のトーナル成分である低域トーナル信号と、に分離する分離部と、
    前記高域信号と前記低域トーナル信号との間の相関を最大とする特定の帯域の位置情報をラグ情報として出力する第1の帯域拡張部と、
    前記ラグ情報に対応する前記低域非トーナル信号を高域非トーナル信号として出力する第2の帯域拡張部と、
    前記ラグ情報に対応する前記高域信号から、雑音成分である高域雑音成分のエネルギーを計算する第1計算部と、
    前記比率を前記高域雑音成分と前記高域非トーナル信号とのエネルギー比率から算出し、スケールファクタとして出力する第2計算部と、
    前記ラグ情報および前記スケールファクタを多重化して高域符号化信号として出力する第2の多重化部と、を有する、
    請求項2記載の符号化装置。
  4. 前記第2符号化部は、
    前記低域復号信号に雑音信号を加算する雑音加算部をさらに有する、
    請求項3記載の符号化装置。
  5. 前記第2符号化部は、
    前記分離部から出力された前記低域非トーナル信号に雑音信号を加算する雑音加算部をさらに有する、
    請求項3記載の符号化装置。
  6. 符号化装置において、音声またはオーディオ入力信号の所定周波数以下の低域信号を符号化した第1符号化信号、および前記低域信号より高域の信号を符号化した高域符号化信号が入力される復号装置であって、
    前記第1符号化信号および前記高域符号化信号に分離する分離部と、
    前記第1符号化信号を復号して低域復号信号を生成する第1復号部と、
    前記高域符号化信号を復号し、前記低域復号信号を用いて広帯域復号信号を生成する第2復号部と、を有し、
    前記高域符号化信号は、雑音成分である高域雑音成分と、前記低域復号信号から生成された高域復号信号の高域非トーナル成分とのエネルギー比率を含み、
    前記第2復号部は、
    復号された前記比率を参照して前記低域復号信号の非トーナル成分である低域非トーナル信号の振幅を調整する、
    復号装置。
  7. 符号化装置において、音声またはオーディオ入力信号の所定周波数以下の低域信号を符号化した第1符号化信号、前記低域信号よりも高域の信号を符号化した高域符号化信号、およびバンドエネルギー符号化信号が入力される復号装置であって、
    前記第1符号化信号を復号して低域復号信号を生成する第1復号部と、
    前記高域符号化信号を復号し、前記低域復号信号を用いて広帯域復号信号を生成する第2復号部と、
    前記バンドエネルギー符号化信号を復号して量子化バンドエネルギーを生成する第3復号部と、を有し、
    前記第2復号部は、
    前記低域復号信号を、前記低域復号信号の非トーナル成分である低域非トーナル信号と、前記低域復号信号のトーナル成分である低域トーナル信号とに分離する分離部と、
    前記高域符号化信号を復号して得られるラグ情報を用いて前記低域非トーナル信号を高域にコピーして高域非トーナル信号を生成する第1の帯域拡張部と、
    前記高域符号化信号を復号して得られるスケールファクタを用いて前記高域非トーナル信号の振幅を調整する第1のスケーリング部と、
    前記高域非トーナル信号のエネルギーと前記量子化バンドエネルギーとから、高域トーナル信号のエネルギーを推定するトーナル信号エネルギー推定部と、
    前記低域非トーナル信号と前記高域非トーナル信号を結合して広帯域非トーナル信号を生成する第1の結合部と、
    前記ラグ情報を用いて前記低域トーナル信号を高域にコピーして高域トーナル信号を生成する第2の帯域拡張部と、
    前記高域トーナル信号のエネルギーに基づき、前記高域トーナル信号の振幅を調整する第2のスケーリング部と、
    前記低域トーナル信号と振幅を調整された前記高域トーナル信号を結合して広帯域トーナル信号を生成する第2の結合部と、
    前記広帯域非トーナル信号と前記広帯域トーナル信号とを加算して広帯域復号信号を生成する加算部と、を有し、
    前記ラグ情報は、高域信号と低域トーナル信号との間の相関を最大とする特定の帯域の位置情報であり、
    前記スケールファクタは、前記ラグ情報に対応する高域信号の雑音成分である高域雑音成分と高域非トーナル信号とのエネルギー比率である、
    復号装置。
  8. 前記第2復号部は、
    前記低域復号信号に雑音信号を加算する雑音加算部をさらに有する、
    請求項6記載の復号装置。
  9. 前記第2復号部は、
    前記分離部から出力された前記低域非トーナル信号に雑音信号を加算する雑音加算部をさらに有する、
    請求項6記載の復号装置。
  10. 請求項1に記載の符号化装置を有する端末装置。
  11. 請求項6に記載の復号装置を有する端末装置。
  12. 音声またはオーディオ入力信号の所定周波数以下の低域信号を符号化して第1符号化信号を生成し、
    前記第1符号化信号を復号して低域復号信号を生成し、
    前記低域復号信号に基づいて、前記低域信号より高域の信号を符号化して高域符号化信号を生成し、
    前記高域信号の雑音成分である高域雑音成分と、前記低域復号信号から生成された高域復号信号の高域非トーナル成分とのエネルギー比率を算出し、
    前記第1符号化信号と、前記比率を含む高域符号化信号とを多重化して符号化信号を出力する、
    符号化方法。
  13. 請求項12に記載の符号化方法は、
    前記音声またはオーディオ入力信号のエネルギーを計算して量子化バンドエネルギーとして出力し、
    前記低域復号信号を、前記低域復号信号の非トーナル成分である低域非トーナル信号と、前記低域復号信号のトーナル成分である低域トーナル信号と、に分離し、
    前記高域信号と前記低域トーナル信号との間の相関を最大とする特定の帯域の位置情報をラグ情報として出力し、
    前記ラグ情報に対応する前記低域非トーナル信号を高域非トーナル信号として出力し、
    前記ラグ情報に対応する前記高域信号から、雑音成分である高域雑音成分のエネルギーを計算し、
    前記高域雑音成分と前記高域非トーナル信号とのエネルギー比率を算出してスケールファクタとして出力する、
    符号化方法。
  14. 符号化装置において音声またはオーディオ入力信号の所定周波数以下の低域信号を符号化した第1符号化信号、および前記低域信号より高域の信号を符号化した高域符号化信号について、
    前記第1符号化信号および前記高域符号化信号に分離し、
    前記第1符号化信号を復号して低域復号信号を生成し、
    前記高域符号化信号を復号し、前記低域復号信号を用いて広帯域復号信号を生成し、
    前記高域符号化信号は、雑音成分である高域雑音成分と、前記低域復号信号から生成された高域復号信号の高域非トーナル成分とのエネルギー比率を含み、
    復号された前記比率を生成し、前記比率を参照して前記低域復号信号の非トーナル成分である低域非トーナル信号の振幅を調整する、
    復号方法。
  15. 符号化装置において音声またはオーディオ入力信号の所定周波数以下の低域信号を符号化した第1符号化信号、前記低域信号より高域の信号を符号化した高域符号化信号、およびバンドエネルギー符号化信号について、
    前記第1符号化信号を復号して低域復号信号を生成し、
    前記高域符号化信号を復号し、前記低域復号信号を用いて広帯域復号信号を生成し、
    前記バンドエネルギー符号化信号を復号して量子化バンドエネルギーを生成し、
    前記低域復号信号を、前記低域復号信号の非トーナル成分である低域非トーナル信号と、前記低域復号信号のトーナル成分である低域トーナル信号と、に分離し、
    前記高域符号化信号を復号して得られるラグ情報を用いて前記低域非トーナル信号を高域にコピーして高域非トーナル信号を生成し、
    前記高域符号化信号を復号して得られるスケールファクタを用いて前記高域非トーナル信号の振幅を調整し、
    前記高域非トーナル信号のエネルギーと前記量子化バンドエネルギーとから、高域トーナル信号のエネルギーを推定し、
    前記低域非トーナル信号と前記高域非トーナル信号を結合して広帯域非トーナル信号を生成し、
    前記ラグ情報を用いて前記低域トーナル信号を高域にコピーして高域トーナル信号を生成し、
    前記高域トーナル信号のエネルギーに基づき、前記高域トーナル信号の振幅を調整し、
    前記低域トーナル信号と振幅を調整された前記高域トーナル信号を結合して広帯域トーナル信号を生成し、
    前記広帯域非トーナル信号と前記広帯域トーナル信号とを加算して広帯域復号信号を生成し、
    前記ラグ情報は、高域信号と低域トーナル信号との間の相関を最大とする特定の帯域の位置情報であり、
    前記スケールファクタは、前記ラグ情報に対応する高域信号の雑音成分である高域雑音成分と高域非トーナル信号とのエネルギー比率である、
    復号方法。
  16. 音声またはオーディオの入力信号の所定周波数以下の低域信号を符号化して第1符号化信号を生成する処理と、
    前記第1符号化信号を復号して低域復号信号を生成する処理と、
    前記低域復号信号に基づいて、前記低域信号より高域の信号を符号化して高域符号化信号を生成する処理と、
    前記高域信号の雑音成分である高域雑音成分と、前記低域復号信号から生成された高域復号信号の高域非トーナル成分とのエネルギー比率を算出する処理と、
    前記第1符号化信号と、前記比率を含む高域符号化信号とを多重化して符号化信号を出力する処理と、をプロセッサに実行させるプログラム。
  17. 符号化装置において音声またはオーディオの入力信号の所定周波数以下の低域信号を符号化した第1符号化信号、および前記低域信号より高域の信号を符号化した高域符号化信号について、
    前記第1符号化信号および前記高域符号化信号に分離する処理と、
    前記第1符号化信号を復号して低域復号信号を生成する処理と、
    前記高域符号化信号を復号し、前記低域復号信号を用いて広帯域復号信号を生成する処理と、
    前記高域符号化信号は、雑音成分である高域雑音成分と、前記低域復号信号から生成された高域復号信号の高域非トーナル成分とのエネルギー比率を含み、
    復号された前記比率を生成し、前記比率を参照して前記低域復号信号の非トーナル成分である低域非トーナル信号の振幅を調整する処理と、をプロセッサに実行させるプログラム。
JP2016511368A 2014-03-31 2015-03-23 符号化装置、復号装置、符号化方法、復号方法、およびプログラム Pending JPWO2015151451A1 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201461972722P 2014-03-31 2014-03-31
US61/972,722 2014-03-31
JP2014153832 2014-07-29
JP2014153832 2014-07-29
PCT/JP2015/001601 WO2015151451A1 (ja) 2014-03-31 2015-03-23 符号化装置、復号装置、符号化方法、復号方法、およびプログラム

Publications (1)

Publication Number Publication Date
JPWO2015151451A1 true JPWO2015151451A1 (ja) 2017-04-13

Family

ID=54239798

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016511368A Pending JPWO2015151451A1 (ja) 2014-03-31 2015-03-23 符号化装置、復号装置、符号化方法、復号方法、およびプログラム

Country Status (10)

Country Link
US (3) US10269361B2 (ja)
EP (2) EP3128513B1 (ja)
JP (1) JPWO2015151451A1 (ja)
KR (1) KR102121642B1 (ja)
CN (2) CN105874534B (ja)
BR (1) BR112016019838B1 (ja)
MX (1) MX367639B (ja)
PL (1) PL3128513T3 (ja)
RU (1) RU2689181C2 (ja)
WO (1) WO2015151451A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2689181C2 (ru) * 2014-03-31 2019-05-24 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодер, декодер, способ кодирования, способ декодирования и программа
EP3174050B1 (en) 2014-07-25 2018-11-14 Fraunhofer Gesellschaft zur Förderung der Angewand Audio signal coding apparatus, audio signal decoding device, and methods thereof
ES2823250T3 (es) * 2014-07-25 2021-05-06 Fraunhofer Ges Forschung Aparato de codificación de señal de audio, dispositivo de decodificación de señal de audio y métodos del mismo
JP6691440B2 (ja) * 2016-06-21 2020-04-28 日本電信電話株式会社 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、プログラム、および記録媒体
CN113192523A (zh) * 2020-01-13 2021-07-30 华为技术有限公司 一种音频编解码方法和音频编解码设备

Family Cites Families (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3277699B2 (ja) * 1994-06-13 2002-04-22 ソニー株式会社 信号符号化方法及び装置並びに信号復号化方法及び装置
JP3557674B2 (ja) * 1994-12-15 2004-08-25 ソニー株式会社 高能率符号化方法及び装置
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
JP4173940B2 (ja) 1999-03-05 2008-10-29 松下電器産業株式会社 音声符号化装置及び音声符号化方法
DE60202881T2 (de) * 2001-11-29 2006-01-19 Coding Technologies Ab Wiederherstellung von hochfrequenzkomponenten
US7333930B2 (en) * 2003-03-14 2008-02-19 Agere Systems Inc. Tonal analysis for perceptual audio coding using a compressed spectral representation
CN1677492A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
EP3336843B1 (en) 2004-05-14 2021-06-23 Panasonic Intellectual Property Corporation of America Speech coding method and speech coding apparatus
CN101656073B (zh) * 2004-05-14 2012-05-23 松下电器产业株式会社 解码装置、解码方法以及通信终端和基站装置
WO2006107833A1 (en) * 2005-04-01 2006-10-12 Qualcomm Incorporated Method and apparatus for vector quantizing of a spectral envelope representation
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
CN101371297A (zh) * 2006-01-18 2009-02-18 Lg电子株式会社 用于编码和解码信号的设备和方法
EP1979901B1 (de) * 2006-01-31 2015-10-14 Unify GmbH & Co. KG Verfahren und anordnungen zur audiosignalkodierung
JP2008058727A (ja) * 2006-08-31 2008-03-13 Toshiba Corp 音声符号化装置
EP2063418A4 (en) * 2006-09-15 2010-12-15 Panasonic Corp AUDIO CODING DEVICE AND AUDIO CODING METHOD
US8015368B2 (en) * 2007-04-20 2011-09-06 Siport, Inc. Processor extensions for accelerating spectral band replication
US8990073B2 (en) 2007-06-22 2015-03-24 Voiceage Corporation Method and device for sound activity detection and sound signal classification
US9177569B2 (en) * 2007-10-30 2015-11-03 Samsung Electronics Co., Ltd. Apparatus, medium and method to encode and decode high frequency signal
US20100280833A1 (en) * 2007-12-27 2010-11-04 Panasonic Corporation Encoding device, decoding device, and method thereof
DE102008015702B4 (de) * 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
EP2863390B1 (en) * 2008-03-05 2018-01-31 Voiceage Corporation System and method for enhancing a decoded tonal sound signal
ES2422412T3 (es) * 2008-07-11 2013-09-11 Fraunhofer Ges Forschung Codificador de audio, procedimiento para la codificación de audio y programa de ordenador
JP5203077B2 (ja) * 2008-07-14 2013-06-05 株式会社エヌ・ティ・ティ・ドコモ 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
PL2945159T3 (pl) * 2008-12-15 2018-08-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder audio i dekoder powiększania szerokości pasma
CN102334159B (zh) * 2009-02-26 2014-05-14 松下电器产业株式会社 编码装置、解码装置及其方法
ES2400661T3 (es) * 2009-06-29 2013-04-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificación y decodificación de extensión de ancho de banda
AU2014201331B2 (en) * 2009-06-29 2015-10-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Bandwidth extension encoder, bandwidth extension decoder and phase vocoder
FR2947945A1 (fr) * 2009-07-07 2011-01-14 France Telecom Allocation de bits dans un codage/decodage d'amelioration d'un codage/decodage hierarchique de signaux audionumeriques
JP5493655B2 (ja) 2009-09-29 2014-05-14 沖電気工業株式会社 音声帯域拡張装置および音声帯域拡張プログラム
US8306493B2 (en) 2010-04-13 2012-11-06 Newport Media, Inc. Pilot based adaptation for FM radio receiver
JP5652658B2 (ja) * 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
MX2012011828A (es) * 2010-04-16 2013-02-27 Fraunhofer Ges Forschung Aparato, metodo y programa de computadora para generar una señal de banda amplia que utiliza extension de ancho de banda guiada y extension oculta de ancho de banda.
US20130101028A1 (en) 2010-07-05 2013-04-25 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, device, program, and recording medium
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
CN102436820B (zh) * 2010-09-29 2013-08-28 华为技术有限公司 高频带信号编码方法及装置、高频带信号解码方法及装置
KR102053900B1 (ko) * 2011-05-13 2019-12-09 삼성전자주식회사 노이즈 필링방법, 오디오 복호화방법 및 장치, 그 기록매체 및 이를 채용하는 멀티미디어 기기
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
BR112013033900B1 (pt) * 2011-06-30 2022-03-15 Samsung Electronics Co., Ltd Método para gerar um sinal estendido de largura de banda para decodificação de áudio
CN102208188B (zh) * 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
CN106847295B (zh) * 2011-09-09 2021-03-23 松下电器(美国)知识产权公司 编码装置和编码方法
EP2791937B1 (en) * 2011-11-02 2016-06-08 Telefonaktiebolaget LM Ericsson (publ) Generation of a high band extension of a bandwidth extended audio signal
CN103187065B (zh) * 2011-12-30 2015-12-16 华为技术有限公司 音频数据的处理方法、装置和系统
EP2954516A1 (en) * 2013-02-05 2015-12-16 Telefonaktiebolaget LM Ericsson (PUBL) Enhanced audio frame loss concealment
JP2014153832A (ja) 2013-02-06 2014-08-25 Seiko Instruments Inc 携帯型電子機器用のカバー
CN105408957B (zh) * 2013-06-11 2020-02-21 弗朗霍弗应用研究促进协会 进行语音信号的频带扩展的装置及方法
US9615185B2 (en) * 2014-03-25 2017-04-04 Bose Corporation Dynamic sound adjustment
RU2689181C2 (ru) * 2014-03-31 2019-05-24 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодер, декодер, способ кодирования, способ декодирования и программа

Also Published As

Publication number Publication date
EP3550563A1 (en) 2019-10-09
EP3128513B1 (en) 2019-05-15
BR112016019838A2 (ja) 2017-08-15
WO2015151451A1 (ja) 2015-10-08
EP3128513A4 (en) 2017-03-29
MX367639B (es) 2019-08-29
EP3128513A1 (en) 2017-02-08
US20160336017A1 (en) 2016-11-17
CN105874534A (zh) 2016-08-17
CN111710342A (zh) 2020-09-25
EP3550563B1 (en) 2024-03-06
EP3550563C0 (en) 2024-03-06
KR102121642B1 (ko) 2020-06-10
CN105874534B (zh) 2020-06-19
US20190251979A1 (en) 2019-08-15
BR112016019838B1 (pt) 2023-02-23
KR20160138373A (ko) 2016-12-05
CN111710342B (zh) 2024-04-16
US10269361B2 (en) 2019-04-23
MX2016010595A (es) 2016-11-29
RU2689181C2 (ru) 2019-05-24
RU2016138694A3 (ja) 2018-08-27
PL3128513T3 (pl) 2019-11-29
US11232803B2 (en) 2022-01-25
RU2016138694A (ru) 2018-05-07
US20220130402A1 (en) 2022-04-28

Similar Documents

Publication Publication Date Title
US7983904B2 (en) Scalable decoding apparatus and scalable encoding apparatus
JP6306565B2 (ja) 帯域幅拡張のための高周波数符号化/復号化方法及びその装置
US20190027155A1 (en) Voice audio encoding device, voice audio decoding device, voice audio encoding method, and voice audio decoding method
US11521625B2 (en) Audio signal coding apparatus, audio signal decoding apparatus, audio signal coding method, and audio signal decoding method
US11232803B2 (en) Encoding device, decoding device, encoding method, decoding method, and non-transitory computer-readable recording medium
JPWO2009093466A1 (ja) 符号化装置、復号装置およびこれらの方法
US9230551B2 (en) Audio encoder or decoder apparatus
WO2015129165A1 (ja) 復号装置、符号化装置、復号方法、符合化方法、端末装置、および基地局装置
JP6957444B2 (ja) 音響信号符号化装置、音響信号復号装置、音響信号符号化方法および音響信号復号方法
WO2011058752A1 (ja) 符号化装置、復号装置およびこれらの方法
JP2011242788A (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20180323

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180710

A917 Reason for reinstatement of right to file examination request

Free format text: JAPANESE INTERMEDIATE CODE: A917

Effective date: 20180710

A917 Reason for reinstatement of right to file examination request

Free format text: JAPANESE INTERMEDIATE CODE: A917

Effective date: 20181130

A59 Written plea

Free format text: JAPANESE INTERMEDIATE CODE: A59

Effective date: 20190610

A59 Written plea

Free format text: JAPANESE INTERMEDIATE CODE: A59

Effective date: 20190607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20190610

A59 Written plea

Free format text: JAPANESE INTERMEDIATE CODE: A59

Effective date: 20190610