JP5265853B2 - 処理装置、処理方法、記録媒体、符号化方法及び復号化方法 - Google Patents
処理装置、処理方法、記録媒体、符号化方法及び復号化方法 Download PDFInfo
- Publication number
- JP5265853B2 JP5265853B2 JP2005348034A JP2005348034A JP5265853B2 JP 5265853 B2 JP5265853 B2 JP 5265853B2 JP 2005348034 A JP2005348034 A JP 2005348034A JP 2005348034 A JP2005348034 A JP 2005348034A JP 5265853 B2 JP5265853 B2 JP 5265853B2
- Authority
- JP
- Japan
- Prior art keywords
- subband
- information
- similarity
- audio signal
- similar
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012545 processing Methods 0.000 title claims abstract description 33
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000003672 processing method Methods 0.000 title claims description 23
- 230000005236 sound signal Effects 0.000 claims abstract description 126
- 238000001914 filtration Methods 0.000 claims abstract description 18
- 238000013139 quantization Methods 0.000 claims description 37
- 238000004458 analytical method Methods 0.000 claims description 30
- 238000007689 inspection Methods 0.000 claims description 11
- 238000010606 normalization Methods 0.000 claims description 7
- 230000015572 biosynthetic process Effects 0.000 claims description 6
- 230000003362 replicative effect Effects 0.000 claims description 6
- 238000003786 synthesis reaction Methods 0.000 claims description 6
- 238000012856 packing Methods 0.000 claims description 5
- 210000000746 body region Anatomy 0.000 claims 1
- 239000000284 extract Substances 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 9
- 238000007796 conventional method Methods 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
この処理方法は、入力オーディオ信号を符号化するオーディオ信号の処理方法であって、入力オーディオ信号をサブバンドフィルタリングするステップ(ステップ70)と、サブバンドフィルタリングしたものに含まれる第1サブバンドごとに最も類似するサブバンドを探して、それらについての情報を生成するステップ(ステップ72)と、聴感特性(聴覚の敏感度)の分析を行った結果を利用して量子化を行うステップ(ステップ74及びステップ76)と、量子化したものを無損失符号化し、ビットパッキングを行うステップ(ステップ78)とからなる。
12 復号化部
30 サブバンドフィルタ分析部
32 類似度分析部
34 量子化部
36 出力部
38 量子化制御部
50 入力部
52 逆量子化部
54 高周波成分復元部
56 サブバンドフィルタ合成部
110 類似度算出部
112,154 サブバンド選択部
113,150 サブバンド比較選択部
114,152 比較部
116,156 情報生成部
180 類似検査部
182 データ複製部
184 ランダムノイズ生成部
186 正規化部
IN1〜IN5 入力端子
OUT1〜OUT3 出力端子
Claims (19)
- 入力オーディオ信号を符号化する符号化部及び符号化された前記入力オーディオ信号を復号化する復号化部を有するオーディオ信号処理装置において、
前記符号化部は、
複数の第1サブバンドの各第1サブバンドごとに当該第1サブバンドと所定値以上の類似度を有する最も類似するサブバンドを複数の第2サブバンドのうちから探し、前記最も類似するサブバンドの情報を生成する類似度分析部と、
前記入力オーディオ信号をサブバンドフィルタリングしたものと、前記最も類似するサブバンドの情報とを量子化する量子化部とを含み、
前記復号化部は、
前記量子化部で量子化された後にビットストリーム形式で前記入力オーディオ信号をサブバンドフィルタリングしたものとともに伝送された前記最も類似するサブバンドの情報を逆量子化し、該最も類似するサブバンドの情報を利用して、前記最も類似するサブバンドについてのデータを対応する第1サブバンドについてのデータとして複製して、前記第1サブバンドを復号化する高周波成分復元部を含み、
前記第1サブバンドは、前記入力オーディオ信号をサブバンドフィルタリングしたものの帯域のうち高周波数帯域に属するサブバンドであり、前記第2サブバンドは、前記サブバンドフィルタリングしたものの帯域のうち低周波数帯域に属するサブバンドであり、
前記類似度分析部は、
前記サブバンドフィルタリングしたものの帯域を基準周波数を基準として前記高周波数帯域と前記低周波数帯域とに区分し、前記区分した高周波数帯域に属する前記複数の第1サブバンドの各第1サブバンドごとに当該第1サブバンドと前記複数の第2サブバンドの夫々との類似度を算出する類似度算出部と、
各第1サブバンドごとに算出された前記類似度のうち、前記所定値以上である最も大きい類似度を算出するときに用いた第2サブバンドを選択するサブバンド比較選択部と、
前記選択された第2サブバンドについての情報と、各第1サブバンドごとに算出された前記類似度において前記所定値以上である類似度が存在するか否を示す情報と、前記第1サブバンドのノイズ電力についての情報とを含む前記最も類似するサブバンドの情報を生成する情報生成部と、
を備え、
前記高周波成分復元部は、
各第1サブバンドごとに算出された前記類似度において前記所定値以上である類似度が存在するか否を示す情報に基づき、前記複数の第1サブバンドの夫々が前記最も類似するサブバンドを有するか否かを検査する類似検査部と、
前記検査結果に応じて、前記選択された第2サブバンドについての情報に相当するデータを前記第1サブバンドについてのデータとして複製するデータ複製部と、
前記検査結果に応じて、前記第1サブバンドについてのノイズをランダムに生成するランダムノイズ生成部と、
前記第1サブバンドについての、前記第1サブバンドのノイズ電力についての情報に基づく総ノイズ電力が同一に維持されるように、前記複製したデータと前記ランダムに生成したノイズとを正規化し、正規化したものを出力する正規化部と、
を備えることを特徴とするオーディオ信号処理装置。 - 前記符号化部は、
前記入力オーディオ信号をサブバンドフィルタリングし、前記サブバンドフィルタリングしたものを前記類似度分析部へ出力するサブバンドフィルタ分析部と、
前記量子化部において量子化されたものを無損失符号化及びビットパッキングして、ビットストリーム形式で前記復号化部に伝送する出力部と、
を備えることを特徴とする請求項1に記載のオーディオ信号処理装置。 - 前記符号化部は、
前記サブバンドフィルタ分析部から入力された前記サブバンドフィルタリングしたものから分析した聴感特性に従ってステップサイズ制御信号を生成し、前記ステップサイズ制御信号を前記量子化部へ出力する量子化制御部をさらに備え、
前記量子化部は、前記ステップサイズ制御信号に応じて量子化ステップサイズを調節することを特徴とする請求項2に記載のオーディオ信号処理装置。 - 前記復号化部は、
前記出力部から伝送されたビットストリームを受信してビットアンパッキングし、無損失復号化し、各種情報を抽出する入力部と、
前記無損失符号化したものを逆量子化し、逆量子化したものを前記高周波成分復元部へ出力する逆量子化部と、
前記高周波成分復元部から入力された前記複製したデータを有する前記第1サブバンド及び前記逆量子化したものをサブバンドフィルタリングし、サブバンドフィルタリングしたものを、前記入力オーディオ信号を復元したオーディオ信号として出力するサブバンドフィルタ合成部と、をさらに備え、
前記高周波成分復元部は、前記逆量子化したものに含まれる前記第2サブバンドについてのデータのうち、前記抽出した各種情報に含まれる前記最も類似するサブバンドの情報に相当するデータを、前記第1サブバンドについてのデータとして複製することを特徴とする請求項2に記載のオーディオ信号処理装置。 - 前記サブバンド比較選択部は、
各第1サブバンドごとに算出した前記類似度のうち、最も大きい類似度を算出するときに用いた第2サブバンドを選択するサブバンド選択部と、
各第1サブバンドごとに前記選択した第2サブバンドを使用して算出した前記類似度を前記所定値と比較する比較部と、を備え、
前記情報生成部は、前記比較部での比較結果に応じて、前記選択した第2サブバンドについての情報を生成することを特徴とする請求項1に記載のオーディオ信号処理装置。 - 前記サブバンド比較選択部は、
各第1サブバンドごとに求めた前記類似度と前記所定値とを比較する比較部と、
前記比較部での比較結果に応じて、前記所定値以上の類似度のうち最も大きい類似度を算出するときに用いた第2サブバンドを選択するサブバンド選択部と、を備え、
前記情報生成部は、前記サブバンド選択部によって選択された第2サブバンドについての情報を生成することを特徴とする請求項1に記載のオーディオ信号処理装置。 - 前記基準周波数は、変更可能であることを特徴とする請求項1に記載のオーディオ信号処理装置。
- (a)入力オーディオ信号を符号化するとき、複数の第1サブバンドの各第1サブバンドごとに当該第1サブバンドと所定値以上の類似度を有する最も類似するサブバンドを第2サブバンドのうちから探し、前記最も類似するサブバンドの情報を生成し、該最も類似するサブバンドの情報の情報及び前記入力オーディオ信号をサブバンドフィルタリングしたものを量子化するステップと、
(b)符号化された前記入力オーディオ信号を復号化するとき、前記量子化後にビットストリーム形式で前記入力オーディオ信号をサブバンドフィルタリングしたものとともに伝送された前記最も類似するサブバンドの情報を逆量子化し、該最も類似するサブバンドの情報を利用して、前記最も類似するサブバンドについてのデータを対応する第1サブバンドについてのデータとして複製して、前記第1サブバンドを復号化するステップと、を含み、
前記第1サブバンドは、前記入力オーディオ信号をサブバンドフィルタリングしたものの帯域のうち高周波数帯域に属するサブバンドであり、前記第2サブバンドは、前記サブバンドフィルタリングしたものの帯域のうち低周波数帯域に属するサブバンドであり、
前記(a)ステップは、
(a1)前記サブバンドフィルタリングしたものの帯域を基準周波数を基準として前記高周波数帯域と前記低周波数帯域とに区分し、前記区分した高周波数帯域に属する前記複数の第1サブバンドの各第1サブバンドごとに当該第1サブバンドと前記複数の第2サブバンドの夫々との類似度を求めるステップと、
(a2)前記第1サブバンドごとに求めた前記類似度のうち、前記所定値以上である最も大きい類似度を求めるときに用いた第2サブバンドを選択するステップと、
(a3)前記選択した第2サブバンドについての情報と、前記第1サブバンドごとに求めた前記類似度において前記所定値以上である類似度が存在するか否を示す情報と、前記第1サブバンドのノイズ電力についての情報とを含む前記最も類似するサブバンドの情報を生成するステップと、
を含み、
前記(b)ステップは、
前記第1サブバンドごとに求めた前記類似度において前記所定値以上である類似度が存在するか否を示す情報に基づき、前記複数の第1サブバンドの夫々が前記最も類似するサブバンドを有するか否かを判断するステップと、
前記複数の第1サブバンドの夫々が前記最も類似するサブバンドを有することが判断される場合、前記選択した第2サブバンドについての情報に含まれるデータを前記第1サブバンドについてのデータとして複製するステップと、
前記第1サブバンドが前記最も類似するサブバンドを有しないことが判断される場合、前記第1サブバンドについてのノイズをランダムに生成するステップと、
前記複製したデータ及び前記ランダムに生成したノイズを正規化し、前記第1サブバンドについての、前記第1サブバンドのノイズ電力についての情報に基づく総ノイズ電力を同一に維持するステップと、
を含むことを特徴とするオーディオ信号の処理方法。 - 前記入力オーディオ信号をサブバンドフィルタリングし、前記(a)ステップに進むステップと、
前記(a)ステップの後に、
前記量子化したものを無損失符号化及びビットパッキングしてビットストリーム形式で伝送するステップと、
を含むことを特徴とする請求項8に記載のオーディオ信号の処理方法。 - 前記オーディオ信号の処理方法は、
前記サブバンドフィルタリングしたものから聴感特性の分析を行うステップをさらに含み、
前記サブバンドフィルタリングしたものを量子化するとき、前記分析によって量子化ステップサイズを調節することを特徴とする請求項9に記載のオーディオ信号の処理方法。 - 前記伝送されたビットストリームを受信してビットアンパッキングし、無損失復号化し、各種情報を抽出するステップと、
前記無損失符号化したものを逆量子化し、前記(b)ステップに進むステップと、
前記(b)ステップの後に、前記複製されたデータを有する前記第1サブバンド及び前記逆量子化したものをサブバンドフィルタリングし、フィルタリングしたものを、前記入力オーディオ信号を復元したオーディオ信号として決定するステップと、をさらに含み、
前記(b)ステップは、前記逆量子化したものに含まれる前記第2サブバンドについてのデータのうち、前記抽出された各種情報に含まれる前記最も類似するサブバンドの情報に該当するデータを前記第1サブバンドについてのデータとして複製することを特徴とする請求項9に記載のオーディオ信号の処理方法。 - 前記(a2)ステップは、
各第1サブバンドごとに求めた前記類似度のうち、最も大きい類似度を求めるときに用いた第2サブバンドを選択するステップと、
各第1サブバンドごとに前記選択した第2サブバンドを使用して求めた前記類似度が前記所定値以上であるか否かを判断するステップと、を含み、
前記類似度が前記所定値以上であると判断される場合、前記(a3)ステップで前記選択した第2サブバンドについての情報及び前記第1サブバンドごとに求めた前記類似度において前記所定値以上である類似度が存在することを示す情報を生成することを特徴とする請求項8に記載のオーディオ信号の処理方法。 - 前記(a2)ステップは、
各第1サブバンドごとに求めた前記類似度のうち、前記所定値以上の類似度が存在するか否かを判断するステップと、
前記所定値以上の類似度が存在することが判断される場合、前記所定値以上の類似度のうち、最も大きい類似度を算出するときに用いた第2サブバンドを選択するステップと、を含み、
前記(a3)ステップで、前記第1サブバンドごとに求めた前記類似度において前記所定値以上である類似度が存在しないことを示す情報を生成することを特徴とする請求項8記載のオーディオ信号の処理方法。 - 前記類似度は、次式により求められることを特徴とする請求項8に記載のオーディオ信号の処理方法。
(ここで、abs()は、()内の絶対値を意味し、sb1は、前記第2サブバンドのインデックスであって0〜k−1から選ばれ、kは、前記低周波数帯域に属する前記複数の第2サブバンドの数を意味し、sb2は、前記複数の第1サブバンドの夫々のインデックスを表し、Iは、前記第1サブバンドまたは前記第2サブバンドに属するタイムドメインサンプルの数を表し、samp[sb1][i]は、sb1番目の第2サブバンドにあるi番目のタイムドメインサンプルを表し、samp[sb2][i]は、sb2番目の第1サブバンドにあるi番目のタイムドメインサンプルを表す。) - オーディオ信号の処理方法を実行するためのプログラムを記録したコンピュータで読み取り可能な記録媒体であって、
前記プログラムは、前記コンピュータに、
(a)入力オーディオ信号を符号化するとき、複数の第1サブバンドの各第1サブバンドごとに当該第1サブバンドと所定値以上の類似度を有する最も類似するサブバンドを第2サブバンドのうちから探し、前記最も類似するサブバンドの情報を生成し、該最も類似するサブバンドの情報の情報及び前記入力オーディオ信号をサブバンドフィルタリングしたものを量子化するステップと、
(b)符号化された前記入力オーディオ信号を復号化するとき、前記量子化後にビットストリーム形式で前記入力オーディオ信号をサブバンドフィルタリングしたものとともに伝送された前記最も類似するサブバンドの情報を逆量子化し、該最も類似するサブバンドの情報を利用して、前記最も類似するサブバンドについてのデータを対応する第1サブバンドについてのデータとして複製して、前記第1サブバンドを復号化するステップと、を実行させ、
前記第1サブバンドは、前記入力オーディオ信号をサブバンドフィルタリングしたものの帯域のうち高周波数帯域に属するサブバンドであり、前記第2サブバンドは、前記サブバンドフィルタリングしたものの帯域のうち低周波数帯域に属するサブバンドであり、
前記(a)ステップは、
(a1)前記サブバンドフィルタリングしたものの帯域を基準周波数を基準として前記高周波数帯域と前記低周波数帯域とに区分し、前記区分した高周波数帯域に属する前記複数の第1サブバンドの各第1サブバンドごとに当該第1サブバンドと前記複数の第2サブバンドの夫々との類似度を求めるステップと、
(a2)前記第1サブバンドごとに求めた前記類似度のうち、前記所定値以上である最も大きい類似度を求めるときに用いた第2サブバンドを選択するステップと、
(a3)前記選択した第2サブバンドについての情報と、前記第1サブバンドごとに求めた前記類似度において前記所定値以上である類似度が存在するか否を示す情報と、前記第1サブバンドのノイズ電力についての情報とを含む前記最も類似するサブバンドの情報を生成するステップと、
を含み、
前記(b)ステップは、
前記第1サブバンドごとに求めた前記類似度において前記所定値以上である類似度が存在するか否を示す情報に基づき、前記複数の第1サブバンドの夫々が前記最も類似するサブバンドを有するか否かを判断するステップと、
前記複数の第1サブバンドの夫々が前記最も類似するサブバンドを有することが判断される場合、前記選択した第2サブバンドについての情報に含まれるデータを前記第1サブバンドについてのデータとして複製するステップと、
前記第1サブバンドが前記最も類似するサブバンドを有しないことが判断される場合、前記第1サブバンドについてのノイズをランダムに生成するステップと、
前記複製したデータ及び前記ランダムに生成したノイズを正規化し、前記第1サブバンドについての、前記第1サブバンドのノイズ電力についての情報に基づく総ノイズ電力を同一に維持するステップと、
を含むことを特徴とする、記録媒体。 - (a)複数の第1サブバンドの各第1サブバンドごとに当該第1サブバンドと所定値以上の類似度を有する最も類似するサブバンドを複数の第2サブバンドのうちから探し、前記最も類似するサブバンドについての情報を生成し、該最も類似するサブバンドの情報の情報及び前記入力オーディオ信号をサブバンドフィルタリングしたものを量子化することによって、入力オーディオ信号を符号化するステップと
(b)前記量子化後にビットストリーム形式で前記入力オーディオ信号をサブバンドフィルタリングしたものとともに伝送された前記最も類似するサブバンドについての情報を逆量子化し、該最も類似するサブバンドについての情報を利用して、前記最も類似するサブバンドについてのデータを対応する第1サブバンドについてのデータとして複製して前記第1サブバンドを復号化することによって、符号化された前記入力オーディオ信号を復号化するステップと、を含み、
前記第1サブバンドは、前記入力オーディオ信号をサブバンドフィルタリングしたものの帯域のうち高周波数帯域に属するサブバンドであり、前記第2サブバンドは、前記サブバンドフィルタリングしたものの帯域のうち低周波数帯域に属するサブバンドであり、
前記(a)ステップは、
(a1)前記サブバンドフィルタリングしたものの帯域を基準周波数を基準として前記高周波数帯域と前記低周波数帯域とに区分し、前記区分した高周波数帯域に属する前記複数の第1サブバンドの各第1サブバンドごとに当該第1サブバンドと前記複数の第2サブバンドの夫々との類似度を求めるステップと、
(a2)前記第1サブバンドごとに求めた前記類似度のうち、前記所定値以上である最も大きい類似度を求めるときに用いた第2サブバンドを選択するステップと、
(a3)前記選択した第2サブバンドについての情報と、前記第1サブバンドごとに求めた前記類似度において前記所定値以上である類似度が存在するか否を示す情報と、前記第1サブバンドのノイズ電力についての情報とを含む前記最も類似するサブバンドについての情報を生成するステップと、
を含み、
前記(b)ステップは、
前記第1サブバンドごとに求めた前記類似度において前記所定値以上である類似度が存在するか否を示す情報に基づき、前記複数の第1サブバンドの夫々が前記最も類似するサブバンドを有するか否かを判断するステップと、
前記複数の第1サブバンドの夫々が前記最も類似するサブバンドを有することが判断される場合、前記選択した第2サブバンドについての情報に含まれるデータを前記第1サブバンドについてのデータとして複製するステップと、
前記第1サブバンドが前記最も類似するサブバンドを有しないことが判断される場合、前記第1サブバンドについてのノイズをランダムに生成するステップと、
前記複製したデータ及び前記ランダムに生成したノイズを正規化し、前記第1サブバンドについての、前記第1サブバンドのノイズ電力についての情報に基づく総ノイズ電力を同一に維持するステップと、
を含むことを特徴とするオーディオ信号の処理方法。 - オーディオ信号の処理方法を実行するためのプログラムを記録したコンピュータで読み取り可能な記録媒体であって、
前記プログラムは、前記コンピュータに、
(a)複数の第1サブバンドの各第1サブバンドごとに当該第1サブバンドと所定値以上の類似度を有する最も類似するサブバンドを複数の第2サブバンドのうちから探し、前記最も類似するサブバンドについての情報を生成し、該最も類似するサブバンドの情報の情報及び前記入力オーディオ信号をサブバンドフィルタリングしたものを量子化することによって、入力オーディオ信号を符号化するステップと、
(b)前記量子化後にビットストリーム形式で前記入力オーディオ信号をサブバンドフィルタリングしたものとともに伝送された前記最も類似するサブバンドについての情報を逆量子化し、該最も類似するサブバンドについての情報を利用して、前記最も類似するサブバンドについてのデータを対応する第1サブバンドについてのデータとして複製して前記第1サブバンドを復号化することによって、符号化された前記入力オーディオ信号を復号化するステップと、を実行させ、
前記第1サブバンドは、前記入力オーディオ信号をサブバンドフィルタリングしたものの帯域のうち高周波数帯域に属するサブバンドであり、前記第2サブバンドは、前記サブバンドフィルタリングしたものの帯域のうち低周波数帯域に属するサブバンドであり、
前記(a)ステップは、
(a1)前記サブバンドフィルタリングしたものの帯域を基準周波数を基準として前記高周波数帯域と前記低周波数帯域とに区分し、前記区分した高周波数帯域に属する前記複数の第1サブバンドの各第1サブバンドごとに当該第1サブバンドと前記複数の第2サブバンドの夫々との類似度を求めるステップと、
(a2)前記第1サブバンドごとに求めた前記類似度のうち、前記所定値以上である最も大きい類似度を求めるときに用いた第2サブバンドを選択するステップと、
(a3)前記選択した第2サブバンドについての情報と、前記第1サブバンドごとに求めた前記類似度において前記所定値以上である類似度が存在するか否を示す情報と、前記第1サブバンドのノイズ電力についての情報とを含む前記最も類似するサブバンドについての情報を生成するステップと、
を含み、
前記(b)ステップは、
前記第1サブバンドごとに求めた前記類似度において前記所定値以上である類似度が存在するか否を示す情報に基づき、前記複数の第1サブバンドの夫々が前記最も類似するサブバンドを有するか否かを判断するステップと、
前記複数の第1サブバンドの夫々が前記最も類似するサブバンドを有することが判断される場合、前記選択した第2サブバンドについての情報に含まれるデータを前記第1サブバンドについてのデータとして複製するステップと、
前記第1サブバンドが前記最も類似するサブバンドを有しないことが判断される場合、前記第1サブバンドについてのノイズをランダムに生成するステップと、
前記複製したデータ及び前記ランダムに生成したノイズを正規化し、前記第1サブバンドについての、前記第1サブバンドのノイズ電力についての情報に基づく総ノイズ電力を同一に維持するステップと、
を含むことを特徴とする、記録媒体。 - 入力オーディオ信号をサブバンドフィルタリングするステップと、
第1サブバンドごとに、当該第1サブバンドに対して所定値以上の類似度を有する最も類似したサブバンドを第2サブバンドのうちから探し、前記最も類似したサブバンドについての情報を生成するステップと、
前記入力オーディオ信号をサブバンドフィルタリングしたものと、前記最も類似したサブバンドについての情報とを量子化するステップと、
前記量子化された結果を無損失符号化及びビットパッキングしてビットストリーム形式で生成するステップと
を備え、
前記第1サブバンドは、前記入力オーディオ信号をサブバンドフィルタリングした結果、高周波数帯域に属し、前記第2サブバンドは、前記サブバンドフィルタリングした結果、低周波数体域に属し、
前記最も類似したサブバンドについての情報を生成するステップは、
前記サブバンドフィルタリングしたものの帯域を基準周波数を基準として前記高周波数帯域と前記低周波数帯域とに区分し、前記区分した高周波数帯域に属する前記第1サブバンドの各第1サブバンドごとに当該第1サブバンドと前記第2サブバンドの夫々との類似度を求めるステップと、
前記第1サブバンドごとに求めた前記類似度のうち、前記所定値以上である最も大きい類似度を求めるときに用いた第2サブバンドを選択するステップと、
前記選択した第2サブバンドについての情報と、前記第1サブバンドごとに求めた前記類似度において前記所定値以上である類似度が存在するか否を示す情報と、前記第1サブバンドのノイズ電力についての情報とを含む前記最も類似したサブバンドについての情報を生成するステップと、
を含むことを特徴とする、周波数帯域間の類似度を用いたオーディオ信号の符号化方法。 - 第1サブバンドごとに、前記第1サブバンドに対して所定値以上の類似度を有する最も類似した第2サブバンドについての情報と、符号化されたデータとを含むビットストリームを受信して、ビットアンパッキングし、無損失復号化するステップと、
前記無損失復号化された結果を逆量子化するステップと、
前記最も類似した第2サブバンドについての情報を用い、前記逆量子化された結果に含まれた前記第2サブバンドについてのデータのうち、前記第1サブバンドについてのデータを複製して、前記第1サブバンドを復号化するステップと、
前記複製されたデータを有する前記第1サブバンド及び前記逆量子化された結果をサブバンドフィルタリングし、該サブバンドフィルタリングされた結果を、復元されたオーディオ信号として生成するステップと
を備え、
前記第1サブバンドは、高周波数帯域に属するサブバンドであり、前記第2サブバンドは、低周波数帯域に属するサブバンドであり、
前記第1サブバンドを復号化するステップは、
前記最も類似した第2サブバンドについての情報に基づき、前記第1サブバンドの夫々について前記所定値以上である類似度を有するか否かを判断するステップと、
前記所定値以上の類似度を有する第1サブバンドが存在すると判断される場合、前記逆量子化された結果に含まれた前記第2サブバンドについてのデータのうち前記第1サブバンドについてのデータを複製するステップと、
前記所定値以上の類似度を有する第1サブバンドが存在しないと判断される場合、前記第1サブバンドについてのノイズをランダムに生成するステップと、
前記複製したデータ及び前記ランダムに生成したノイズを正規化し、前記第1サブバンドについての総ノイズ電力を同一に維持するステップと、
を含み、
前記総ノイズ電力は、前記最も類似した第2サブバンドについての情報に含まれる第1サブバンドのノイズ電力についての情報に基づくことを特徴とする、周波数帯域間の類似度を用いたオーディオ信号の復号化方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040099742A KR100657916B1 (ko) | 2004-12-01 | 2004-12-01 | 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법 |
KR10-2004-0099742 | 2004-12-01 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006163396A JP2006163396A (ja) | 2006-06-22 |
JP5265853B2 true JP5265853B2 (ja) | 2013-08-14 |
Family
ID=35735271
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005348034A Expired - Fee Related JP5265853B2 (ja) | 2004-12-01 | 2005-12-01 | 処理装置、処理方法、記録媒体、符号化方法及び復号化方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7756715B2 (ja) |
EP (1) | EP1667112B1 (ja) |
JP (1) | JP5265853B2 (ja) |
KR (1) | KR100657916B1 (ja) |
CN (2) | CN1784020B (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100738077B1 (ko) | 2005-09-28 | 2007-07-12 | 삼성전자주식회사 | 계층적 오디오 부호화 및 복호화 장치와 방법 |
US20090281812A1 (en) * | 2006-01-18 | 2009-11-12 | Lg Electronics Inc. | Apparatus and Method for Encoding and Decoding Signal |
KR101418248B1 (ko) * | 2007-04-12 | 2014-07-24 | 삼성전자주식회사 | 정현파 성분의 진폭 코딩 및 디코딩 방법과 그 장치 |
CN101471072B (zh) * | 2007-12-27 | 2012-01-25 | 华为技术有限公司 | 高频重建方法、编码装置和解码装置 |
US8190440B2 (en) * | 2008-02-29 | 2012-05-29 | Broadcom Corporation | Sub-band codec with native voice activity detection |
JP5754899B2 (ja) * | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
ES2805349T3 (es) * | 2009-10-21 | 2021-02-11 | Dolby Int Ab | Sobremuestreo en un banco de filtros de reemisor combinado |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5533502B2 (ja) * | 2010-09-28 | 2014-06-25 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
EP3407352B9 (en) * | 2011-02-18 | 2022-08-10 | Ntt Docomo, Inc. | Speech decoder, speech encoder, speech decoding method, speech encoding method, speech decoding program, and speech encoding program |
KR101572034B1 (ko) * | 2011-05-19 | 2015-11-26 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 파라메트릭 오디오 코딩 방식들의 포렌식 검출 |
RU2464649C1 (ru) * | 2011-06-01 | 2012-10-20 | Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." | Способ обработки звукового сигнала |
CN102208188B (zh) | 2011-07-13 | 2013-04-17 | 华为技术有限公司 | 音频信号编解码方法和设备 |
PL2772913T3 (pl) * | 2011-10-28 | 2018-08-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Urządzenie kodujące i sposób kodowania |
US9972325B2 (en) * | 2012-02-17 | 2018-05-15 | Huawei Technologies Co., Ltd. | System and method for mixed codebook excitation for speech coding |
US9373337B2 (en) * | 2012-11-20 | 2016-06-21 | Dts, Inc. | Reconstruction of a high-frequency range in low-bitrate audio coding using predictive pattern analysis |
EP3048609A4 (en) | 2013-09-19 | 2017-05-03 | Sony Corporation | Encoding device and method, decoding device and method, and program |
CN105849801B (zh) | 2013-12-27 | 2020-02-14 | 索尼公司 | 解码设备和方法以及程序 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2705377B2 (ja) * | 1991-07-31 | 1998-01-28 | 松下電器産業株式会社 | 帯域分割符号化方法 |
US5742734A (en) | 1994-08-10 | 1998-04-21 | Qualcomm Incorporated | Encoding rate selection in a variable rate vocoder |
US5692102A (en) * | 1995-10-26 | 1997-11-25 | Motorola, Inc. | Method device and system for an efficient noise injection process for low bitrate audio compression |
KR100261254B1 (ko) * | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치 |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
JP3510493B2 (ja) | 1998-08-24 | 2004-03-29 | 株式会社ハドソン | 音声信号の符号/復号方法及びそのプログラムを記録した記録媒体 |
US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
JP3576941B2 (ja) * | 2000-08-25 | 2004-10-13 | 株式会社ケンウッド | 周波数間引き装置、周波数間引き方法及び記録媒体 |
BRPI0206395B1 (pt) * | 2001-11-14 | 2017-07-04 | Panasonic Intellectual Property Corporation Of America | Decoding device, coding device, communication system constituting a coding device and a coding device, decoding method, coding method, communication method for a system established by a coding device and a decoding device , and recording media |
DE60214027T2 (de) * | 2001-11-14 | 2007-02-15 | Matsushita Electric Industrial Co., Ltd., Kadoma | Kodiervorrichtung und dekodiervorrichtung |
JP4272897B2 (ja) * | 2002-01-30 | 2009-06-03 | パナソニック株式会社 | 符号化装置、復号化装置およびその方法 |
EP1470550B1 (en) * | 2002-01-30 | 2008-09-03 | Matsushita Electric Industrial Co., Ltd. | Audio encoding and decoding device and methods thereof |
EP1881486B1 (en) | 2002-04-22 | 2009-03-18 | Koninklijke Philips Electronics N.V. | Decoding apparatus with decorrelator unit |
US7447631B2 (en) * | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
KR100524065B1 (ko) * | 2002-12-23 | 2005-10-26 | 삼성전자주식회사 | 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치 |
FI118550B (fi) * | 2003-07-14 | 2007-12-14 | Nokia Corp | Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä |
CN1860526B (zh) * | 2003-09-29 | 2010-06-16 | 皇家飞利浦电子股份有限公司 | 音频信号编码 |
WO2005043511A1 (en) * | 2003-10-30 | 2005-05-12 | Koninklijke Philips Electronics N.V. | Audio signal encoding or decoding |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
-
2004
- 2004-12-01 KR KR1020040099742A patent/KR100657916B1/ko not_active IP Right Cessation
-
2005
- 2005-11-17 US US11/280,196 patent/US7756715B2/en not_active Expired - Fee Related
- 2005-11-25 EP EP05257270A patent/EP1667112B1/en not_active Expired - Fee Related
- 2005-11-30 CN CN2005101258261A patent/CN1784020B/zh not_active Expired - Fee Related
- 2005-11-30 CN CN2010102432270A patent/CN101908340B/zh not_active Expired - Fee Related
- 2005-12-01 JP JP2005348034A patent/JP5265853B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
KR20060060928A (ko) | 2006-06-07 |
CN101908340B (zh) | 2012-07-04 |
KR100657916B1 (ko) | 2006-12-14 |
JP2006163396A (ja) | 2006-06-22 |
US7756715B2 (en) | 2010-07-13 |
CN1784020A (zh) | 2006-06-07 |
EP1667112A1 (en) | 2006-06-07 |
CN1784020B (zh) | 2010-11-24 |
EP1667112B1 (en) | 2012-01-11 |
US20060116871A1 (en) | 2006-06-01 |
CN101908340A (zh) | 2010-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5265853B2 (ja) | 処理装置、処理方法、記録媒体、符号化方法及び復号化方法 | |
JP4922296B2 (ja) | 低ビット率オーディオ信号の符号化/復号化方法及び装置 | |
EP2041745B1 (en) | Adaptive encoding and decoding methods and apparatuses | |
KR101428487B1 (ko) | 멀티 채널 부호화 및 복호화 방법 및 장치 | |
RU2437172C1 (ru) | Способ кодирования/декодирования индексов кодовой книги для квантованного спектра мдкп в масштабируемых речевых и аудиокодеках | |
KR101251813B1 (ko) | 넓은-뜻의 지각적 유사성을 이용하는 디지털 미디어 스펙트럼 데이터의 효과적인 코딩 | |
KR100661040B1 (ko) | 정보 처리 장치 및 방법, 정보 기록 장치 및 방법, 기록 매체 및 제공 매체 | |
KR100707177B1 (ko) | 디지털 신호 부호화/복호화 방법 및 장치 | |
WO2007011157A1 (en) | Virtual source location information based channel level difference quantization and dequantization method | |
EP1441330B1 (en) | Method of encoding and/or decoding digital audio using time-frequency correlation and apparatus performing the method | |
US20040002854A1 (en) | Audio coding method and apparatus using harmonic extraction | |
JP2007333785A (ja) | オーディオ信号符号化装置およびオーディオ信号符号化方法 | |
US20090048849A1 (en) | Audio encoding method and apparatus, and audio decoding method and apparatus, for processing death sinusoid and general continuation sinusoid | |
KR20090029088A (ko) | 계층적 부호화 및 복호화 방법 및 장치 | |
CN107945810B (zh) | 用于编码和解码hoa或多声道数据的方法和装置 | |
Bießmann et al. | Estimating MP3PRO encoder parameters from decoded audio | |
KR20230028912A (ko) | 오디오 압축 효율 향상 장치 및 방법 | |
Cantzos et al. | Quality Enhancement of Compressed Audio Based on Statistical Conversion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20061114 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20061129 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081126 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110902 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110913 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111213 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111216 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120213 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120216 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120313 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120828 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20121128 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20130116 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20121220 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130402 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130502 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |