JP2012531632A - 帯域拡張符号化装置、帯域拡張復号化装置及び位相ボコーダ - Google Patents
帯域拡張符号化装置、帯域拡張復号化装置及び位相ボコーダ Download PDFInfo
- Publication number
- JP2012531632A JP2012531632A JP2012518070A JP2012518070A JP2012531632A JP 2012531632 A JP2012531632 A JP 2012531632A JP 2012518070 A JP2012518070 A JP 2012518070A JP 2012518070 A JP2012518070 A JP 2012518070A JP 2012531632 A JP2012531632 A JP 2012531632A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- window function
- band
- analysis
- band extension
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 claims abstract description 165
- 230000005236 sound signal Effects 0.000 claims abstract description 147
- 238000000034 method Methods 0.000 claims description 46
- 238000001228 spectrum Methods 0.000 claims description 44
- 238000003786 synthesis reaction Methods 0.000 claims description 33
- 230000015572 biosynthetic process Effects 0.000 claims description 32
- 238000012545 processing Methods 0.000 claims description 25
- 239000002131 composite material Substances 0.000 claims description 14
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 7
- 230000008878 coupling Effects 0.000 claims 1
- 238000010168 coupling process Methods 0.000 claims 1
- 238000005859 coupling reaction Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 41
- 238000004422 calculation algorithm Methods 0.000 description 20
- 230000003595 spectral effect Effects 0.000 description 18
- 238000012546 transfer Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 230000003111 delayed effect Effects 0.000 description 6
- 230000010076 replication Effects 0.000 description 5
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 241001270131 Agaricus moelleri Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005316 response function Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
【選択図】 図1
Description
Claims (16)
- コア周波数帯域(101−3)を含む低周波信号(101−2)と高域側帯域(101−5)を含む高周波信号(101−4)とを有するオーディオ信号(101−1)を符号化する帯域拡張符号化装置(100;300;500;800;1000)であって、
前記オーディオ信号(101−1)を分析して、複数の分析窓関数(111−1)の中から帯域拡張復号化装置(200;400;1400)において帯域拡張を行うために使用されるべき1つの分析窓関数(111−2)を決定する信号分析手段(110)であって、前記オーディオ信号(101−1)は複数のオーディオサンプルからなる1つのブロック(101−6)を有し、そのブロックは特定の時間長を持つものである、信号分析手段(110)と、
前記低周波信号(101−2)を符号化して符号化済み低周波信号(121)を得るコア符号化手段(120)と、
前記高周波信号(101−4)から帯域拡張パラメータ(131;321−2;831;1031)を計算するパラメータ計算手段(130;320;830;1030)と、
を備えることを特徴とする帯域拡張符号化装置。 - 符号化済み低周波信号(201−2;401−2;601−2;1411−2)と高帯域パラメータ(201−3;401−3;601−3;1411−3)とを有する符号化済みオーディオ信号(201−1;401−1;601−1;1411−1)を復号化する帯域拡張復号化装置(200;400;600;1100;1400)であって、
前記符号化済み低周波信号(201−2;401−2;601−2;1411−2)を復号化して復号化済み低周波信号(211−1;411−1;681−1;1421)を得るコア復号化手段(210;410;680;1420)であって、前記復号化済み低周波信号(211−1;411−1;681−1;1421)はコア周波数帯域(211−2;411−2;681−2;1425)を含む、コア復号化手段と、
前記復号化済み低周波信号(211−1;411−1;681−1;1421)と前記高帯域パラメータ(201−3;401−3;601−3;1411−3)とに基づいてパッチ済み信号(221−1;421;671;1461)を生成するパッチモジュール(220;420;1460−2)であって、前記パッチ済み信号(221−1;421;671;1461)は前記コア周波数帯域(211−2;411−2;681−2;1425)から生成された高域側帯域(221−2)を含む、パッチモジュールと、
前記パッチ済み信号(221−1;421;671;1461)と前記復号化済み低周波信号(211−1;411−1;681−1;1421)とを結合して結合された出力信号(231−1;431;691;1481)を得る結合手段(230;430;690;1480)と、
を備えることを特徴とする帯域拡張復号化装置。 - 請求項1に記載の帯域拡張符号化装置(300)において、
複数の分析窓関数(111−1)を指示する窓関数制御情報(311)を提供する窓関数制御手段(310)を備え、
前記パラメータ計算手段(320)は前記窓関数制御手段(310)により制御される窓掛け部を含み、当該窓掛け部は前記複数の分析窓関数(111−1)と比較手段(340)により選択されるべき1つの分析窓関数(111−2)とを前記高周波信号(101−4)へと適用するものであり、
前記信号分析手段(110)は前記低周波信号(101−2)と前記窓関数制御情報(311)と帯域拡張パラメータ(321−1)とに基づいて複数のパッチ済み信号(331−1)を生成するパッチモジュール(330)を含み、前記複数のパッチ済み信号(331−1)は前記コア周波数帯域(101−3)から生成された高域側帯域(331−2)を含むものであり、
前記複数のパッチ済み信号(331−1)と前記オーディオ信号(101−1)又は前記オーディオ信号から導出された信号(101−4)である参照信号との比較に基づいて、前記複数の分析窓関数(111−1)に対応する複数の比較パラメータ(341−2)を決定し、さらに所定の条件を満たす1つの比較パラメータと対応する1つの分析窓関数を指示する窓関数指示(341−1)を提供する比較手段(340)を備え、
前記窓関数指示(341−1)を含む符号化済みオーディオ信号(351)を提供する出力インターフェース(350)を備えることを特徴とする、帯域拡張符号化装置。 - 請求項2に記載の帯域拡張復号化装置(400)において、
前記符号化済みオーディオ信号(401−1)は窓関数指示(401−4)を含み、
前記パッチモジュール(420)は、前記窓関数指示(401−4)に基づいて複数の分析窓関数から1つの分析窓関数を選択し、かつ当該選択された分析窓関数を前記復号化済み低周波信号(411−1)へと適用する制御可能な窓掛け部を含む、
ことを特徴とする帯域拡張復号化装置。 - 請求項1に記載の帯域拡張符号化装置(500)において、
複数の分析窓関数(111−1)を指示する窓関数制御情報(311)を提供する窓関数制御手段(310)を備え、
前記パラメータ計算手段(320)は前記窓関数制御手段(310)により制御される窓掛け部を含み、当該窓掛け部は前記複数の分析窓関数(111−1)と比較手段(510)により選択されるべき1つの分析窓関数(111−2)とを前記高周波信号(101−4)へと適用するものであり、
前記信号分析手段(110)は前記低周波信号(101−2)と前記窓関数制御情報(311)と帯域拡張パラメータ(321−1)とに基づいて複数のパッチ済み信号(331−1)を生成するパッチモジュール(330)を含み、前記複数のパッチ済み信号(331−1)は前記コア周波数帯域(101−3)から生成された高域側帯域(331−2)を含むものであり、
前記パッチモジュール(330)は前記窓関数制御手段(310)により制御される窓掛け部を含み、当該窓掛け部は前記複数の分析窓関数(111−1)を前記低周波信号(101−2)へと適用するものであり、
前記複数のパッチ済み信号(333−1)と前記オーディオ信号から導出された参照低周波信号(101−2)との比較に基づいて、前記複数の分析窓関数(111−1)に対応する複数の比較パラメータを決定し、さらに所定の条件を満たす1つの比較パラメータと対応する1つの分析窓関数を指示する窓関数指示(511)を提供する比較手段(510)を備え、
前記窓関数指示(511)を含まない符号化済みオーディオ信号(531)を提供する出力インターフェース(530)を備えることを特徴とする、帯域拡張符号化装置。 - 請求項2に記載の帯域拡張復号化装置(600)において、
前記パッチモジュール(220)は、
複数の分析窓関数(111−1)を前記復号化済み低周波信号(681−1)へと適用して複数の窓掛けされた低周波信号(611)を得る分析窓掛け手段(610)と、
前記窓掛けされた低周波信号(611)を複数のスペクトル(621)へと変換する時間/スペクトル変換手段(620)と、
前記複数のスペクトル(621)を周波数ドメインで処理して複数の修正済みスペクトル(631)を取得する周波数ドメイン処理手段(630)と、
前記複数の修正済みスペクトル(631)を修正済み時間ドメイン信号(641)へと変換する周波数/時間変換手段(640)と、
前記複数の分析窓関数(111−1)に合致している複数の合成窓関数を前記修正済み時間ドメイン信号(641)へと適用し、複数の窓掛けされた修正済み時間ドメイン信号(651)を取得する合成窓掛け手段(650)と、
前記複数の窓掛けされた修正済み時間ドメイン信号(651)と前記復号化済み低周波信号(681−1)との比較に基づいて、前記複数の分析窓関数(111−1)に対応する複数の比較パラメータを決定し、さらに所定の条件を満たす1つの比較パラメータと対応する1つの分析窓関数及び合成窓関数を選択する比較手段(660)とを備え、
前記パッチモジュール(220)は、前記復号化済み低周波信号(681−1)と前記比較手段(660)により選択された前記分析窓関数及び合成窓関数と前記高帯域パラメータ(601−3)とに基づいて前記パッチ済み信号(671)を生成することを特徴とする、帯域拡張復号化装置。 - 請求項3又は5に記載の帯域拡張符号化装置(300;500)又は請求項6に記載の帯域拡張復号化装置(600)において、
前記比較手段(340;510;660;700)は、前記パッチ済み信号(331−1)又は前記窓掛けされた修正済み時間ドメイン信号(651)から導出された複数のSFMパラメータ(703−1)と、前記オーディオ信号(101−1)又は前記復号化済み低周波信号(681−1)から導出された1つの参照SFMパラメータ(703−2)とを計算し、さらに前記複数のSFMパラメータ(703−1)と前記参照SFMパラメータ(703−2)との比較に基づいて複数の比較パラメータ(705)を決定することを特徴とする、帯域拡張符号化装置又は帯域拡張復号化装置。 - 請求項1に記載の帯域拡張符号化装置(800)において、
前記信号分析手段(110)は、前記オーディオ信号(101−1)又はこのオーディオ信号から導出された信号(101−4)を分類し、当該分類された信号の信号特性に基づいて1つの分析窓関数に対応する窓関数指示(811)を決定する信号分類手段(810;900)を備え、
前記帯域拡張符号化装置(800)は、前記信号分類手段(810)により決定された前記窓関数指示(811)に基づいて窓関数制御情報(821)を出力する窓関数制御手段(820)を備え、
前記パラメータ計算手段(830)は、前記窓関数制御手段(820)により制御される窓掛け部を含み、当該窓掛け部は前記窓関数制御情報(821)に基づく分析窓関数を前記高周波信号(101−4)に対して適用するよう構成されており、
前記帯域拡張符号化装置(800)は、前記窓関数指示(811)を含む符号化済みオーディオ信号(841)を出力する出力インターフェース(840)をさらに備えることを特徴とする、帯域拡張符号化装置。 - 請求項1に記載の帯域拡張符号化装置(1000)において、
前記信号分析手段(110)は、前記オーディオ信号(101−1)から導出された低周波信号(101−2)を分類し、当該分類された信号の信号特性に基づいて1つの分析窓関数に対応する窓関数指示(1011)を決定する信号分類手段(900;1010)を備え、
前記帯域拡張符号化装置(1000)は、前記信号分類手段(900;1010)により決定された前記窓関数指示(1011)に基づいて窓関数制御情報(1021)を出力する窓関数制御手段(1020)を備え、
前記パラメータ計算手段(1030)は、前記窓関数制御手段(1020)により制御される窓掛け部を含み、当該窓掛け部は前記窓関数制御情報(1021)に基づく分析窓関数を前記高周波信号(101−4)に対して適用するよう構成されており、
前記帯域拡張符号化装置(1000)は、前記窓関数指示(1011)を含まない符号化済みオーディオ信号(1041)を出力する出力インターフェース(1040)をさらに備えることを特徴とする、帯域拡張符号化装置。 - 請求項5又は9に記載の帯域拡張符号化装置(500;1000)において、
前記符号化済み低周波信号(121)を復号化して復号化済み低周波信号(521;1051)を得るコア復号化手段(520;1050)をさらに備えることを特徴とする、帯域拡張符号化装置。 - 請求項2に記載の帯域拡張復号化装置(1100)において、
前記パッチモジュール(220)は、前記復号化済み低周波信号(681−1)を分類し、当該分類された信号の信号特性に基づいて1つの分析窓関数に対応する窓関数指示(1111)を決定する信号分類手段(900;1110)を備え、
前記帯域拡張復号化装置(1100)は、前記信号分類手段(900;1110)により決定された前記窓関数指示(1111)に基づいて窓関数制御情報(1121)を出力する窓関数制御手段(1120)を備え、
前記パッチモジュール(220)は、前記復号化済み低周波信号(681−1)と前記窓関数制御情報(1121)に基づく分析窓関数と前記高帯域パラメータ(601−3)とによって前記パッチ済み信号(671)を生成することを特徴とする、帯域拡張復号化装置。 - オーディオ信号(1201)を処理する位相ボコーダ(1200)であって、
前記オーディオ信号(1201)又は前記オーディオ信号から導出された信号(1202)に対して複数の分析窓関数(111−1)を適用して複数の窓掛けされたオーディオ信号(1211)を取得する分析窓掛け手段(1210)であって、前記オーディオ信号(1201)は複数のオーディオサンプルからなる1つのブロック(101−6)を有し、そのブロック(101−6)は特定の時間長を持つものである、分析窓掛け手段(1210)と、
前記複数の窓掛けされたオーディオ信号(1211)を複数のスペクトル(1221)へと変換する時間/スペクトル変換手段(1220)と、
前記複数のスペクトル(1221)を周波数ドメインで処理して複数の修正済みスペクトル(1231)を得る周波数ドメイン処理手段(1230)と、
前記複数の修正済みスペクトル(1231)を修正済み時間ドメイン信号(1241)へと変換する周波数/時間変換手段(1240)と、
前記修正済み時間ドメイン信号(1241)に対して前記複数の分析窓関数に合致する複数の合成窓関数を適用し、複数の窓掛けされた修正済み時間ドメイン信号(1251)得る合成窓掛け手段(1250)と、
前記複数の窓掛けされた修正済み時間ドメイン信号(1251)と前記オーディオ信号(1201)又は前記オーディオ信号から導出された信号(1202)との比較に基づいて、前記複数の分析窓関数に対応する複数の比較パラメータを決定し、さらに所定の条件を満たす1つの比較パラメータと対応する1つの分析窓関数及び合成窓関数を選択する比較手段(1260)と、
窓掛けされた修正済時間ドメイン信号(1255)のオーバーラップしているブロックを加算して時間的に伸長された信号(1271)を得るオーバーラップ加算手段(1270)であって、前記窓掛けされた修正済時間ドメイン信号(1255)は前記比較手段(1260)により選択された分析窓関数及び合成窓関数を用いて修正された信号である、オーバーラップ加算手段(1270)と、
を備えることを特徴とする位相ボコーダ。 - コア周波数帯域(101−3)を含む低周波信号(101−2)と高域側帯域(101−5)を含む高周波信号(101−4)とを有するオーディオ信号(101−1)を符号化する方法(100;300;500;800;1000)であって、
前記オーディオ信号(101−1)を分析するステップ(110)であって、前記オーディオ信号(101−1)は複数のオーディオサンプルからなる1つのブロック(101−6)を有し、そのブロックは特定の時間長を持つものであり、複数の分析窓関数(111−1)から帯域拡張復号化装置(200;400;1400)において帯域拡張を実行するために使用されるべき1つの分析窓関数(111−2)を決定するステップ(110)と、
前記低周波信号(101−2)を符号化して符号化済み低周波信号(121)を得るステップ(120)と、
前記高周波信号(101−4)から帯域拡張パラメータを計算するステップ(130;320;830;1030)と、
を備えることを特徴とする方法。 - 符号化済み低周波信号(201−2;401−2;601−2;1411−2)と高帯域パラメータ(201−3;401−3;601−3;1411−3)とを有する符号化済みオーディオ信号(201−1;401−1;601−1;1411−1)を復号化する方法(200;400;600;1100;1400)であって、
前記符号化済み低周波信号(201−2;401−2;601−2;1411−2)を復号化するステップ(210;410;680;1420)であり、復号化済み低周波信号(211−1;411−1;681−1;1421)はコア周波数帯域(211−2;411−2;681−2;1425)を含む、ステップと、
前記復号化済み低周波信号(211−1;411−1;681−1;1421)と前記高帯域パラメータ(201−3;401−3;601−3;1411−3)とに基づいてパッチ済み信号(221−1;421;671;1461)を生成するステップ(220;420;1460−2)であって、当該パッチ済み信号(221−1;421;671;1461)は前記コア周波数帯域(211−2;411−2;681−2;1425)から生成された高域側帯域(221−2)を含む、ステップと、
前記パッチ済み信号(221−1;421;671;1461)と前記復号化済み低周波信号(211−1;411−1;681−1;1421)とを結合して結合された出力信号(231−1;431;691;1481)を得るステップ(230;430;690;1480)と、
を備えることを特徴とする方法。 - 符号化済み低周波信号(121)と、
帯域拡張パラメータ(131;321−2;831)と、
帯域拡張復号化装置(200;400;1400)において帯域拡張を実行するために使用されるべき分析窓関数(111−2)と、
を有することを特徴とする、符号化済みオーディオ信号(103−1;351;841)。 - 請求項13又は14に記載の方法をコンピュータで実行させるためのプログラムコードを備えたコンピュータプログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US22144209P | 2009-06-29 | 2009-06-29 | |
US61/221,442 | 2009-06-29 | ||
EP10153530.0 | 2010-02-12 | ||
EP10153530A EP2273493B1 (en) | 2009-06-29 | 2010-02-12 | Bandwidth extension encoding and decoding |
PCT/EP2010/059025 WO2011000780A1 (en) | 2009-06-29 | 2010-06-24 | Bandwidth extension encoder, bandwidth extension decoder and phase vocoder |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012531632A true JP2012531632A (ja) | 2012-12-10 |
JP5329714B2 JP5329714B2 (ja) | 2013-10-30 |
Family
ID=42537947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012518070A Active JP5329714B2 (ja) | 2009-06-29 | 2010-06-24 | 帯域拡張符号化装置、帯域拡張復号化装置及び位相ボコーダ |
Country Status (14)
Country | Link |
---|---|
US (1) | US8606586B2 (ja) |
EP (2) | EP2273493B1 (ja) |
JP (1) | JP5329714B2 (ja) |
KR (1) | KR101425157B1 (ja) |
CN (1) | CN102473414B (ja) |
AU (1) | AU2010268160B2 (ja) |
BR (1) | BRPI1010165B1 (ja) |
CA (2) | CA2766573C (ja) |
ES (2) | ES2400661T3 (ja) |
HK (2) | HK1153035A1 (ja) |
MX (1) | MX2011013610A (ja) |
PL (2) | PL2273493T3 (ja) |
RU (1) | RU2563164C2 (ja) |
WO (1) | WO2011000780A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021515276A (ja) * | 2018-04-25 | 2021-06-17 | ドルビー・インターナショナル・アーベー | 後処理遅延低減との高周波再構成技術の統合 |
US11527256B2 (en) | 2018-04-25 | 2022-12-13 | Dolby International Ab | Integration of high frequency audio reconstruction techniques |
Families Citing this family (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MY176904A (en) | 2010-06-09 | 2020-08-26 | Panasonic Ip Corp America | Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit, and audio decoding apparatus |
KR101826331B1 (ko) | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
JP5704397B2 (ja) * | 2011-03-31 | 2015-04-22 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
US9177570B2 (en) * | 2011-04-15 | 2015-11-03 | St-Ericsson Sa | Time scaling of audio frames to adapt audio processing to communications network timing |
EP2786377B1 (en) * | 2011-11-30 | 2016-03-02 | Dolby International AB | Chroma extraction from an audio codec |
CN104321815B (zh) * | 2012-03-21 | 2018-10-16 | 三星电子株式会社 | 用于带宽扩展的高频编码/高频解码方法和设备 |
CN106409299B (zh) * | 2012-03-29 | 2019-11-05 | 华为技术有限公司 | 信号编码和解码的方法和设备 |
JP5945626B2 (ja) | 2012-03-29 | 2016-07-05 | テレフオンアクチーボラゲット エルエム エリクソン(パブル) | ハーモニックオーディオ信号の帯域幅拡張 |
EP2709106A1 (en) | 2012-09-17 | 2014-03-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal |
EP2720222A1 (en) * | 2012-10-10 | 2014-04-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns |
EP2951825B1 (en) | 2013-01-29 | 2021-11-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a frequency enhanced signal using temporal smoothing of subbands |
MY185176A (en) | 2013-01-29 | 2021-04-30 | Fraunhofer Ges Forschung | Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension |
EP3203471B1 (en) * | 2013-01-29 | 2023-03-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder for generating a frequency enhanced audio signal, method of decoding, encoder for generating an encoded signal and method of encoding using compact selection side information |
US9319510B2 (en) * | 2013-02-15 | 2016-04-19 | Qualcomm Incorporated | Personalized bandwidth extension |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
CA2927990C (en) | 2013-10-31 | 2018-08-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain |
EP2881943A1 (en) | 2013-12-09 | 2015-06-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding an encoded audio signal with low computational resources |
CN103714822B (zh) * | 2013-12-27 | 2017-01-11 | 广州华多网络科技有限公司 | 基于silk编解码器的子带编解码方法及装置 |
JP6383000B2 (ja) | 2014-03-03 | 2018-08-29 | サムスン エレクトロニクス カンパニー リミテッド | 帯域幅拡張のための高周波復号方法及びその装置 |
WO2015133795A1 (ko) * | 2014-03-03 | 2015-09-11 | 삼성전자 주식회사 | 대역폭 확장을 위한 고주파 복호화 방법 및 장치 |
KR102653849B1 (ko) * | 2014-03-24 | 2024-04-02 | 삼성전자주식회사 | 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치 |
KR102121642B1 (ko) * | 2014-03-31 | 2020-06-10 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 부호화 장치, 복호 장치, 부호화 방법, 복호 방법, 및 프로그램 |
KR102191506B1 (ko) * | 2014-05-14 | 2020-12-16 | 삼성전자주식회사 | 통신 시스템에서 송신 신호 처리 장치 및 방법 |
CN110083221A (zh) * | 2014-06-09 | 2019-08-02 | 威盛电子股份有限公司 | 电子装置及音频播放方法 |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
JP2016038435A (ja) * | 2014-08-06 | 2016-03-22 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
CN104269173B (zh) * | 2014-09-30 | 2018-03-13 | 武汉大学深圳研究院 | 切换模式的音频带宽扩展装置与方法 |
US10117247B2 (en) * | 2015-03-13 | 2018-10-30 | Futurewei Technologies, Inc. | Windowing methods for efficient channel aggregation and deaggregation |
KR101642112B1 (ko) | 2015-10-29 | 2016-07-22 | 주식회사 님버스 | 이동통신망에서 실시간 멀티미디어를 송수신하기 위한 모뎀 본딩 시스템 및 방법 |
US10504530B2 (en) | 2015-11-03 | 2019-12-10 | Dolby Laboratories Licensing Corporation | Switching between transforms |
KR101688647B1 (ko) | 2016-04-04 | 2016-12-22 | 주식회사 님버스 | 이동통신망에서 실시간 저지연 전송을 위한 모뎀 본딩 시스템 및 방법 |
RU169931U1 (ru) * | 2016-11-02 | 2017-04-06 | Акционерное Общество "Объединенные Цифровые Сети" | Устройство сжатия аудиосигнала для передачи по каналам распространения данных |
CN110062945B (zh) * | 2016-12-02 | 2023-05-23 | 迪拉克研究公司 | 音频输入信号的处理 |
WO2020094263A1 (en) * | 2018-11-05 | 2020-05-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs |
CN113593586A (zh) * | 2020-04-15 | 2021-11-02 | 华为技术有限公司 | 音频信号编码方法、解码方法、编码设备以及解码设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006518482A (ja) * | 2003-02-11 | 2006-08-10 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声符号化 |
JP2007304258A (ja) * | 2006-05-10 | 2007-11-22 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化およびその復号化装置、方法ならびにプログラム |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5455888A (en) | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
US5848391A (en) * | 1996-07-11 | 1998-12-08 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method subband of coding and decoding audio signals using variable length windows |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
DE10084385T1 (de) * | 1999-08-31 | 2002-08-01 | Mitsubishi Paper Mills Ltd | Elektronenannehmende Verbindung und wärmeempfindliches Aufzeichnungsmaterial |
US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
US6704711B2 (en) * | 2000-01-28 | 2004-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for modifying speech signals |
US6636830B1 (en) * | 2000-11-22 | 2003-10-21 | Vialta Inc. | System and method for noise reduction using bi-orthogonal modified discrete cosine transform |
US20020128839A1 (en) * | 2001-01-12 | 2002-09-12 | Ulf Lindgren | Speech bandwidth extension |
US6895375B2 (en) | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
US7389226B2 (en) * | 2002-10-29 | 2008-06-17 | Ntt Docomo, Inc. | Optimized windows and methods therefore for gradient-descent based window optimization for linear prediction analysis in the ITU-T G.723.1 speech coding standard |
US7451091B2 (en) * | 2003-10-07 | 2008-11-11 | Matsushita Electric Industrial Co., Ltd. | Method for determining time borders and frequency resolutions for spectral envelope coding |
JP2007510198A (ja) | 2003-10-08 | 2007-04-19 | ユニシス コーポレーション | ホストシステムのパーティション内に実装されているハイパーバイザを使用したコンピュータシステムの準仮想化 |
DE102004009954B4 (de) * | 2004-03-01 | 2005-12-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals |
US7953605B2 (en) * | 2005-10-07 | 2011-05-31 | Deepen Sinha | Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension |
US8463412B2 (en) * | 2008-08-21 | 2013-06-11 | Motorola Mobility Llc | Method and apparatus to facilitate determining signal bounding frequencies |
-
2010
- 2010-02-12 ES ES10153530T patent/ES2400661T3/es active Active
- 2010-02-12 PL PL10153530T patent/PL2273493T3/pl unknown
- 2010-02-12 EP EP10153530A patent/EP2273493B1/en active Active
- 2010-06-24 CA CA2766573A patent/CA2766573C/en active Active
- 2010-06-24 EP EP10725483.1A patent/EP2449554B1/en active Active
- 2010-06-24 CN CN2010800291647A patent/CN102473414B/zh active Active
- 2010-06-24 PL PL10725483T patent/PL2449554T3/pl unknown
- 2010-06-24 MX MX2011013610A patent/MX2011013610A/es active IP Right Grant
- 2010-06-24 KR KR1020117031327A patent/KR101425157B1/ko active IP Right Grant
- 2010-06-24 JP JP2012518070A patent/JP5329714B2/ja active Active
- 2010-06-24 BR BRPI1010165-9A patent/BRPI1010165B1/pt active IP Right Grant
- 2010-06-24 ES ES10725483.1T patent/ES2534944T3/es active Active
- 2010-06-24 AU AU2010268160A patent/AU2010268160B2/en active Active
- 2010-06-24 RU RU2012102411/08A patent/RU2563164C2/ru active
- 2010-06-24 CA CA2856587A patent/CA2856587C/en active Active
- 2010-06-24 WO PCT/EP2010/059025 patent/WO2011000780A1/en active Application Filing
-
2011
- 2011-07-08 HK HK11107088.5A patent/HK1153035A1/xx unknown
- 2011-12-22 US US13/335,096 patent/US8606586B2/en active Active
-
2012
- 2012-11-01 HK HK12111016.3A patent/HK1170331A1/xx unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006518482A (ja) * | 2003-02-11 | 2006-08-10 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声符号化 |
JP2007304258A (ja) * | 2006-05-10 | 2007-11-22 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化およびその復号化装置、方法ならびにプログラム |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021515276A (ja) * | 2018-04-25 | 2021-06-17 | ドルビー・インターナショナル・アーベー | 後処理遅延低減との高周波再構成技術の統合 |
JP2021157202A (ja) * | 2018-04-25 | 2021-10-07 | ドルビー・インターナショナル・アーベー | 後処理遅延低減との高周波再構成技術の統合 |
US11527256B2 (en) | 2018-04-25 | 2022-12-13 | Dolby International Ab | Integration of high frequency audio reconstruction techniques |
US11562759B2 (en) | 2018-04-25 | 2023-01-24 | Dolby International Ab | Integration of high frequency reconstruction techniques with reduced post-processing delay |
JP7242767B2 (ja) | 2018-04-25 | 2023-03-20 | ドルビー・インターナショナル・アーベー | 後処理遅延低減との高周波再構成技術の統合 |
US11810591B2 (en) | 2018-04-25 | 2023-11-07 | Dolby International Ab | Integration of high frequency audio reconstruction techniques |
US11810592B2 (en) | 2018-04-25 | 2023-11-07 | Dolby International Ab | Integration of high frequency audio reconstruction techniques |
US11810590B2 (en) | 2018-04-25 | 2023-11-07 | Dolby International Ab | Integration of high frequency audio reconstruction techniques |
US11810589B2 (en) | 2018-04-25 | 2023-11-07 | Dolby International Ab | Integration of high frequency audio reconstruction techniques |
US11823696B2 (en) | 2018-04-25 | 2023-11-21 | Dolby International Ab | Integration of high frequency reconstruction techniques with reduced post-processing delay |
US11823695B2 (en) | 2018-04-25 | 2023-11-21 | Dolby International Ab | Integration of high frequency reconstruction techniques with reduced post-processing delay |
US11823694B2 (en) | 2018-04-25 | 2023-11-21 | Dolby International Ab | Integration of high frequency reconstruction techniques with reduced post-processing delay |
US11830509B2 (en) | 2018-04-25 | 2023-11-28 | Dolby International Ab | Integration of high frequency reconstruction techniques with reduced post-processing delay |
US11862185B2 (en) | 2018-04-25 | 2024-01-02 | Dolby International Ab | Integration of high frequency audio reconstruction techniques |
US11908486B2 (en) | 2018-04-25 | 2024-02-20 | Dolby International Ab | Integration of high frequency reconstruction techniques with reduced post-processing delay |
JP7493073B2 (ja) | 2018-04-25 | 2024-05-30 | ドルビー・インターナショナル・アーベー | 後処理遅延低減との高周波再構成技術の統合 |
Also Published As
Publication number | Publication date |
---|---|
US8606586B2 (en) | 2013-12-10 |
CA2856587A1 (en) | 2011-01-06 |
WO2011000780A1 (en) | 2011-01-06 |
EP2449554A1 (en) | 2012-05-09 |
KR20120031957A (ko) | 2012-04-04 |
CA2766573A1 (en) | 2011-01-06 |
CA2766573C (en) | 2015-06-23 |
PL2449554T3 (pl) | 2015-08-31 |
MX2011013610A (es) | 2012-03-26 |
RU2563164C2 (ru) | 2015-09-20 |
CA2856587C (en) | 2016-09-13 |
EP2449554B1 (en) | 2015-03-25 |
HK1153035A1 (en) | 2012-03-16 |
EP2273493A1 (en) | 2011-01-12 |
BRPI1010165A2 (pt) | 2016-03-29 |
CN102473414B (zh) | 2013-11-06 |
AU2010268160B2 (en) | 2014-03-06 |
KR101425157B1 (ko) | 2014-08-01 |
JP5329714B2 (ja) | 2013-10-30 |
EP2273493B1 (en) | 2012-12-19 |
RU2012102411A (ru) | 2013-08-20 |
BRPI1010165B1 (pt) | 2021-01-05 |
HK1170331A1 (en) | 2013-02-22 |
AU2010268160A1 (en) | 2012-02-02 |
US20120158409A1 (en) | 2012-06-21 |
ES2400661T3 (es) | 2013-04-11 |
ES2534944T3 (es) | 2015-04-30 |
PL2273493T3 (pl) | 2013-07-31 |
CN102473414A (zh) | 2012-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5329714B2 (ja) | 帯域拡張符号化装置、帯域拡張復号化装置及び位相ボコーダ | |
US10522168B2 (en) | Audio signal synthesizer and audio signal encoder | |
JP5227459B2 (ja) | 合成オーディオ信号を生成する装置及び方法並びにオーディオ信号を符号化する装置及び方法 | |
JP6229957B2 (ja) | 音声信号を再生するための装置および方法、符号化音声信号を生成するための装置および方法、コンピュータプログラム、および符号化音声信号 | |
US10580415B2 (en) | Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal | |
AU2014201331B2 (en) | Bandwidth extension encoder, bandwidth extension decoder and phase vocoder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130219 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130516 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130523 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130528 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130702 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130724 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5329714 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |