JP2009541790A - Adaptive high frequency domain encoding and decoding method and apparatus - Google Patents
Adaptive high frequency domain encoding and decoding method and apparatus Download PDFInfo
- Publication number
- JP2009541790A JP2009541790A JP2009516401A JP2009516401A JP2009541790A JP 2009541790 A JP2009541790 A JP 2009541790A JP 2009516401 A JP2009516401 A JP 2009516401A JP 2009516401 A JP2009516401 A JP 2009516401A JP 2009541790 A JP2009541790 A JP 2009541790A
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- domain
- signal
- spectrum
- region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 97
- 230000003044 adaptive effect Effects 0.000 title claims description 109
- 238000001228 spectrum Methods 0.000 claims description 178
- 230000005284 excitation Effects 0.000 claims description 176
- 238000000695 excitation spectrum Methods 0.000 claims description 148
- 238000006243 chemical reaction Methods 0.000 claims description 38
- 230000015572 biosynthetic process Effects 0.000 claims description 24
- 238000003786 synthesis reaction Methods 0.000 claims description 24
- 239000000284 extract Substances 0.000 claims description 11
- 230000007774 longterm Effects 0.000 claims description 11
- 230000002087 whitening effect Effects 0.000 claims description 10
- 230000005236 sound signal Effects 0.000 abstract description 6
- 238000013139 quantization Methods 0.000 description 49
- 230000009466 transformation Effects 0.000 description 31
- 238000010586 diagram Methods 0.000 description 24
- 230000008569 process Effects 0.000 description 20
- 230000008859 change Effects 0.000 description 12
- 230000002194 synthesizing effect Effects 0.000 description 8
- 230000003595 spectral effect Effects 0.000 description 6
- 230000000737 periodic effect Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
オーディオ信号を符号化する方法及び装置に係り、既定の周波数より小さな領域に備えられた信号を利用して既定の周波数より大きい領域に備えられた信号を時間ドメインまたは周波数ドメインで適応的に符号化するか、復号化することによって、少ないビットを利用してオーディオ信号を符号化するか、復号化するにもかかわらず、高周波数領域に該当する信号の音質を低下させないので、コーディング効率を極大化させうる。
The present invention relates to a method and apparatus for encoding an audio signal, and adaptively encodes a signal provided in a region larger than a predetermined frequency in a time domain or a frequency domain using a signal provided in a region smaller than a predetermined frequency. Or by decoding, the audio signal is encoded using a small number of bits, or the sound quality of the signal corresponding to the high frequency region is not deteriorated even though the audio signal is decoded, so that the coding efficiency is maximized. It can be made.
Description
本発明は、音声信号または音楽信号のようなオーディオ信号を符号化したり復号化する方法及び装置に係り、さらに詳細には、低周波数領域に設けられた信号またはスペクトルを利用し、高周波数領域に設けられた信号を符号化したり復号化する方法及び装置に関する。 The present invention relates to a method and an apparatus for encoding and decoding an audio signal such as a voice signal or a music signal, and more particularly, using a signal or spectrum provided in a low frequency region and using the signal or spectrum provided in the low frequency region. The present invention relates to a method and an apparatus for encoding and decoding a provided signal.
高周波数領域に該当する信号は、低周波数領域に該当する信号に比べて人間が音声として認識するのに重要性が落ちるというのが一般的である。従って、オーディオ信号を符号化するにおいて、可用ビットに対する制約があってコーディングの効率を高めなければならない場合、低周波数領域に該当する信号には、多くのビットを割り当てて符号化するが、これに比べて高周波数領域に該当する信号には、少ないビットを割り当てて符号化する。 In general, a signal corresponding to the high frequency region is less important for human recognition as speech than a signal corresponding to the low frequency region. Therefore, in encoding audio signals, if there is a restriction on available bits and coding efficiency must be increased, a signal corresponding to the low frequency region is allocated with many bits and encoded. In comparison, a signal corresponding to a high frequency region is encoded by assigning fewer bits.
従って、高周波数領域に該当する信号を符号化するにおいて、少ないビットを利用しても人間が認識する音質を最大限向上させることができる方法及び装置が要求される。 Therefore, there is a need for a method and apparatus that can improve the sound quality recognized by humans to the maximum even when using a small number of bits in encoding a signal corresponding to the high frequency region.
本発明がなそうとする技術的課題は、既設定の周波数より小さい領域に設けられた信号を利用して既設定の周波数より大きい領域に設けられた信号を時間ドメインまたは周波数ドメインで適応的に符号化したり復号化する方法及び装置を提供することである。 A technical problem to be solved by the present invention is that a signal provided in a region larger than a preset frequency is adaptively applied in a time domain or a frequency domain using a signal provided in a region smaller than a preset frequency. It is to provide a method and apparatus for encoding and decoding.
前記の課題をなすための本発明による適応的高周波数領域の符号化装置は、既設定の周波数より大きい領域に設けられた信号である高周波数信号を周波数バンド別に、時間ドメインまたは周波数ドメインのうちいずれか一つを選択してそれに変換するドメイン変換部、前記時間ドメインに変換された周波数バンドを、既設定の周波数より小さい低周波数領域に設けられた励起信号を利用して符号化する時間ドメイン符号化部、及び前記周波数ドメインに変換された周波数バンドを、前記低周波数領域に設けられた励起スペクトルを利用して符号化する周波数ドメイン符号化部を備えることを特徴とする。 An adaptive high frequency domain encoding apparatus according to the present invention for achieving the above-described problem is obtained by classifying a high frequency signal, which is a signal provided in a region larger than a preset frequency, into a time domain or a frequency domain according to frequency bands. A domain conversion unit that selects and converts any one of them, and a time domain that encodes the frequency band converted into the time domain using an excitation signal provided in a low frequency region smaller than a preset frequency An encoding unit and a frequency domain encoding unit that encodes the frequency band converted into the frequency domain by using an excitation spectrum provided in the low frequency region are provided.
前記の課題をなすための本発明による適応的高周波数領域の符号化装置は、既設定の周波数より小さい領域である低周波数領域に設けられた励起スペクトルのうち、既設定の周波数より大きい領域に設けられたスペクトルである高周波数スペクトルを符号化するのに利用する周波数バンドを選択し、前記選択された周波数バンドに係る情報を符号化するノイズ情報符号化部、及び前記高周波数スペクトルの包絡線を抽出して符号化する包絡線情報符号化部を備えることを特徴とする。 An adaptive high-frequency region encoding apparatus according to the present invention for achieving the above-described problem is provided in an excitation spectrum provided in a low-frequency region, which is a region smaller than a preset frequency, in a region larger than the preset frequency. A noise information encoding unit that selects a frequency band to be used for encoding a high frequency spectrum that is a provided spectrum, encodes information related to the selected frequency band, and an envelope of the high frequency spectrum And an envelope information encoding unit that extracts and encodes.
前記の課題をなすための本発明による適応的高周波数領域の符号化装置は、既設定の周波数より大きい領域に設けられた信号である高周波数信号に対して既設定の基準によって、時間ドメインまたは周波数ドメインのうちいずれか一つを選択するドメイン選択部、前記ドメイン選択部で時間ドメインが選択されれば、前記高周波数信号を既設定の周波数より小さい領域である低周波数領域に設けられた励起信号を利用して符号化する時間ドメイン符号化部、及び前記ドメイン選択部で周波数ドメインが選択されれば、前記高周波数信号を周波数ドメインに変換して高周波数スペクトルを生成し、前記高周波数スペクトルを前記低周波数領域に設けられた励起スペクトルを利用して符号化する周波数ドメイン符号化部を備えることを特徴とする。 An adaptive high-frequency domain encoding apparatus according to the present invention for achieving the above-described problem is provided in a time domain or a high-frequency signal, which is a signal provided in a region larger than a preset frequency, according to a preset criterion. A domain selector that selects one of the frequency domains, and if the time domain is selected by the domain selector, the high frequency signal is excited in a low frequency region that is smaller than a preset frequency. If the frequency domain is selected by the time domain encoding unit that encodes using a signal and the domain selection unit, the high frequency signal is generated by converting the high frequency signal into the frequency domain, and the high frequency spectrum is generated. A frequency domain encoding unit that encodes using an excitation spectrum provided in the low frequency region
前記の課題をなすための本発明による適応的高周波数領域の復号化装置は、既設定の周波数より大きい領域である高周波数領域に設けられた各周波数バンドが符号化されたドメインを判断するドメイン判断部、前記時間ドメインに符号化されたと判断された周波数バンドを既設定の周波数より小さい低周波数領域に設けられた励起信号を利用して復号化する時間ドメイン復号化部、及び前記周波数ドメインに符号化されたと判断された周波数バンドを低周波数領域に設けられた励起スペクトルを利用して復号化する周波数ドメイン復号化部を備えることを特徴とする。 The adaptive high-frequency domain decoding apparatus according to the present invention for achieving the above-described problem is a domain for determining a domain in which each frequency band provided in a high-frequency region that is a region larger than a preset frequency is encoded. A determination unit, a time domain decoding unit that decodes a frequency band determined to be encoded in the time domain using an excitation signal provided in a low frequency region smaller than a preset frequency, and the frequency domain A frequency domain decoding unit is provided that decodes a frequency band determined to be encoded using an excitation spectrum provided in a low frequency region.
前記の課題をなすための本発明による適応的高周波数領域の復号化装置は、既設定の周波数より小さい領域である低周波数領域に設けられた励起スペクトルのうち、既設定の周波数より大きい領域である高周波数領域を復号化するのに利用する周波数バンドに係る情報を利用し、前記高周波数領域にノイズを生成するノイズ生成部、及び前記高周波数領域に設けられた高周波数スペクトルの包絡線を復号化し、前記生成されたノイズの包絡線を調節する包絡線調節部を備えることを特徴とする。 An adaptive high-frequency decoding apparatus according to the present invention for achieving the above-described problem is provided in a region larger than a preset frequency among excitation spectra provided in a low-frequency region that is smaller than a preset frequency. Using information related to a frequency band used to decode a certain high frequency region, a noise generating unit that generates noise in the high frequency region, and an envelope of a high frequency spectrum provided in the high frequency region An envelope adjustment unit that decodes and adjusts the envelope of the generated noise is provided.
前記の課題をなすための本発明による適応的高周波数領域の復号化装置は、既設定の周波数より大きい領域である高周波数領域が符号化されたドメインを判断するドメイン判断部、前記ドメイン判断部で前記高周波数領域が時間ドメインで符号化されたと判断されれば、前記高周波数領域に設けられた高周波数信号を、既設定の周波数より小さい領域である低周波数領域に設けられた励起信号を利用して復号化する時間ドメイン復号化部、及び前記ドメイン判断部で前記高周波数領域が周波数ドメインで符号化されたと判断されれば、前記高周波数領域に設けられた高周波数スペクトルを、前記低周波数領域に設けられた励起スペクトルを利用して復号化する周波数ドメイン復号化部を備えることを特徴とする。 An adaptive high-frequency domain decoding apparatus according to the present invention for achieving the above-described problem includes a domain determination unit that determines a domain in which a high-frequency region that is a region larger than a preset frequency is encoded, and the domain determination unit If it is determined that the high frequency region is encoded in the time domain, a high frequency signal provided in the high frequency region is converted into an excitation signal provided in a low frequency region that is smaller than a preset frequency. If it is determined by the time domain decoding unit that uses and decodes the high frequency region in the frequency domain, the high frequency spectrum provided in the high frequency region is reduced to the low frequency region. A frequency domain decoding unit that performs decoding using an excitation spectrum provided in the frequency domain is provided.
前記の課題をなすための本発明による適応的高周波数領域の符号化方法は、既設定の周波数より大きい領域に設けられた信号である高周波数信号を周波数バンド別に、時間ドメインまたは周波数ドメインのうちいずれか一つを選択してそれに変換する段階、前記時間ドメインに変換された周波数バンドを、既設定の周波数より小さい低周波数領域に設けられた励起信号を利用して符号化する段階、及び前記周波数ドメインに変換された周波数バンドを、前記低周波数領域に設けられた励起スペクトルを利用して符号化する段階を含むことを特徴とする。 An adaptive high frequency domain coding method according to the present invention for achieving the above-described problem is achieved by dividing a high frequency signal, which is a signal provided in a region larger than a preset frequency, into a time domain or a frequency domain. Selecting one of them and converting it, encoding the frequency band converted to the time domain using an excitation signal provided in a low frequency region smaller than a preset frequency, and The method includes encoding the frequency band converted into the frequency domain using an excitation spectrum provided in the low frequency region.
前記の課題をなすための本発明による適応的高周波数領域の符号化方法は、既設定の周波数より小さい領域である低周波数領域に設けられた励起スペクトルのうち、既設定の周波数より大きい領域に設けられたスペクトルである高周波数スペクトルを符号化するのに利用する周波数バンドを選択し、前記選択された周波数バンドに係る情報を符号化する段階、及び前記高周波数スペクトルの包絡線を抽出して符号化する段階を含むことを特徴とする。 The adaptive high frequency region encoding method according to the present invention for achieving the above-described problem is applied to a region larger than a preset frequency among excitation spectra provided in a low frequency region that is a region smaller than a preset frequency. Selecting a frequency band to be used for encoding a high frequency spectrum, which is a provided spectrum, encoding information relating to the selected frequency band, and extracting an envelope of the high frequency spectrum; The method includes a step of encoding.
前記の課題をなすための本発明による適応的高周波数領域の符号化方法は、既設定の周波数より大きい領域に設けられた信号である高周波数信号に対して既設定の基準によって、時間ドメインまたは周波数ドメインのうちいずれか一つを選択する段階、前記選択する段階で時間ドメインが選択されれば、前記高周波数信号を既設定の周波数より小さい領域である低周波数領域に設けられた励起信号を利用して符号化する段階、及び前記選択する段階で周波数ドメインが選択されれば、前記高周波数信号を周波数ドメインに変換して高周波数スペクトルを生成し、前記高周波数スペクトルを前記低周波数領域に設けられた励起スペクトルを利用して符号化する段階を含むことを特徴とする。 The adaptive high-frequency domain encoding method according to the present invention for achieving the above-described problem is based on a predetermined criterion for a high-frequency signal, which is a signal provided in a region larger than a predetermined frequency. If one of the frequency domains is selected, and if the time domain is selected in the selecting step, the excitation signal provided in the low frequency region, which is a region smaller than the preset frequency, is used as the high frequency signal. If the frequency domain is selected in the encoding step and the selecting step, the high frequency signal is converted into the frequency domain to generate a high frequency spectrum, and the high frequency spectrum is converted into the low frequency region. And encoding using the provided excitation spectrum.
前記の課題をなすための本発明による適応的高周波数領域の復号化方法は、既設定の周波数より大きい領域である高周波数領域に設けられた各周波数バンドが符号化されたドメインを判断する段階、前記時間ドメインに符号化されたと判断された周波数バンドを既設定の周波数より小さい低周波数領域に設けられた励起信号を利用して復号化する段階、前記周波数ドメインに符号化されたと判断された周波数バンドを低周波数領域に設けられた励起スペクトルを利用して復号化する段階を含むことを特徴とする。 The adaptive high-frequency domain decoding method according to the present invention for achieving the above-described problem includes a step of determining a domain in which each frequency band provided in a high-frequency region that is a region larger than a preset frequency is encoded. Decoding the frequency band determined to be encoded in the time domain using an excitation signal provided in a low frequency region smaller than a preset frequency, and determining that the frequency band is encoded in the frequency domain The method includes a step of decoding a frequency band using an excitation spectrum provided in a low frequency region.
前記の課題をなすための本発明による適応的高周波数領域の復号化方法は、既設定の周波数より小さい領域である低周波数領域に設けられた励起スペクトルのうち、既設定の周波数より大きい領域である高周波数領域を復号化するのに利用する周波数バンドに係る情報を利用し、前記高周波数領域にノイズを生成する段階、及び前記高周波数領域に設けられた高周波数スペクトルの包絡線を復号化し、前記生成されたノイズの包絡線を調節する段階を含むことを特徴とする。 The adaptive high-frequency domain decoding method according to the present invention for achieving the above-described problem is provided in an excitation spectrum provided in a low-frequency region, which is a region smaller than a preset frequency, in a region greater than the preset frequency. Using information related to a frequency band used to decode a certain high frequency region, generating noise in the high frequency region, and decoding an envelope of a high frequency spectrum provided in the high frequency region Adjusting the envelope of the generated noise.
前記の課題をなすための本発明による適応的高周波数領域の復号化方法は、既設定の周波数より大きい領域である高周波数領域が符号化されたドメインを判断する段階、前記判断する段階で前記高周波数領域が時間ドメインで符号化されたと判断されれば、前記高周波数領域に設けられた高周波数信号を、既設定の周波数より小さい領域である低周波数領域に設けられた励起信号を利用して復号化する段階、及び前記判断する段階で前記高周波数領域が周波数ドメインで符号化されたと判断されれば、前記高周波数領域に設けられた高周波数スペクトルを前記低周波数領域に設けられた励起スペクトルを利用して復号化する段階を含むことを特徴とする。 The adaptive high-frequency domain decoding method according to the present invention for achieving the above-described problem includes a step of determining a domain in which a high-frequency region, which is a region larger than a preset frequency, is encoded, If it is determined that the high frequency region is encoded in the time domain, the high frequency signal provided in the high frequency region is used as the excitation signal provided in the low frequency region that is smaller than the preset frequency. If the high frequency region is determined to be encoded in the frequency domain in the decoding step and the determining step, the high frequency spectrum provided in the high frequency region is excited in the low frequency region. The method includes a step of decoding using a spectrum.
前記の課題をなすための本発明による記録媒体は、既設定の周波数より大きい領域に設けられた信号である高周波数信号を周波数バンド別に、時間ドメインまたは周波数ドメインのうちいずれか一つを選択してそれに変換する段階、前記時間ドメインに変換された周波数バンドを、既設定の周波数より小さい低周波数領域に設けられた励起信号を利用して符号化する段階、及び前記周波数ドメインに変換された周波数バンドを、前記低周波数領域に設けられた励起スペクトルを利用して符号化する段階をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体である。 The recording medium according to the present invention for achieving the above-mentioned problem is to select one of the time domain and the frequency domain for each high frequency signal, which is a signal provided in a region larger than a preset frequency, for each frequency band. Converting the frequency band into the time domain, encoding the frequency band converted into the time domain using an excitation signal provided in a low frequency region smaller than a preset frequency, and the frequency converted into the frequency domain A computer-readable recording medium recording a program for causing a computer to execute a step of encoding a band using an excitation spectrum provided in the low frequency region.
前記の課題をなすための本発明による記録媒体は、既設定の周波数より小さい領域である低周波数領域に設けられた励起スペクトルのうち、既設定の周波数より大きい領域に設けられたスペクトルである高周波数スペクトルを符号化するのに利用する周波数バンドを選択し、前記選択された周波数バンドに係る情報を符号化する段階、及び前記高周波数スペクトルの包絡線を抽出して符号化する段階をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体である。 The recording medium according to the present invention for achieving the above-described problem is a high-frequency spectrum provided in a region higher than a preset frequency among excitation spectra provided in a low-frequency region that is a region smaller than a preset frequency. Selecting a frequency band to be used for encoding a frequency spectrum, encoding information related to the selected frequency band, and extracting and encoding an envelope of the high frequency spectrum by a computer; A computer-readable recording medium that records a program to be executed.
前記の課題をなすための本発明による記録媒体は、既設定の周波数より大きい領域に設けられた信号である高周波数信号に対して既設定の基準によって、時間ドメインまたは周波数ドメインのうちいずれか一つを選択する段階、前記選択する段階で時間ドメインが選択されれば、前記高周波数信号を既設定の周波数より小さい領域である低周波数領域に設けられた励起信号を利用して符号化する段階、及び前記選択する段階で周波数ドメインが選択されれば、前記高周波数信号を周波数ドメインに変換して高周波数スペクトルを生成し、前記高周波数スペクトルを前記低周波数領域に設けられた励起スペクトルを利用して符号化する段階をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体である。 The recording medium according to the present invention for achieving the above-described problem is either a time domain or a frequency domain depending on a preset reference for a high-frequency signal that is a signal provided in a region larger than a preset frequency. Selecting one, and if the time domain is selected in the selecting step, encoding the high frequency signal using an excitation signal provided in a low frequency region that is a region smaller than a preset frequency If the frequency domain is selected in the selecting step, the high frequency signal is converted into the frequency domain to generate a high frequency spectrum, and the high frequency spectrum is used in the low frequency region. Is a computer-readable recording medium on which a program for causing a computer to execute the encoding step is recorded
前記の課題をなすための本発明による記録媒体は、既設定の周波数より大きい領域である高周波数領域に設けられた各周波数バンドが符号化されたドメインを判断する段階、前記時間ドメインに符号化されたと判断された周波数バンドを既設定の周波数より小さい低周波数領域に設けられた励起信号を利用して復号化する段階、前記周波数ドメインに符号化されたと判断された周波数バンドを低周波数領域に設けられた励起スペクトルを利用して復号化する段階をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体である。 The recording medium according to the present invention for accomplishing the above-described problem is a step of determining a domain in which each frequency band provided in a high frequency region, which is a region larger than a preset frequency, is encoded. Decoding the frequency band determined to be performed using an excitation signal provided in a low frequency region smaller than a preset frequency, and converting the frequency band determined to be encoded in the frequency domain to the low frequency region A computer-readable recording medium recording a program for causing a computer to execute a step of decoding using an excitation spectrum provided.
前記の課題をなすための本発明による記録媒体は、既設定の周波数より小さい領域である低周波数領域に設けられた励起スペクトルのうち、既設定の周波数より大きい領域である高周波数領域を復号化するのに利用する周波数バンドに係る情報を利用し、前記高周波数領域にノイズを生成する段階、及び前記高周波数領域に設けられた高周波数スペクトルの包絡線を復号化し、前記生成されたノイズの包絡線を調節する段階をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体である。 The recording medium according to the present invention for accomplishing the above-described problem is a decoding medium that decodes a high-frequency region that is a region larger than a preset frequency among excitation spectra provided in a low-frequency region that is a region smaller than a preset frequency. Generating information in the high frequency region using information related to a frequency band to be used, and decoding an envelope of a high frequency spectrum provided in the high frequency region; A computer-readable recording medium having recorded thereon a program for causing a computer to execute the step of adjusting the envelope.
前記の課題をなすための本発明による記録媒体は、既設定の周波数より大きい領域である高周波数領域が符号化されたドメインを判断する段階、前記判断する段階で前記高周波数領域が時間ドメインで符号化されたと判断されれば、前記高周波数領域に設けられた高周波数信号を、既設定の周波数より小さい領域である低周波数領域に設けられた励起信号を利用して復号化する段階、及び前記判断する段階で前記高周波数領域が周波数ドメインで符号化されたと判断されれば、前記高周波数領域に設けられた高周波数スペクトルを、前記低周波数領域に設けられた励起スペクトルを利用して復号化する段階をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体である。 The recording medium according to the present invention for achieving the above-described problem is a step of determining a domain in which a high frequency region, which is a region larger than a preset frequency, is encoded, and in the determining step, the high frequency region is a time domain. If determined to be encoded, the step of decoding the high frequency signal provided in the high frequency region using an excitation signal provided in a low frequency region that is a region smaller than a preset frequency, and If it is determined in the determining step that the high frequency region is encoded in the frequency domain, the high frequency spectrum provided in the high frequency region is decoded using the excitation spectrum provided in the low frequency region. It is a computer-readable recording medium having recorded thereon a program for causing a computer to execute the conversion step.
以下、添付された図面を参照して本発明による適応的時間/周波数ドメイン符号化方法及び装置に対して詳細に説明する。 Hereinafter, an adaptive time / frequency domain encoding method and apparatus according to the present invention will be described in detail with reference to the accompanying drawings.
図1Aは、本発明による適応的高周波数領域の符号化装置の一実施例を示すブロック図であって、前記適応的高周波数領域の符号化装置は、第1変換部100、ドメイン選択部105、線形予測部110、長区間予測部115、励起信号符号化部120、第2変換部125、量子化部130、逆量子化部135、第2逆変換部140、保存部145、励起信号復号化部150、励起スペクトル生成部155、高周波数領域の符号化部160及び多重化部165を含んでなる。
FIG. 1A is a block diagram showing an embodiment of an adaptive high frequency domain encoding apparatus according to the present invention. The adaptive high frequency domain encoding apparatus includes a
第1変換部100は、入力端子INを通じて入力された信号を所定の周波数バンド別に時間ドメインで示すように変換する。第1変換部100で変換する方式として、QMF(Quadrature Mirror Filter bank)及びLOT(lapped orthogonal transform)などがある。
The
しかし、第1変換部100は、FV−MLT(Frequency Varying Modulated Lapped Transform)のように入力端子INを通じて入力された信号を所定の周波数バンド別に、時間ドメインまたは周波数ドメインで示すように変換することによって、第2変換部125を備えずとも、ドメイン選択部105で選択されたドメインに第1変換部100で変換して実施しうる。
However, the
ドメイン選択部105は、第1変換部100で変換された各周波数バンドの信号のうち、既定の周波数より小さな領域に含まれる周波数バンドの信号を、既定の基準によって時間ドメインで符号化するか、周波数ドメインで符号化するかを選択する。また、ドメイン選択部105は、各周波数バンドが符号化されたドメインについての情報を符号化して多重化部165に出力する。
The
ここで、既定の基準の例として、線形予測符号化利得値、隣接したフレームの線形予測フィルター間のスペクトル変化、ピッチ遅延及び長区間予測利得値などがある。 Here, examples of the predetermined reference include a linear prediction coding gain value, a spectral change between linear prediction filters of adjacent frames, a pitch delay, and a long interval prediction gain value.
線形予測部110は、ドメイン選択部105によって時間ドメインで符号化すると決定された周波数バンドに備えられた信号に対してLPC(Linear Predictive Coding)分析を行ってLPC係数を抽出して符号化し、ドメイン選択部105によって時間ドメインで符号化すると決定された周波数バンドに備えられた信号から短区間相関を除去して第1励起信号を抽出する。
The
長区間予測部115は、線形予測部110で抽出された第1励起信号に対して長区間予測(long−term prediction)を行い、第2励起信号を抽出する。また、長区間予測部115は、長区間予測が行われた結果を符号化して多重化部165に出力する。
The long
長区間予測部115で行う長区間予測の例として周期性(periodicity)の連続性(continuity)程度、周波数スペクトルの傾度(frequency spectral tilt)程度及びフレームエネルギー程度などがある。ここで、周期性の連続性は、ピッチラグ(pitch lag)の変化が少なく、ピッチ相関度(pitch correlation)の高いフレームが一定区間以上連続的に持続される程度でありうる。また、周期性の連続性は、第1フォルマント周波数(1st formant frequency)が非常に低く、ピッチ相関度の高いフレームが一定区間以上連続的に持続される程度でありうる。
Examples of long interval prediction performed by the long
励起信号符号化部120は、長区間予測部115で抽出された第2励起信号を符号化する。
The excitation
第2変換部125は、ドメイン選択部105によって周波数ドメインで符号化すると決定された周波数バンドに備えられた信号を時間ドメインから周波数ドメインに変換してスペクトルを生成する。
The
量子化部130は、第2変換部125で生成されたスペクトルを量子化する。量子化部130で量子化されたスペクトルは、多重化部165に出力される。
The
逆量子化部135は、量子化部130で量子化されたスペクトルを逆量子化する。
The
第2逆変換部140は、第2変換部125で行う変換の逆過程であり、逆量子化部135で逆量子化されたスペクトルを周波数ドメインから時間ドメインに逆変換する。
The second
保存部145は、第2逆変換部140で逆変換された信号を保存する。保存部145で逆変換された信号を保存する理由は、次のフレームから時間ドメインで符号化される周波数バンド信号に対する長区間予測部115で長区間予測を行うのに利用するためである。
The
励起信号復号化部150は、励起信号符号化部120で符号化された第2励起信号を復号化する。
The excitation
励起スペクトル生成部155は、逆量子化部135で逆量子化されたスペクトルをホワイトニング処理して励起スペクトルを生成する。
The excitation
高周波数領域の符号化部160は、既定の周波数より小さな領域に該当する周波数バンドに備えられた信号を利用して既定の周波数より大きい領域に該当する周波数バンドの信号を時間ドメインまたは周波数ドメインで適応的に符号化する。高周波数領域の符号化部160で利用する信号は、時間ドメインで符号化する場合、励起信号復号化部150で復号化された第2励起信号であり、周波数ドメインで符号化する場合、励起スペクトル生成部155で生成された励起スペクトルである。
The high frequency
多重化部165は、ドメイン選択部105で符号化された各周波数バンドが符号化されたドメインについての情報、線形予測部110で符号化されたLPC係数、長区間予測部115で符号化された長区間予測が行われた結果、励起信号符号化部120で符号化された第2励起信号、量子化部130で量子化されたスペクトル及び高周波数領域の符号化部160で符号化された結果を含んで多重化することによって、ビットストリームを生成し、出力端子OUTを通じて出力する。
The
図1Bは、本発明による適応的高周波数領域の符号化装置に含まれた高周波数領域の符号化部160の一実施例を示すブロック図であって、前記高周波数領域の符号化部160は、ドメイン選択部170、線形予測部175、乗算部180、利得値符号化部185、ノイズ情報符号化部190及び包絡線情報符号化部195を含んでなる。
FIG. 1B is a block diagram illustrating an embodiment of a high
ドメイン選択部170は、既定の周波数より大きい領域に該当する各周波数バンドに備えられた信号を時間ドメインで符号化するか、周波数ドメインで符号化するかを選択する。
The
ドメイン選択部170で符号化するドメインを選択するに当たって、既定の周波数より大きい領域に該当する周波数バンドを符号化するのに利用される既定の周波数より小さな領域に該当する周波数バンドが時間ドメインで符号化されたか、周波数ドメインで符号化されたかを基準にドメインを選択しうる。もし、既定の周波数より大きい領域に該当する所定の周波数バンドの符号化に用いられる既定の周波数より小さな領域に該当する所定の周波数バンドが時間ドメインで符号化された場合、該当する既定の周波数より大きい領域に該当する周波数バンドは、時間ドメインで符号化すると選択し、もし、既定の周波数より大きい領域に該当する周波数バンドの符号化に用いられる既定の周波数より小さな領域に該当する周波数バンドが周波数ドメインで符号化された場合、該当する既定の周波数より大きい領域に該当する周波数バンドは、周波数ドメインで符号化すると選択する。
In selecting a domain to be encoded by the
線形予測部175は、ドメイン選択部170によって時間ドメインで符号化すると選択された周波数バンドに備えられた信号に対してLPC(Linear Predictive Coding)分析を行ってLPC係数を抽出する。線形予測部175で抽出されたLPC係数は符号化されて出力端子OUT1を通じて図1Aの多重化部165に出力され、復号化器で図7Aに示された一例のような包絡線の復元に用いられる。
The
乗算部180は、入力端子IN1を通じて入力された図1Aの励起信号復号化部150で復号化された第2励起信号と線形予測部175で抽出されたLPC係数による包絡線を乗算する。乗算部180で乗算された信号の例として、図7Bに示された部材番号710に該当する信号がある。
The
利得値符号化部185は、乗算部180で乗算された信号が既定の周波数より小さな領域に備えられた信号である低周波数信号に対して存在するミスマッチングを補償する利得値を計算して符号化する。利得値符号化部185で計算された利得値によって図7Bに示されたように低周波数信号の部材番号720に該当する信号と乗算部180で乗算された信号の部材番号710に該当する信号との境界に存在するミスマッチングを復号化器で図7Cに示されたように補償しうる。また、利得値符号化部185で符号化された利得値は、出力端子OUT2を通じて図1Aの多重化部165に出力する。
The gain
ノイズ情報符号化部190は、ドメイン選択部170によって周波数ドメインで符号化すると選択された周波数バンドにノイズを生成するのに利用する励起スペクトル生成部155で生成された励起スペクトルの周波数バンドを選択して該当周波数バンドについての情報を符号化する。ノイズ情報符号化部190で符号化された周波数バンドについての情報は、出力端子OUT3を通じて図1Aの多重化部165に出力される。
The noise
包絡線情報符号化部195は、既定の周波数より大きい領域に備えられた周波数バンドのうち、ドメイン選択部170で周波数ドメインで符号化すると選択された周波数バンドに備えられたスペクトルの包絡線情報を抽出して符号化する。包絡線情報符号化部195で符号化されたスペクトルの包絡線情報は、出力端子OUT4を通じて図1Aの多重化部165に出力される。
The envelope
図1A及び図1Bの実施例のように符号化するドメインをまず決定し、該決定されたドメインで符号化する開ループ(open−loop)方式に限定して実施せねばならないものではない。周波数ドメイン及び時間ドメインをいずれも符号化した後、該符号化された結果を比較して、さらによいドメインを選択する閉ループ(close−loop)方式でも実施しうる。 As in the embodiment of FIGS. 1A and 1B, a domain to be encoded is first determined, and the present invention is not limited to an open-loop method in which encoding is performed in the determined domain. After encoding both the frequency domain and the time domain, a closed-loop method may be performed in which the encoded results are compared and a better domain is selected.
図2Aは、本発明による適応的高周波数領域の符号化装置の一実施例を示すブロック図であって、前記適応的高周波数領域の符号化装置は、領域分割部200、線形予測部205、変換部210、量子化部215、逆量子化部220、逆変換部225、保存部230、信号分析部235、長区間予測部240及びスイッチング部245、高周波数領域の符号化部250及び多重化部255を含んでなる。
FIG. 2A is a block diagram illustrating an embodiment of an adaptive high-frequency domain encoding apparatus according to the present invention. The adaptive high-frequency domain encoding apparatus includes an
領域分割部200は、入力端子INを通じて入力された信号を既定の周波数より小さな領域に備えられた低周波数信号と既定の周波数より大きい領域に備えられた高周波数信号とに分割する。
The
線形予測部205は、領域分割部200で分割された低周波数信号に対してLPC(Linear Predictive Coding)分析を行ってLPC係数を抽出し、領域分割部200で分割された低周波数信号から短区間相関を除去して、第1励起信号を抽出する。また、線形予測部205は、抽出されたLPC係数を符号化して多重化部255に出力する。
The
変換部210は、線形予測部205で抽出された第1励起信号を時間ドメインから周波数ドメインに変換して励起スペクトルを生成する。
The
量子化部215は、変換部210で生成された励起スペクトルを量子化する。量子化部215で量子化された励起スペクトルは多重化部255に出力される。
The
逆量子化部220は、量子化部215で量子化された励起スペクトルを逆量子化する。
The
逆変換部225は、変換部210で行う変換の逆過程であって、逆量子化部220で逆量子化された励起スペクトルを周波数ドメインから時間ドメインに逆変換して第2励起信号を生成する。
The
保存部230は、逆変換部225で逆変換された第2励起信号を保存する。保存部230で第2励起信号を保存する理由は、次のフレームから時間ドメインで符号化される周波数バンド信号に対する長区間予測部240での長区間予測に利用するためである。
The
信号分析部235は、線形予測部205で抽出された第1励起信号を分析して低周波数信号の特性によって長区間予測部240で長区間予測を行うのか否かを決定する。ここで、信号分析部235で長区間予測を行うかを決定する基準となる低周波数信号の特性に対する例として、線形予測符号化利得値、隣接したフレームの線形予測フィルター間のスペクトル変化、ピッチ遅延及び長区間予測利得値などがある。
The
長区間予測部240は、信号分析部235で長区間予測を行うと決定された場合、線形予測部205で抽出された第1励起信号に対して長区間予測(long−term prediction)を行い、第3励起信号を抽出する。
The long
長区間予測部240で行う長区間予測の例として周期性の連続性程度、周波数スペクトルの傾度程度及びフレームエネルギー程度などがある。ここで、周期性の連続性は、ピッチラグの変化が少なく、ピッチ相関度の高いフレームが一定区間以上連続的に持続される程度でありうる。また、周期性の連続性は、第1フォルマント周波数が非常に低く、ピッチ相関度の高いフレームが一定区間以上連続的に持続される程度でありうる。
Examples of long section prediction performed by the long
スイッチング部245は、信号分析部235で決定された長区間予測を行うか否かによって長区間予測部240で抽出された第2励起信号をスイッチングする。
The
高周波数領域の符号化部160は、逆量子化部220で逆量子化された既定の周波数より小さな領域に備えられた励起スペクトルを利用して周波数ドメインで高周波数信号を符号化する。
The high frequency
多重化部255は、線形予測部205で符号化されたLPC係数、量子化部215で量子化された励起スペクトル、長区間予測部240で行われた長区間予測の結果及び高周波数領域の符号化部250で符号化された結果を含んでビットストリームを生成することによって、多重化して出力端子OUTを通じて出力する。
The
図2Bは、本発明による適応的高周波数領域の符号化装置に含まれた高周波数領域の符号化部250の一実施例を示すブロック図であって、前記高周波数領域の符号化部250は、ノイズ情報符号化部260及び包絡線情報符号化部265を含んでなる。
FIG. 2B is a block diagram illustrating an example of a high
ノイズ情報符号化部260は、入力端子IN1で入力された図2Aの逆量子化部220で逆量子化された励起スペクトルのうち、既定の周波数より大きい高周波数スペクトルの符号化に利用する周波数バンドについての情報を符号化する。ノイズ情報符号化部260で符号化された高周波数スペクトルの符号化に利用する周波数バンドについての情報は出力端子OUT1を通じて図2Aの多重化部255に出力する。
The noise
包絡線情報符号化部265は、入力端子IN2を通じて高周波数スペクトルを入力されて高周波数スペクトルに対する包絡線を抽出し、該抽出された包絡線情報を符号化する。包絡線情報の例として所定の周波数バンド単位で計算されたエネルギー値がある。包絡線情報符号化部265で符号化された包絡線情報を出力端子OUT2を通じて図2Bの多重化部255に出力する。
The envelope
図3Aは、本発明による適応的高周波数領域の符号化装置の一実施例を示すブロック図であって、前記適応的高周波数領域の符号化装置は、領域分割部300、線形予測部305、ドメイン選択部310、長区間予測部315、励起信号符号化部320、変換部325、量子化部330、逆量子化部335、逆変換部340、保存部345、励起信号復号化部350、高周波数領域の符号化部360及び多重化部365を含んでなる。
FIG. 3A is a block diagram illustrating an embodiment of an adaptive high-frequency domain encoding apparatus according to the present invention. The adaptive high-frequency domain encoding apparatus includes an
領域分割部300は、入力端子INを通じて入力された信号を既定の周波数より小さな領域に備えられた信号である低周波数信号と既定の周波数より大きい領域に備えられた信号である高周波数信号とに分割する。
The
線形予測部305は、領域分割部300で分割された低周波数信号に対してLPC分析を行ってLPC係数を抽出し、領域分割部300で分割された低周波数信号から短区間相関を除去して第1励起信号を抽出する。線形予測部305で抽出されたLPC係数は、符号化されて多重化部365に出力される。
The
ドメイン選択部310は、線形予測部305で抽出された第1励起信号を既定の基準によって時間ドメインで符号化するか、周波数ドメインで符号化するかを選択する。ここで、既定の基準の例として、線形予測符号化利得値、隣接したフレームの線形予測フィルター間のスペクトル変化、ピッチ遅延及び長区間予測利得値などがある。
The
もし、ドメイン選択部310で第1励起信号を時間ドメインで符号化すると選択されれば、長区間予測部315は、線形予測部305で抽出された第1励起信号に対して長区間予測を行って第2励起信号を抽出する。
If the
長区間予測部315で行う長区間予測の例として、周期性の連続性程度、周波数スペクトルの傾度程度及びフレームエネルギー程度などがある。ここで、周期性の連続性は、ピッチラグの変化が少なく、ピッチ相関度の高いフレームが一定区間以上連続的に持続される程度でありうる。また、周期性の連続性は、第1フォルマント周波数が非常に低く、ピッチ相関度の高いフレームが一定区間以上連続的に持続される程度でありうる。
Examples of long section prediction performed by the long
励起信号符号化部320は、長区間予測部315で抽出された第2励起信号を符号化する。
The excitation
もし、ドメイン選択部310で第1励起信号を周波数ドメインで符号化すると選択されれば、変換部325は、線形予測部305で抽出された第1励起信号を時間ドメインから周波数ドメインに変換して励起スペクトルを生成する。
If the
量子化部330は、変換部325で生成された励起スペクトルを量子化する。量子化部330で量子化された励起スペクトルは多重化部365に出力される。
The
逆量子化部335は、量子化部330で量子化された励起スペクトルを逆量子化する。
The
逆変換部340は、変換部325で行う変換の逆過程であって、逆量子化部335で逆量子化された励起スペクトルを周波数ドメインから時間ドメインに逆変換する。
The
保存部345は、逆変換部340で逆変換された第3励起信号を保存する。保存部345で第3励起信号を保存する理由は、次のフレームに対する符号化時に時間ドメインで符号化する周波数バンドに備えられた信号に対して長区間予測部315での長区間予測に利用するためである。
The
励起信号復号化部350は、励起信号符号化部320で符号化された第2励起信号を復号化する。
The excitation
高周波数領域の符号化部360は、既定の周波数より小さな領域に該当する信号またはスペクトルを利用して時間ドメインまたは周波数ドメインで適応的に既定の周波数より大きい領域に該当する信号を符号化する。高周波数領域の符号化部360で利用する信号は、時間ドメインで符号化する場合、励起信号復号化部350で復号化された励起信号であり、高周波数領域の符号化部360で利用するスペクトルは、周波数ドメインで符号化する場合、逆量子化部335で逆量子化された励起スペクトルである。
The high frequency
多重化部365は、線形予測部305で抽出されたLPC係数、長区間予測部315で行った長区間予測の結果、ドメイン選択部310で選択された低周波数信号を符号化したドメインについての情報、励起信号符号化部320で符号化された励起信号、量子化部330で量子化された励起スペクトル及び高周波数領域の符号化部360で符号化された結果を含んで多重化することによって、ビットストリームを生成し、出力端子OUTを通じて出力する。
The
図3Bは、本発明による適応的高周波数領域の符号化装置に含まれた高周波数領域の符号化部360の一実施例を示すブロック図であって、前記高周波数領域の符号化部360は、ドメイン選択部370、線形予測部375、乗算部380、利得値符号化部385、ノイズ情報符号化部390及び包絡線情報符号化部395を含んでなる。
FIG. 3B is a block diagram illustrating an embodiment of a high
ドメイン選択部370は、入力端子IN1を通じて入力された図3Aのドメイン選択部310で選択された既定の周波数より小さな領域に備えられた信号である低周波数信号を符号化するドメインによって既定の周波数より大きい領域に備えられた信号である高周波数信号を符号化するドメインを選択する。もし、図3Aのドメイン選択部310で低周波数信号を周波数ドメインで符号化すると選択されれば、ドメイン選択部370も高周波数信号を周波数ドメインで符号化すると選択する。そして、図3Aのドメイン選択部310で低周波数信号を時間ドメインで符号化すると選択されれば、ドメイン選択部370も高周波数信号を時間ドメインで符号化すると選択する。
The
線形予測部375は、ドメイン選択部370で高周波数信号を時間ドメインで符号化すると選択されれば、入力端子IN2を通じて入力された高周波数信号に対するLPC分析を行ってLPC係数を抽出する。線形予測部375で抽出されたLPC係数は、符号化されて出力端子OUT1を通じて図3Aの多重化部365に出力され、復号化器で、図7Aに示された包絡線の復元に用いられる。
If the
乗算部380は、入力端子IN3を通じて入力された図3Aの励起信号復号化部350で復号化された励起信号と線形予測部375で抽出されたLPC係数による高周波数信号の包絡線を乗算する。乗算部380で乗算された信号の例として、図7Bに図示された部材番号710に該当する信号がある。
The
利得値符号化部385は、乗算部380で乗算された信号が低周波数信号に対して存在するミスマッチングを補償する利得値を計算して符号化する。図7Bに示されたように低周波数信号の部材番号720に該当する信号と乗算部380で乗算された信号の部材番号710に該当する信号の境界に存在するミスマッチングを図7Cに示されたように補償する。そして、利得値符号化部385で符号化された利得値は、出力端子OUT2を通じて図3Aの多重化部365に出力する。
The gain
ノイズ情報符号化部390は、逆量子化部335で逆量子化された励起スペクトルのうち、復号化器で高周波数スペクトルの復号化に使用する周波数バンドを選択し、該選択された周波数バンドについての情報を符号化する。ノイズ情報符号化部390で符号化された周波数バンドについての情報は出力端子OUT3を通じて出力される。
The noise
包絡線情報符号化部395は、高周波数スペクトルの包絡線情報を抽出して符号化する。ここで、包絡線情報の例として所定の周波数バンド単位で計算されたエネルギー値がある。包絡線情報符号化部395で符号化された高周波数スペクトルの包絡線情報は、出力端子OUT4を通じて図3Aの多重化部365に出力される。
The envelope
図3A及び図3Bの実施例のように符号化するドメインをさらに決定し、該決定されたドメインで符号化する開ループ方式に限定して実施せねばならないものではない。周波数ドメインと時間ドメインとの両方に符号化を行った後、符号化された結果を比較して、さらによいドメインを選択する閉ループ方式でも実施しうる。 As in the embodiment of FIGS. 3A and 3B, the domain to be encoded is further determined, and the present invention is not limited to the open loop method of encoding in the determined domain. It is also possible to implement a closed loop method in which encoding is performed in both the frequency domain and the time domain, and then the encoded results are compared to select a better domain.
図4Aは、本発明による適応的高周波数領域復号化装置の一実施例を示すブロック図であって、前記適応的高周波数領域復号化装置は、逆多重化部400、ドメイン判断部405、励起信号復号化部410、長区間合成部415、線形合成部420、逆量子化部430、第2逆変換部433、励起スペクトル生成部435、高周波数領域復号化部440及び第1逆変換部445を含んでなる。
FIG. 4A is a block diagram illustrating an embodiment of an adaptive high frequency domain decoding device according to the present invention, which includes a
逆多重化部400は、入力端子INを通じて符号化端から入力されたビットストリームを逆多重化する。逆多重化部400では、符号化器で符号化された各周波数バンドが符号化されたドメインについての情報、符号化器で符号化されたLPC係数、符号化器で符号化された長区間予測が行われた結果、符号化器で符号化された励起信号、符号化器で量子化されたスペクトル及び低周波数領域に備えられた信号またはスペクトルを利用して高周波数信号を復号化しうる情報を含んで逆多重化する。
The
ドメイン判断部405は、既定の周波数より小さな領域の低周波数領域に備えられた周波数バンドが符号化器で符号化されたドメインについての情報を逆多重化部400から入力されて各周波数バンドが符号化されたドメインを判断する。
The
励起信号復号化部410は、ドメイン判断部405で、時間ドメインで符号化された周波数バンドと判断された周波数バンドに備えられた符号化器で符号化された励起信号を逆多重化部400から入力されて復号化する。
The excitation
長区間合成部415は、ドメイン判断部405で、時間ドメインで符号化された周波数バンドと判断された周波数バンドに対して符号化器で長区間予測が行われた結果を逆多重化部400から入力されて復号化し、励起信号復号化部410で復号化された励起信号に長区間予測が行われた結果を合成する。
The
線形合成部420は、ドメイン判断部405で、時間ドメインで符号化されたと判断された周波数バンドのLPC係数を逆多重化部400から入力されて復号化し、長区間合成部415で合成された信号にLPC係数を合成する。
The
逆量子化部430は、ドメイン判断部405で、周波数ドメインで符号化されたと判断された周波数バンドに備えられたスペクトルを逆多重化部400から入力されて逆量子化する。
The
第2逆変換部433は、図1Aの第2変換部125で行う変換の逆過程として逆量子化部430で逆量子化されたスペクトルを周波数ドメインから時間ドメインに逆変換する。
The second
励起スペクトル生成部435は、逆量子化部430で逆量子化されたスペクトルをホワイトニング処理して励起スペクトルを生成する。
The excitation
高周波数領域復号化部440は、励起信号復号化部410で復号化された所定周波数バンドに備えられた励起信号、または励起スペクトル生成部435で復号化された所定周波数バンドに備えられた励起スペクトルを利用して、既定の周波数より大きい領域に備えられた信号である高周波数信号を復号化する。
The high frequency
第1逆変換部445は、図1Aの第1変換部100で行う変換の逆過程であって、信号合成部425で合成された所定周波数バンドに備えられた信号または第2逆変換部433で逆変換された所定周波数バンドに備えられた信号及び高周波数領域復号化部440で復号化された高周波数信号を合成して時間ドメインに合成することによって逆変換して、出力端子OUTを通じて出力する。第1逆変換部445で変換する方式としてQMF(Quadrature Mirror Filterbank)及びLOT(lapped orthogonal transform)などがある。
The first
しかし、第1逆変換部445は、FV−MLT(Frequency Varying Modulated Lapped Transform)のように所定の周波数バンド別に時間ドメインまたは周波数ドメインで示した信号を、時間ドメインに合成して、高周波数領域復号化部440で別途に周波数ドメインから時間ドメインに変換する逆変換部480を備えずとも実施しうる。
However, the first
図4Bは、本発明による適応的高周波数領域の復号化装置に含まれた高周波数領域復号化部440の一実施例を示すブロック図であって、前記適応的高周波数領域復号化部440は、ドメイン判断部450、線形合成部455、乗算部460、利得値適用部465、ノイズ情報復号化部470、包絡線調節部475及び逆変換部480を含んでなる。
FIG. 4B is a block diagram illustrating an embodiment of a high frequency
ドメイン判断部450は、既定の周波数より大きい領域である高周波数領域に含まれた周波数バンドに備えられた信号が時間ドメインで符号化されたか、周波数ドメインで符号化されたかを判断する。ドメイン判断部450で各周波数バンドが符号化されたドメインは、符号化端からドメインと関連した情報を伝送され、図4Aの逆多重化部400から入力されて分かるか、高周波数領域に含まれた各周波数バンドで利用しようとする既定の周波数より小さな領域の低周波数領域に含まれた周波数バンドが復号化されたドメインを図4Aのドメイン判断部405から入力されて分かる。
The
線形合成部455は、高周波数領域に含まれた周波数バンドのうち、時間ドメインで符号化された周波数バンドに対するLPC係数を入力端子IN1を通じて図4Aの逆多重化部400から入力されて復号化する。線形合成部455で復号化されたLPC係数によって図7Aに示されたグラフのような包絡線を復元しうる。
The
乗算部460は、入力端子IN2を通じて入力された図4Aの励起信号復号化部150で復号化された励起信号と線形合成部455で復号化されたLPC係数による包絡線とを乗算する。乗算部460で乗算された信号の例として、図7Bに示された部材番号710に該当する信号がある。
The
利得値適用部465は、入力端子IN3を通じて入力された利得値を復号化して乗算部460で乗算された信号に適用する。利得値適用部465で利得値を適用することによって、復号化された低周波数信号と復号化された高周波数信号との間に存在するミスマッチングを補償しうる。例えば、乗算部460で乗算された高周波数信号は、図7Bに示されたように低周波数信号との境界面にミスマッチングが発生するが、利得値適用部465で利得値を適用することによって、図7Cに示されたように、低周波数信号と高周波数信号とのミスマッチングの発生を防止する。利得値適用部465で利得値が適用された信号は、出力端子OUT1を通じて第1逆変換部445に出力される。
The gain
ノイズ復号化部470は、図4Aの励起スペクトル生成部435で生成された励起スペクトルのうち、高周波数領域に備えられた周波数バンドスペクトルの復号化に利用する周波数バンドについての情報を入力端子IN4を通じて図4Aの逆多重化部400から入力されて復号化する。ノイズ復号化部470は、復号化した情報を利用して該当する周波数バンドに備えられた励起スペクトルをドメイン判断部450で周波数ドメインで符号化すると判断された周波数バンドにパッチするか、対称的にフォールディング(folding)することでノイズを生成する。例えば、ノイズ復号化部535は、図8Aに示された低周波数領域に備えられた励起スペクトルを高周波数領域に図8Bに示されたようにパッチする。
The
包絡線調節部475は、符号化器で符号化された高周波数スペクトルの包絡線情報を入力端子IN5を通じて図4Bの逆多重化部400から入力されて復号化する。包絡線調節部475で復号化された高周波数スペクトルの包絡線情報を利用してノイズ復号化部470で生成されたノイズの包絡線を調節する。例えば、包絡線調節部475は、図8Bに示されたノイズ復号化部470で生成されたノイズを高周波数スペクトルの包絡線情報を利用して図8Cに示されたように包絡線を調節する。
The
逆変換部480は、図1Aの第2変換部125で行う変換の逆過程であって、包絡線調節部475で包絡線が調節されたノイズを周波数ドメインから時間ドメインに逆変換して高周波数信号を生成する。
The
図5Aは、本発明による適応的高周波数領域復号化装置の一実施例を示すブロック図であって、前記適応的高周波数領域復号化装置は、逆多重化部500、逆量子化部505、逆変換部510、長区間合成部515、線形合成部520及び高周波数領域復号化部525を含んでなる。
FIG. 5A is a block diagram illustrating an embodiment of an adaptive high frequency domain decoding device according to the present invention, in which the adaptive high frequency domain decoding device includes a
逆多重化部500は、入力端子INを通じて符号化端から入力されたビットストリームを逆多重化する。逆多重化部500では、符号化器で符号化されたLPC係数、符号化器で量子化された励起スペクトル、符号化器で行われた長区間予測の結果及び既定の周波数より小さな領域の低周波数領域に備えられた励起スペクトルを利用して既定の周波数より大きい領域に備えられた高周波数信号を復号化しうる情報を逆多重化する。
The
逆量子化部505は、符号化器で量子化された低周波数領域に備えられた励起スペクトルを逆多重化部500から入力されて逆量子化する。
The
逆変換部510は、図2Aの変換部210で行う変換の逆過程であって、逆量子化部505で逆量子化された励起スペクトルを周波数ドメインから時間ドメインに逆変換して励起信号を生成する。
The
長区間合成部515は、符号化器で低周波数領域に備えられた励起信号に対して長区間予測が行われた結果を逆多重化部500から入力されて復号化して逆変換部510で生成された励起信号に長区間予測が行われた結果を選択的に合成する。長区間合成部515で長区間予測が行われた結果を合成する場合は、符号化器で長区間予測が行われた結果が符号化されて伝送された励起信号に限って合成する。
The
線形合成部520は、LPC係数を逆多重化部500から入力されて復号化する。線形合成部520は、LPC係数を復号化した後、長区間合成部515で長区間予測が行われた結果を合成しない場合、逆変換部510で生成された励起信号にLPC係数を合成し、長区間合成部515で長区間予測が行われた結果を合成した場合、長区間合成部515で合成された信号にLPC係数を合成する。線形合成部520で合成された信号は、最終的に低周波数領域に備えられる低周波数信号が復元されたものである。
The
高周波数領域復号化部525は、逆量子化部505で逆量子化された低周波数領域に備えられた励起スペクトルを利用して高周波数信号を復号化する。
The high frequency
領域合成部530は、線形合成部520で復元された低周波数信号と高周波数領域復号化部525で復号化された高周波数信号とを合成して出力端子OUTを通じて出力する。
The
図5Bは、本発明による適応的高周波数領域復号化装置に含まれた高周波数領域復号化部525の一実施例を示すブロック図であって、前記高周波数領域復号化部525は、ノイズ復号化部535、包絡線調節部540及び逆変換部545を含んでなる。
FIG. 5B is a block diagram illustrating an example of a high frequency
ノイズ復号化部535は、既定の周波数より小さな領域である低周波数領域に備えられた励起スペクトルのうち、既定の周波数より大きい高周波数スペクトルの符号化に利用する周波数バンドについての情報を逆多重化部500から入力端子IN1を通じて入力されて復号化する。ノイズ復号化部535は、復号化された情報によって入力端子IN1’を通じて逆量子化部505で逆量子化された励起スペクトルのうち、利用する所定の励起スペクトルを選択し、該当する励起スペクトルを既定の周波数より大きい領域にパッチするか、対称的にフォールディングすることで、ノイズを生成する。例えば、ノイズ復号化部535は、図8Aに示された低周波数領域に備えられた励起スペクトルを高周波数領域に図8Bに示されたようにパッチする。
The
包絡線調節部540は、入力端子IN2を通じて図5Aの逆多重化部500から符号化器で符号化された高周波数スペクトルの包絡線情報を入力されて復号化する。包絡線調節部540は、復号化された高周波数スペクトルの包絡線情報を利用してノイズ復号化部535で生成されたノイズの包絡線を調節する。例えば、包絡線調節部540は、図8Bに示されたノイズ復号化部535で生成されたノイズを高周波数スペクトルの包絡線情報を利用して図8Cに示されたように包絡線を調節する。
The
逆変換部545は、図2Aの変換部210で行う変換の逆過程であって、包絡線調節部540で包絡線の調節されたノイズを周波数ドメインから時間ドメインに逆変換して高周波数信号を生成する。逆変換部545で生成された高周波数信号は出力端子OUT1を通じて図2Bの領域合成部530に出力される。
The
図6Aは、本発明による高周波数領域復号化装置の一実施例を示すブロック図であって、前記高周波数領域復号化装置は、逆多重化部600、ドメイン判断部605、励起信号復号化部610、長区間合成部615、逆量子化部620、逆変換部625、線形合成部630、高周波数領域復号化部635及び領域合成部640を含んでなる。
FIG. 6A is a block diagram illustrating an embodiment of a high frequency domain decoding apparatus according to the present invention, which includes a
逆多重化部600は、入力端子INを通じて符号化端から入力されたビットストリームを逆多重化する。逆多重化部600では、符号化器で選択された低周波数信号を符号化したドメインについての情報、符号化器で符号化されたLPC係数、符号化器で行った長区間予測の結果、符号化器で符号化された励起信号、符号化器で量子化された励起スペクトル及び既定の周波数より小さな領域に備えられた低周波数信号または低周波数スペクトルを利用して高周波数信号を復号化する情報を逆多重化する。
The
ドメイン判断部605は、既定の周波数より小さな領域に該当する低周波数領域が符号化器で符号化されたドメインの情報を逆多重化部600から入力されて復号化して低周波数領域が時間ドメインで符号化されたか、周波数ドメインで符号化されたかを判断する。
The
ドメイン判断部605で低周波数領域が時間ドメインで符号化されたと判断されれば、励起信号復号化部610は、符号化器で符号化された低周波数領域の励起信号を逆多重化部400から入力されて復号化する。
If the
長区間合成部615は、既定の周波数より小さな領域に備えられた信号である低周波数信号に対して符号化器で長区間予測が行われた結果を逆多重化部600から入力されて復号化し、励起信号復号化部610で復号化された励起信号に長区間予測が行われた結果を合成する。
The
ドメイン判断部605で低周波数領域が周波数ドメインで符号化されたと判断されれば、逆量子化部620は、符号化器で量子化された励起スペクトルを逆多重化部600から入力されて逆量子化する。
If the
逆変換部625は、図3Aの変換部325で行う変換の逆過程であって、逆量子化部620で逆量子化された励起スペクトルを周波数ドメインから時間ドメインに逆変換して励起信号を生成する。
The
線形合成部630は、低周波数信号のLPC係数を逆多重化部600から入力されて復号化し、長区間合成部615で合成された励起信号または逆変換部625で生成された励起信号に復号化されたLPC係数を合成する。線形合成部630で合成された信号は、最終的に低周波数領域に備えられる低周波数信号が復元されたものである。
The
高周波数領域復号化部635は、逆量子化部620で逆量子化された励起スペクトルまたは励起信号復号化部610で復号化された励起信号を利用して高周波数信号を復号化する。もし、低周波数領域が時間ドメインで符号化されたならば、高周波数領域復号化部635は、逆量子化部620で逆量子化された励起スペクトルを利用して高周波数信号を復号化し、もし、低周波数領域が周波数ドメインで符号化されたならば、高周波数領域復号化部635は励起信号複花部610で復号化された励起信号を利用して高周波数信号を復号化する。
The high frequency
領域合成部640は、線形合成部630で復元された低周波数信号と高周波数領域復号化部635で復号化された高周波数信号とを合成して出力端子OUTを通じて出力する。
The
図6Bは、本発明による高周波数領域復号化装置に含まれた高周波数領域復号化部635の一実施例を示すブロック図であって、前記高周波数領域復号化部635は、ドメイン判断部645、線形合成部650、乗算部655、ノイズ復号化部665、包絡線調節部670及び逆変換部675を含んでなる。
FIG. 6B is a block diagram illustrating an embodiment of a high frequency
ドメイン判断部645は、既定の周波数より小さな領域に該当する低周波数領域が符号化されたドメインに対して既定の周波数より大きい領域に該当する高周波数領域を時間ドメインで復号化するか、周波数ドメインで復号化するかを判断する。
The
もし、ドメイン判断部645で高周波数領域を時間ドメインで復号化すると判断されれば、線形合成部650は、既定の周波数より大きい領域に備えられた高周波数信号に対するLPC係数を図6Aの逆多重化部600から入力端子IN1を通じて入力されて復号化する。線形合成部650で復号化されたLPC係数によって図7Aに示されたグラフのような包絡線を復元しうる。
If the
乗算部655は、入力端子IN2を通じて入力された図6Aの励起信号復号化部610で復号化された励起信号に、線形合成部650で復号化されたLPC係数による包絡線を乗算する。乗算部655で乗算された信号の例として、図7Bに示された部材番号710に該当する信号がある。
The
利得値適用部660は、入力端子IN3を通じて入力された利得値を図6Aの逆多重化部600から入力されて復号化して乗算部655で乗算された信号に適用する。利得値適用部660で利得値を適用することによって、図6Aの線形合成部630で復元された低周波数信号と復号化された高周波数信号との間に存在するミスマッチングを補償しうる。例えば、乗算部655で乗算された高周波数信号は、図7Bに示されたように低周波数信号との境界面にミスマッチングが発生するが、利得値適用部660で利得値を適用することによって、図7Cに示されたように低周波数信号と高周波数信号との間のミスマッチングの発生を防止する。利得値適用部660で利得値が適用された信号は、出力端子OUT1を通じて図6Aの領域合成部640に出力される。
The gain
もし、ドメイン判断部645が高周波数領域を、周波数ドメインで復号化すると判断されれば、ノイズ復号化部665は入力端子IN4を通じて図6Aの逆量子化部620で逆量子化された励起スペクトルを入力されて高周波数領域にパッチするか、対称的にフォールディングすることでスペクトルを生成する。例えば、図8Aに示された励起スペクトルを高周波数領域に図8Bに示されたようにパッチする。
If the
包絡線調節部670は、入力端子IN5を通じて図6Aの逆多重化部600から符号化器で符号化された高周波数スペクトルの包絡線情報を入力されて復号化する。包絡線調節部670は、復号化された高周波数スペクトルの包絡線情報を利用してノイズ復号化部665で生成されたスペクトルの包絡線を調節する。例えば、包絡線調節部670は、図8Bに図示されたノイズ復号化部665で生成されたスペクトルに対して高周波数スペクトルの包絡線情報を利用して図8Cに示されたように包絡線を調節する。
The
逆変換部675は、図3Aの変換部325で行う変換の逆過程であって、包絡線調節部670で包絡線が調節されたスペクトルを周波数ドメインから時間ドメインに逆変換して高周波数信号を生成する。
The
図9Aは、本発明による適応的高周波数領域の符号化方法に対する一実施例を示すフローチャートである。 FIG. 9A is a flowchart illustrating an embodiment of an adaptive high frequency domain encoding method according to the present invention.
まず、入力された信号を所定の周波数バンド別に時間ドメインで示すように変換する(第900段階)。第900段階で変換する方式として、QMF及びLOTなどがある。 First, the input signal is converted according to a predetermined frequency band as shown in the time domain (operation 900). There are QMF, LOT, etc. as a method of conversion in the 900th stage.
しかし、第900段階では、FV−MLTのように入力された信号を所定の周波数バンド別に時間ドメインまたは周波数ドメインで示すように変換することによって、第925段階を行わずとも、第905段階で選択されたドメインで第900段階で変換して実施しうる。
However, in
第900段階で変換された各周波数バンドの信号のうち、既定の周波数より小さな領域に含まれる周波数バンドの信号を既定の基準によって時間ドメインで符号化するか、周波数ドメインで符号化するかを選択する(第905段階)。ここで、既定の基準の例として、線形予測符号化利得値、隣接したフレームの線形予測フィルター間のスペクトル変化、ピッチ遅延及び長区間予測利得値などがある。
Select whether to encode in the time domain or in the frequency domain a frequency band signal included in a region smaller than a predetermined frequency among the signals in each frequency band converted in
第905段階で、時間ドメインで符号化すると決定された周波数バンドに備えられた信号に対してLPC分析を行ってLPC係数を抽出して符号化し、第905段階で時間ドメインで符号化すると決定された周波数バンドに備えられた信号から短区間相関を除去して第1励起信号を抽出する(第910段階)。
In
第910段階で抽出された第1励起信号に対して長区間予測を行い、第2励起信号を抽出する(第915段階)。
A long interval prediction is performed on the first excitation signal extracted in
第915段階で行う長区間予測の例として、周期性の連続性程度、周波数スペクトルの傾度程度及びフレームエネルギー程度などがある。ここで、周期性の連続性は、ピッチラグの変化が少なく、ピッチ相関度の高いフレームが一定区間以上連続的に持続される程度でありうる。また、周期性の連続性は、第1フォルマント周波数が非常に低く、ピッチ相関度の高いフレームが一定区間以上連続的に持続される程度でありうる。
Examples of long interval prediction performed in
第915段階で抽出された第2励起信号を符号化する(第920段階)。第905段階で、周波数ドメインで符号化すると決定された周波数バンドに備えられた信号を時間ドメインから周波数ドメインに変換してスペクトルを生成する(第925段階)。第925段階で生成されたスペクトルを量子化する(第930段階)。第930段階で量子化されたスペクトルを逆量子化する(第935段階)。第925段階で行う変換の逆過程として第935段階で逆量子化されたスペクトルを周波数ドメインから時間ドメインに逆変換する(第940段階)。
The second excitation signal extracted in
第2逆変換部140で逆変換された信号を保存する(第945段階)。第945段階で逆変換された信号を保存する理由は、次のフレームから時間ドメインで符号化する周波数バンドに備えられた信号に対して第915段階での長区間予測に利用するためである。
The signal inversely transformed by the second
第920段階で符号化された第2励起信号を復号化する(第950段階)。第935段階で逆量子化されたスペクトルをホワイトニング処理して励起スペクトルを生成する(第955段階)。
The second excitation signal encoded in
既定の周波数より小さな領域に該当する周波数バンドに備えられた信号を利用して既定の周波数より大きい領域に該当する周波数バンドの信号を時間ドメインまたは周波数ドメインで適応的に符号化する(第960段階)。第960段階で利用する信号は、時間ドメインで符号化する場合、第950段階で復号化された第2励起信号であり、周波数ドメインで符号化する場合、第955段階で生成された励起スペクトルである。
A signal in a frequency band corresponding to a region larger than the predetermined frequency is adaptively encoded in a time domain or a frequency domain using a signal provided in a frequency band corresponding to a region smaller than the predetermined frequency (operation 960). ). The signal used in
第905段階で符号化された各周波数バンドが符号化されたドメインについての情報、第910段階で符号化されたLPC係数、第915段階で符号化された長区間予測が行われた結果、第920段階で符号化された第2励起信号、第930段階で量子化されたスペクトル及び第960段階で符号化された結果を含んで多重化することによって、ビットストリームを生成する(第965段階)。
Information about the domain in which each frequency band encoded in
図9Bは、本発明による適応的高周波数領域の符号化方法に含まれた第960段階に対する一実施例を示すフローチャートである。
FIG. 9B is a flowchart illustrating an example of
まず、既定の周波数より大きい領域に該当する各周波数バンドに備えられた信号を時間ドメインで符号化するか、周波数ドメインで符号化するかを選択する(第970段階)。 First, it is selected whether to encode a signal provided in each frequency band corresponding to a region larger than a predetermined frequency in the time domain or in the frequency domain (operation 970).
第970段階で符号化するドメインを選択するにおいて、既定の周波数より大きい領域に該当する周波数バンドの符号化に用いられる既定の周波数より小さな領域に該当する周波数バンドが時間ドメインで符号化されたか、周波数ドメインで符号化されたかを基準にドメインを選択しうる。もし、既定の周波数より大きい領域に該当する所定の周波数バンドの符号化に用いられる既定の周波数より小さな領域に該当する所定の周波数バンドが時間ドメインで符号化された場合、該当する既定の周波数より大きい領域に該当する周波数バンドは時間ドメインで符号化するものと選択し、もし、既定の周波数より大きい領域に該当する周波数バンドの符号化に用いられる既定の周波数より小さな領域に該当する周波数バンドが周波数ドメインで符号化された場合、該当する既定の周波数より大きい領域に該当する周波数バンドは周波数ドメインで符号化するものと選択する。
In selecting a domain to be encoded in
第970段階で、時間ドメインで符号化すると選択された周波数バンドに備えられた信号に対してLPC分析を行ってLPC係数を抽出する(第975段階)。第975段階で抽出されたLPC係数は、復号化器で図7Aに示された一例のような包絡線の復元に用いられる。
In
乗算部180は、図9Aの第950段階で復号化された第2励起信号と第975段階で抽出されたLPC係数による包絡線を乗算する(第980段階)。第980段階で乗算された信号の例として、図7Bに図示された部材番号710に該当する信号がある。
The
第980段階で乗算された信号が既定の周波数より小さな領域に備えられた信号である低周波数信号に対して存在するミスマッチングを補償する利得値を計算して符号化する(第985段階)。第985段階で計算された利得値によって、図7Bに示されたように低周波数信号の部材番号720に該当する信号と第980段階で乗算された信号の部材番号710に該当する信号との境界に存在するミスマッチングを復号化器で、図7Cに示されたように補償しうる。
A gain value that compensates for mismatching existing in a low-frequency signal that is a signal provided in a region where the signal multiplied in operation 980 is smaller than a predetermined frequency is calculated and encoded (operation 985). The boundary between the signal corresponding to the
第970段階で、周波数ドメインで符号化すると選択された周波数バンドにノイズを生成するのに利用する第955段階で生成された励起スペクトルの周波数バンドを選択して該当周波数バンドについての情報を符号化する(第990段階)。
In
既定の周波数より大きい領域に備えられた周波数バンドのうち、第970段階で周波数ドメインで符号化すると選択された周波数バンドに備えられたスペクトルの包絡線情報を抽出して符号化する(第995段階)。
Out of frequency bands provided in a region larger than a predetermined frequency, if encoding is performed in the frequency domain in
図9A及び図9Bの実施例のように符号化するドメインを、先に決定し、該決定されたドメインで符号化する開ループ方式に限定して実施せねばならないものではない。周波数ドメインと時間ドメインの両方に符号化を行った後、符号化された結果を比較して、さらによいドメインを選択する閉ループ方式でも実施しうる。 The domain to be encoded as in the embodiment of FIGS. 9A and 9B is not limited to the open loop method in which the domain to be encoded is determined in advance and encoded in the determined domain. It is also possible to implement a closed loop method in which encoding is performed in both the frequency domain and the time domain, and then the encoded results are compared to select a better domain.
図10Aは、本発明による適応的高周波数領域の符号化方法に対する一実施例を示すフローチャートである。 FIG. 10A is a flowchart illustrating an embodiment of an adaptive high frequency domain encoding method according to the present invention.
まず、入力された信号を既定の周波数より小さな領域に備えられた低周波数信号と既定の周波数より大きい領域に備えられた高周波数信号とに分割する(第1000段階)。 First, the input signal is divided into a low frequency signal provided in a region smaller than a predetermined frequency and a high frequency signal provided in a region larger than the predetermined frequency (operation 1000).
第1000段階で分割された低周波数信号に対してLPC分析を行ってLPC係数を抽出し、第1000段階で分割された低周波数信号から短区間相関を除去して第1励起信号を抽出する(第1005段階)。
LPC analysis is performed on the low frequency signal divided in
第1005段階で抽出された第1励起信号を時間ドメインから周波数ドメインに変換して励起スペクトルを生成する(第1010段階)。
The first excitation signal extracted in
第1010段階で生成された励起スペクトルを量子化する(第1015段階)。第1015段階で量子化された励起スペクトルを逆量子化する(第1020段階)。第1010段階で行う変換の逆過程であって、第1020段階で逆量子化された励起スペクトルを周波数ドメインから時間ドメインに逆変換して第2励起信号を生成する(第1025段階)。
The excitation spectrum generated in
第1025段階で逆変換された第2励起信号を保存する(第1030段階)。第1030段階で第2励起信号を保存する理由は、次のフレームに対する符号化時に時間ドメインで符号化する周波数バンドに備えられた信号に対して第1040段階での長区間予測に利用するためである。
The second excitation signal inversely transformed in
第1005段階で抽出された第1励起信号を分析して、低周波数信号の特性によって長区間予測部240で長区間予測を行うか否かを決定する(第1035段階)。第1035段階で長区間予測を行うか否かを決定する基準となる低周波数信号の特性に対する例として、線形予測符号化利得値、隣接したフレームの線形予測フィルター間のスペクトル変化、ピッチ遅延及び長区間予測利得値などがある。
The first excitation signal extracted in
第1035段階で長区間予測を行うと決定された場合、第1005段階で抽出された第1励起信号に対して長区間予測を行い、第3励起信号を抽出する(第1040段階)。
If it is determined in
第1040段階で行う長区間予測の例として、周期性の連続性程度、周波数スペクトルの傾度程度及びフレームエネルギー程度などがある。ここで、周期性の連続性は、ピッチラグの変化が少なく、ピッチ相関度の高いフレームが一定区間以上連続的に持続される程度でありうる。また、周期性の連続性は、第1フォルマント周波数が非常に低く、ピッチ相関度の高いフレームが一定区間以上連続的に持続される程度でありうる。
Examples of long interval prediction performed in
第1020段階で逆量子化された既定の周波数より小さな領域に備えられた励起スペクトルを利用して周波数ドメインで高周波数信号を符号化する(第1050段階)。 A high frequency signal is encoded in the frequency domain using an excitation spectrum provided in a region smaller than the predetermined frequency inversely quantized in operation 1020 (operation 1050).
第1005段階で符号化されたLPC係数、第1015段階で量子化された励起スペクトル、第1040段階で行われた長区間予測の結果及び第1050段階で符号化された結果を含んでビットストリームを生成することによって多重化する(第1055段階)。
A bitstream including the LPC coefficients encoded in
図10Bは、本発明による適応的高周波数領域の符号化方法に含まれた第1050段階に対する一実施例を示すフローチャートである。
FIG. 10B is a flowchart illustrating an embodiment for
まず、図10Aの第1020段階で逆量子化された励起スペクトルのうち、既定の周波数より大きい高周波数スペクトルの符号化に利用する周波数バンドについての情報を符号化する(第1060段階)。
First, information about a frequency band used for encoding a high frequency spectrum larger than a predetermined frequency among the excitation spectrum inversely quantized in
第1060段階後に、高周波数スペクトルを入力されて高周波数スペクトルに対する包絡線を抽出し、該抽出された包絡線情報を符号化する(第1065段階)。包絡線情報の例として所定の周波数バンド単位で計算されたエネルギー値がある。
After
図11Aは、本発明による適応的高周波数領域の符号化方法に対する一実施例を示すフローチャートである。 FIG. 11A is a flowchart illustrating an embodiment of an adaptive high frequency domain encoding method according to the present invention.
まず、入力された信号を既定の周波数より小さな領域に備えられた信号である低周波数信号と既定の周波数より大きい領域に備えられた信号である高周波数信号とに分割する(第1100段階)。 First, the input signal is divided into a low frequency signal, which is a signal provided in a region smaller than a predetermined frequency, and a high frequency signal, which is a signal provided in a region higher than a predetermined frequency (step 1100).
第1100段階で分割された低周波数信号に対してLPC分析を行ってLPC係数を抽出し、第1100段階で分割された低周波数信号から短区間相関を除去して第1励起信号を抽出する(第1105段階)。
LPC analysis is performed on the low frequency signal divided in
第1105段階で抽出された第1励起信号を既定の基準によって時間ドメインで符号化するか、周波数ドメインで符号化するかを選択する(第1110段階)。ここで、既定の基準の例として、線形予測符号化利得値、隣接したフレームの線形予測フィルター間のスペクトル変化、ピッチ遅延及び長区間予測利得値などがある。
The first excitation signal extracted in
もし、第1110段階で第1励起信号を時間ドメインで符号化すると選択されれば、第1105段階で抽出された第1励起信号に対して長区間予測を行って第2励起信号を抽出する(第1115段階)。
If it is selected in
第1115段階で行う長区間予測の例として周期性の連続性程度、周波数スペクトルの傾度程度及びフレームエネルギー程度などがある。ここで、周期性の連続性は、ピッチラグの変化が少なく、ピッチ相関度の高いフレームが一定区間以上連続的に持続される程度でありうる。また、周期性の連続性は第1フォルマント周波数が非常に低くてピッチ相関度の高いフレームが一定区間以上連続的に持続される程度でありうる。
Examples of long interval prediction performed in
第1115段階で抽出された第2励起信号を符号化する(第1120段階)。
The second excitation signal extracted in
もし、第1110段階で第1励起信号を周波数ドメインで符号化すると選択されれば、第1105段階で抽出された第1励起信号を時間ドメインから周波数ドメインに変換して励起スペクトルを生成する(第1125段階)。
If it is selected in
第1125段階で生成された励起スペクトルを量子化する(第1130段階)。第1130段階で量子化された励起スペクトルを逆量子化する(第1135段階)。第1125段階で行う変換の逆過程であって、第1135段階で逆量子化された励起スペクトルを周波数ドメインから時間ドメインに逆変換する(第1140段階)。
The excitation spectrum generated in
第1140段階で逆変換された第3励起信号を保存する(第1145段階)。第1145段階で、前記第3励起信号を保存する理由は、次のフレームから時間ドメインで符号化される周波数バンド信号に対する第1115段階で行われる長区間予測時に前記第3励起信号を利用するためである。第1120段階で符号化された第2励起信号を復号化する(第1150段階)。
The third excitation signal inversely transformed in
既定の周波数より小さな領域に該当する信号またはスペクトルを利用して時間ドメインまたは周波数ドメインで適応的に既定の周波数より大きい領域に該当する信号を符号化する(第1160段階)。第1160段階で利用する信号は、時間ドメインで符号化する場合、第1150段階で復号化された励起信号であり、第1160段階で利用するスペクトルは、周波数ドメインで符号化する場合、第1135段階で逆量子化された励起スペクトルである。
A signal corresponding to a region larger than a predetermined frequency is adaptively encoded in a time domain or a frequency domain using a signal or spectrum corresponding to a region smaller than a predetermined frequency (operation 1160). The signal used in
第1105段階で抽出されたLPC係数、第1110段階で選択された低周波数信号を符号化したドメインについての情報、第1115段階で行った長区間予測の結果、第1120段階で符号化された励起信号、第1130段階で量子化された励起スペクトル及び第1160段階で符号化された結果を含んで多重化することによってビットストリームを生成する(第1165段階)。
LPC coefficients extracted in
図11Bは、本発明による適応的高周波数領域の符号化方法に含まれた第1160段階に対する一実施例を示すフローチャートである。
FIG. 11B is a flowchart illustrating an example of
まず、図11Aの第1110段階で選択された既定の周波数より小さな領域に備えられた信号である低周波数信号を符号化するドメインによって既定の周波数より大きい領域に備えられた信号である高周波数信号を符号化するドメインを選択する(第1170段階)。もし、図11Aの第1110段階で、低周波数信号を周波数ドメインで符号化すると選択されれば、第1170段階でも、高周波数信号を周波数ドメインで符号化すると選択する。そして、図11Aの第1110段階で低周波数信号を時間ドメインで符号化すると選択されれば、第1170段階でも、高周波数信号を時間ドメインで符号化すると選択する。
First, a high-frequency signal that is a signal provided in a region larger than the predetermined frequency by a domain that encodes a low-frequency signal that is a signal provided in a region smaller than the predetermined frequency selected in
第1170段階で、高周波数信号を時間ドメインで符号化すると選択されれば、高周波数信号に対してLPC分析を行ってLPC係数を抽出する(第1175段階)。第1175段階で抽出されたLPC係数は、復号化器で図7Aに示された包絡線の復元に用いられる。
If the high frequency signal is selected to be encoded in the time domain in
図11Aの第1150段階で復号化された第2励起信号と第1175段階で抽出されたLPC係数による高周波数信号の包絡線とを乗算する(第1180段階)。第1180段階で乗算された信号の例として、図7Bに示された部材番号710に該当する信号がある。
The second excitation signal decoded in operation 1150 of FIG. 11A is multiplied by the envelope of the high frequency signal based on the LPC coefficients extracted in operation 1175 (operation 1180). An example of the signal multiplied in
第1180段階で乗算された信号が低周波数信号に対し存在するミスマッチングを補償する利得値を計算して符号化する(第1185段階)。図7Bに示されたように、低周波数信号の部材番号720に該当する信号と第1180段階で乗算された信号の部材番号710に該当する信号との境界に存在するミスマッチングを図7Cに示されたように補償する。
In
第1135段階で逆量子化された励起スペクトルのうち、復号化器で高周波数スペクトルを復号化するのに利用する周波数バンドを選択して選択された周波数バンドについての情報を符号化する(第1190段階)。 Of the excitation spectrum inversely quantized in operation 1135, the decoder selects a frequency band to be used for decoding a high frequency spectrum and encodes information about the selected frequency band (1190). Stage).
第1190段階後に、高周波数スペクトルの包絡線情報を抽出して符号化する(第1195段階)。ここで、包絡線情報の例として所定の周波数バンド単位で計算されたエネルギー値がある。
After
図11A及び図11Bの実施例のように、符号化するドメインを先に決定し、該決定されたドメインで符号化する開ループ方式に限定して実施せねばならないものではない。周波数ドメインと時間ドメインの両方に符号化を行った後、符号化された結果を比較し、さらによいドメインを選択する閉ループ方式でも実施しうる。 As in the embodiment of FIGS. 11A and 11B, the domain to be encoded is determined first, and the present invention is not limited to the open loop method in which encoding is performed with the determined domain. It is also possible to implement a closed loop method in which encoding is performed in both the frequency domain and the time domain, and then the encoded results are compared to select a better domain.
図12Aは、本発明による適応的高周波数領域復号化方法に対する一実施例を示すフローチャートである。 FIG. 12A is a flowchart illustrating an embodiment of an adaptive high frequency domain decoding method according to the present invention.
まず、符号化端から入力されたビットストリームを逆多重化する(第1200段階)。第1200段階では、符号化器で符号化された各周波数バンドが符号化されたドメインについての情報、符号化器で符号化されたLPC係数、符号化器で符号化された長区間予測が行われた結果、符号化器で符号化された励起信号、符号化器で量子化されたスペクトル及び低周波数領域に備えられた信号またはスペクトルを利用して高周波数信号を復号化しうる情報を含んで逆多重化する。
First, the bitstream input from the encoding end is demultiplexed (operation 1200). In
既定の周波数より小さな領域の低周波数領域に備えられた周波数バンドが符号化器で符号化されたドメインについての情報を入力されて、各周波数バンドが符号化されたドメインを判断する(第1205段階)。
In
第1205段階で、時間ドメインで符号化された周波数バンドであると判断された周波数バンドに備えられた符号化器で符号化された励起信号を復号化する(第1210段階)。
In
第1205段階で、時間ドメインで符号化された周波数バンドであると判断された周波数バンドに対して符号化器で長区間予測が行われた結果を復号化し、第1210段階で復号化された励起信号に長区間予測が行われた結果を合成する(第1215段階)。
In
第1205段階で、時間ドメインで符号化されたと判断された周波数バンドのLPC係数を復号化し、第1215段階で合成された信号にLPC係数を合成する(第1220段階)。
In
第1205段階で周波数ドメインで符号化されたと判断された周波数バンドに備えられたスペクトルを逆量子化する(第1230段階)。
A spectrum provided in a frequency band determined to be encoded in the frequency domain in
図9Aの第1225段階で行う変換の逆過程であって、第1230段階で逆量子化されたスペクトルを周波数ドメインから時間ドメインに逆変換する(第1233段階)。
In FIG. 9A, the inverse process of the transform performed at step 1225, the spectrum inversely quantized at
第1230段階で逆量子化されたスペクトルをホワイトニング処理して励起スペクトルを生成する(第1235段階)。
The spectrum inversely quantized in
第1210段階で復号化された所定周波数バンドに備えられた励起信号または第1235段階で復号化された所定周波数バンドに備えられた励起スペクトルを利用して既定の周波数より大きい領域に備えられた信号である高周波数信号を復号化する(第1240段階)。
A signal provided in a region larger than a predetermined frequency using the excitation signal provided in the predetermined frequency band decoded in
図9Aの第900段階で行う変換の逆過程であって、第1225段階で合成された所定周波数バンドに備えられた信号または第1233段階で逆変換された所定周波数バンドに備えられた信号及び第1240段階で復号化された高周波数信号を合成して時間ドメイン信号に合成することによって逆変換する(第1245段階)。第1245段階で変換する方式でQMF及びLOTなどがある。
9A is a reverse process of the conversion performed in
しかし、第1245段階では、FV−MLTのように所定の周波数バンド別に時間ドメインまたは周波数ドメインで示した信号を時間ドメイン信号に合成して第1240段階で別途に周波数ドメインから時間ドメインに変換する第1280段階を行わずとも実施しうる。
However, in
図12Bは、本発明による適応的高周波数領域復号化方法に含まれた第1240段階に対する一実施例を示すフローチャートである。
FIG. 12B is a flowchart illustrating an example of
まず、既定の周波数より大きい領域の高周波数領域に含まれた周波数バンドに備えられた信号が時間ドメインで符号化されたか、周波数ドメインで符号化されたかを判断する(第1250段階)。第1250段階で、各周波数バンドが符号化されたドメインは符号化端からドメインと関連した情報を伝送されて分かるか、高周波数領域に含まれた各周波数バンドで利用しようとする既定の周波数より小さな領域の低周波数領域に含まれた周波数バンドが復号化されたドメインを図12Aの第1205段階から分かる。
First, it is determined whether a signal provided in a frequency band included in a higher frequency region than a predetermined frequency is encoded in the time domain or in the frequency domain (operation 1250). In
高周波数領域に含まれた周波数バンドのうち、時間ドメインで符号化された周波数バンドに対するLPC係数を復号化する(第1255段階)。第1255段階で復号化されたLPC係数によって図7Aに示されたグラフのような包絡線を復元しうる。
Among the frequency bands included in the high frequency region, LPC coefficients for the frequency band encoded in the time domain are decoded (operation 1255). The envelope as shown in the graph of FIG. 7A may be restored using the LPC coefficients decoded in
図12Aの第1250段階で復号化された励起信号と、第1255段階で復号化されたLPC係数による包絡線とを乗算する(第1260段階)。第1260段階で乗算された信号の例として、図7Bに示された部材番号710に該当する信号がある。
The excitation signal decoded in
第1260段階後に、利得値を復号化して第1260段階で乗算された信号に適用する(第1265段階)。第1265段階で、利得値を適用することによって、復号化された低周波数信号と復号化された高周波数信号との間に存在するミスマッチングを補償しうる。例えば、第1260段階で乗算された高周波数信号は、図7Bに示されたように、低周波数信号との境界面にミスマッチングが発生するが、第1265段階で利得値を適用することによって、図7Cに示されたように低周波数信号と高周波数信号とのミスマッチングの発生を防止する。
After
図12Aの第1235段階で生成された励起スペクトルのうち、高周波数領域に備えられた周波数バンドのスペクトルを復号化するのに利用する周波数バンドについての情報を復号化する(第1270段階)。第1270段階では、復号化した情報を利用して、該当する周波数バンドに備えられた励起スペクトルを、第1250段階で周波数ドメインで符号化するものと判断された周波数バンドにパッチするか、対称的にフォールディングすることでノイズを生成する。例えば、第1270段階では、図8Aに示された低周波数領域に備えられた励起スペクトルを高周波数領域に図8Bに示されたようにパッチする。
Of the excitation spectrum generated in
符号化器で符号化された高周波数スペクトルの包絡線情報を復号化する(第1275段階)。第1275段階で復号化された高周波数スペクトルの包絡線情報を利用して、第1270段階で生成されたノイズの包絡線を調節する。例えば、第1275段階では、図8Bに示された第1270段階で生成されたノイズに対して高周波数スペクトルの包絡線情報を利用して図8Cに示されたように包絡線を調節する。
The envelope information of the high frequency spectrum encoded by the encoder is decoded (operation 1275). The envelope of the noise generated in
図9Aの第925段階で行う変換の逆過程であって、第1275段階で包絡線が調節されたノイズを周波数ドメインから時間ドメインに逆変換して高周波数信号を生成する(第1280段階)。
9A is a reverse process of the conversion performed in
図13Aは、本発明による適応的高周波数領域復号化方法に対する一実施例を示すフローチャートである。 FIG. 13A is a flowchart illustrating an embodiment of an adaptive high frequency domain decoding method according to the present invention.
まず、符号化端から入力されたビットストリームを逆多重化する(第1300段階)。第1300段階では符号化器で符号化されたLPC係数、符号化器で量子化された励起スペクトル、符号化器で行われた長区間予測の結果及び既定の周波数より小さな領域の低周波数領域に備えられた励起スペクトルを利用して既定の周波数より大きい領域に備えられた高周波数信号を復号化しうる情報を逆多重化する。
First, the bitstream input from the encoding end is demultiplexed (operation 1300). In
符号化器で量子化された低周波数領域に備えられた励起スペクトルを逆量子化する(第1305段階)。 The excitation spectrum provided in the low frequency region quantized by the encoder is inversely quantized (step 1305).
図10Aの第1010段階で行う変換の逆過程であって、第1305段階で逆量子化された励起スペクトルを周波数ドメインから時間ドメインに逆変換して励起信号を生成する(第1310段階)。
In the reverse process of the transformation performed in
符号化器で低周波数領域に備えられた励起信号に対して長区間予測が行われた結果を復号化し、第1310段階で生成された励起信号に長区間予測が行われた結果を選択的に合成する(第1315段階)。第1315段階で長区間予測が行われた結果を合成する場合は、符号化器で長区間予測が行われた結果が符号化されて伝送された励起信号に限って合成する。
The encoder decodes the result of the long interval prediction performed on the excitation signal provided in the low frequency region, and selectively selects the result of the long interval prediction performed on the excitation signal generated in
LPC係数を復号化する(第1320段階)。第1320段階では、LPC係数を復号化した後、第1315段階で長区間予測が行われた結果を合成しない場合、第1310段階で生成された励起信号にLPC係数を合成し、第1315段階で長区間予測が行われた結果を合成した場合、第1315段階で合成された信号にLPC係数を合成する。第1320段階で合成された信号は、最終的に低周波数領域に備えられる低周波数信号が復元されたものである。
The LPC coefficient is decoded (operation 1320). In
第1305段階で逆量子化された低周波数領域に備えられた励起スペクトルを利用して高周波数信号を復号化する(第1325段階)。第1320段階で復元された低周波数信号と第1325段階で復号化された高周波数信号とを合成する(第1330段階)。
The high frequency signal is decoded using the excitation spectrum provided in the low frequency region inversely quantized in operation 1305 (operation 1325). The low-frequency signal restored in
図13Bは、本発明による適応的高周波数領域復号化方法に含まれた第1325段階に対する一実施例を示すフローチャートである。
FIG. 13B is a flowchart illustrating an example of
まず、既定の周波数より小さな領域である低周波数領域に備えられた励起スペクトルのうち、既定の周波数より大きい高周波数スペクトルの符号化に利用する周波数バンドについての情報を復号化する(第1335段階)。第1335段階では、復号化された情報によって第1305段階で逆量子化された励起スペクトルのうち、利用する所定の励起スペクトルを選択し、該当する励起スペクトルを既定の周波数より大きい領域にパッチしたり対称的にフォールディングすることでノイズを生成する。例えば、第1335段階では、図8Aに図示された低周波数領域に備えられた励起スペクトルを高周波数領域に図8Bに示されたようにパッチする。
First, information about a frequency band used for encoding a high frequency spectrum larger than a predetermined frequency among the excitation spectra provided in a low frequency region which is a region smaller than the predetermined frequency is decoded (operation 1335). . In
符号化器で符号化された高周波数スペクトルの包絡線情報を復号化する(第1340段階)。第1340段階では、復号化された高周波数スペクトルの包絡線情報を利用して第1335段階で生成されたノイズの包絡線を調節する。例えば、第1340段階では、図8Bに図示された第1335段階で生成されたノイズを高周波数スペクトルの包絡線情報を利用して図8Cに示されたように包絡線を調節する。
The envelope information of the high frequency spectrum encoded by the encoder is decoded (operation 1340). In
図11Aの第1110段階で行う変換の逆過程であって、第1340段階で包絡線が調節されたノイズを周波数ドメインから時間ドメインに逆変換して高周波数信号を生成する(第1345段階)。
In FIG. 11A, a reverse process of the transformation performed in
図14Aは、本発明による適応的高周波数領域復号化方法に対する一実施例を示すフローチャートである。 FIG. 14A is a flowchart illustrating an embodiment of an adaptive high frequency domain decoding method according to the present invention.
まず、符号化端から入力されたビットストリームを逆多重化する(第1400段階)。第1400段階では、符号化器で選択された低周波数信号を符号化したドメインについての情報、符号化器で符号化されたLPC係数、符号化器で行った長区間予測の結果、符号化器で符号化された励起信号、符号化器で量子化された励起スペクトル及び既定の周波数より小さな領域に備えられた低周波数信号または低周波数スペクトルを利用して高周波数信号を復号化する情報を逆多重化する。
First, the bitstream input from the encoding end is demultiplexed (operation 1400). In
既定の周波数より小さな領域に該当する低周波数領域が符号化器で符号化されたドメインの情報を復号化して、低周波数領域が時間ドメインで符号化されたか、周波数ドメインで符号化されたかを判断する(第1405段階)。 Decodes information in the domain where the low frequency region corresponding to the region smaller than the predetermined frequency was encoded by the encoder to determine whether the low frequency region was encoded in the time domain or in the frequency domain (Step 1405).
第1405段階で、低周波数領域が時間ドメインで符号化されたと判断されれば、符号化器で符号化された低周波数領域の励起信号を復号化する(第1410段階)。
If it is determined in
既定の周波数より小さな領域に備えられた信号である低周波数信号に対して符号化器で長区間予測が行われた結果を復号化し、第1410段階で復号化された励起信号に長区間予測が行われた結果を合成する(第1415段階)。
A result obtained by performing the long section prediction on the low frequency signal, which is a signal provided in a region smaller than the predetermined frequency, is decoded, and the long section prediction is applied to the excitation signal decoded in
第1405段階で、低周波数領域が周波数ドメインで符号化されたと判断されれば、符号化器で量子化された励起スペクトルを逆量子化する(第1420段階)。
If it is determined in
図11Aの第1125段階で行う変換の逆過程であって、第1420段階で逆量子化された励起スペクトルを周波数ドメインから時間ドメインに逆変換して励起信号を生成する(第1425段階)。
In the inverse process of the transformation performed in
低周波数信号のLPC係数を復号化し、第1415段階で合成された励起信号または第1425段階で生成された励起信号に復号化されたLPC係数を合成する(第1430段階)。第1430段階で合成された信号は、最終的に低周波数領域に備えられる低周波数信号が復元されたものである。
The LPC coefficients of the low frequency signal are decoded, and the decoded LPC coefficients are synthesized with the excitation signal synthesized in
第1420段階で逆量子化された励起スペクトルまたは第1410段階で復号化された励起信号を利用して高周波数信号を復号化する(第1435段階)。もし、低周波数領域が時間ドメインで符号化されたならば、第1435段階では、第1420段階で逆量子化された励起スペクトルを利用して高周波数信号を復号化し、もし、低周波数領域が周波数ドメインで符号化されたならば、第1435段階では、第1410段階で復号化された励起信号を利用して高周波数信号を復号化する。
The high frequency signal is decoded using the excitation spectrum inversely quantized in
第1430段階で復元された低周波数信号と第1435段階で復号化された高周波数信号とを合成する(第1440段階)。
The low-frequency signal restored in
図14Bは、本発明による適応的高周波数領域復号化方法に含まれた第1435段階に対する一実施例を示すフローチャートである。
FIG. 14B is a flowchart illustrating an example of
まず、既定の周波数より小さな領域に該当する低周波数領域が符号化されたドメインを既定の周波数より大きい領域に該当する高周波数領域に、時間ドメインで復号化するか、周波数ドメインで復号化するかを判断する(第1445段階)。 First, whether the domain in which the low frequency region corresponding to the region smaller than the predetermined frequency is encoded is decoded into the high frequency region corresponding to the region larger than the predetermined frequency in the time domain or in the frequency domain. (Step 1445).
もし、第1445段階で、高周波数領域を時間ドメインで復号化すると判断されれば、既定の周波数より大きい領域に備えられた高周波数信号に対するLPC係数を復号化する(第1450段階)。第1450段階で復号化されたLPC係数によって図7Aに示されたグラフのような包絡線を復元しうる。
If it is determined in
図12Aの第1410段階で復号化された励起信号に第1450段階で復号化されたLPC係数による包絡線を乗算する(第1455段階)。第1455段階で乗算された信号の例として、図7Bに示された部材番号710に該当する信号がある。
The excitation signal decoded in
符号化器で符号化された利得値を復号化して、第1455段階で乗算された信号に適用する(第1460段階)。第1460段階で利得値を適用することによって、図14Aの第1430段階で復元された低周波数信号と復号化された高周波数信号との間に存在するミスマッチングを補償しうる。例えば、第1455段階で乗算された高周波数信号は、図7Bに示されたように低周波数信号との境界面にミスマッチングが発生するが、第1460段階で利得値を適用することによって、図7Cに示されたように低周波数信号と高周波数信号との間のミスマッチングの発生を防止する。
The gain value encoded by the encoder is decoded and applied to the signal multiplied in operation 1455 (operation 1460). By applying the gain value in
もし、第1445段階で高周波数領域を周波数ドメインで復号化すると判断されれば、図14Aの第1420段階で逆量子化された励起スペクトルを高周波数領域にパッチするか、対称的にフォールディングすることでスペクトルを生成する(第1465段階)。例えば、第1465段階は、図8Aに示された励起スペクトルを高周波数領域に、図8Bに示されたようにパッチする。
If it is determined in
符号化器で符号化された高周波数スペクトルの包絡線情報を入力されて復号化する(第1470段階)。第1470段階では、復号化された高周波数スペクトルの包絡線情報を利用して、第1465段階で生成されたスペクトルの包絡線を調節する。例えば、第1470段階では、図8Bに示された第1465段階で生成されたスペクトルを高周波数スペクトルの包絡線情報を利用して図8Cに示されたように包絡線を調節する。
The high frequency spectrum envelope information encoded by the encoder is input and decoded (operation 1470). In
図11Aの第1125段階で行う変換の逆過程であって、第1470段階で包絡線が調節されたスペクトルを周波数ドメインから時間ドメインに逆変換して高周波数信号を生成する(第1475段階)。
In FIG. 11A, a reverse process of the transformation performed in
本発明は、コンピュータで読取り可能な記録媒体にコンピュータ(情報処理機能を有する装置をいずれも含む)で読取り可能なコードとして具現することが可能である。コンピュータで読取り可能な記録媒体は、コンピュータシステムによって読取り可能なデータが保存されるあらゆる種類の記録装置を含む。コンピュータで読取り可能な記録装置の例として、ROM(Read Only Memory)、RAM(Random Access Memory)、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ保存装置などがある。 The present invention can be embodied as a computer readable code on a computer readable recording medium (including any apparatus having an information processing function). Computer-readable recording media include all types of recording devices that can store data that can be read by a computer system. Examples of a computer-readable recording device include a ROM (Read Only Memory), a RAM (Random Access Memory), a CD-ROM, a magnetic tape, a floppy (registered trademark) disk, and an optical data storage device.
本発明についての理解を助けるために図面に図示された実施例を参考にして説明されたが、これは例示的なものに過ぎず、当業者ならば、これより多様な変形及び均等な他実施例が可能であるということを理解できるであろう。したがって、本発明の真の技術的保護範囲は、特許請求の範囲により決まるべきである。 Although the present invention has been described with reference to the embodiments illustrated in the drawings to assist the understanding of the present invention, this is merely exemplary, and those skilled in the art will recognize that various modifications and equivalent other implementations are possible. It will be understood that examples are possible. Accordingly, the true technical protection scope of the present invention should be determined by the appended claims.
本発明による適応的高周波数領域の符号化方法及び装置によれば、既定の周波数より小さな領域に備えられた信号を利用して既定の周波数より大きい領域に備えられた信号を時間ドメインまたは周波数ドメインで適応的に符号化するか、復号化する。 According to the adaptive high frequency domain encoding method and apparatus of the present invention, a signal provided in a region larger than a predetermined frequency is converted into a time domain or a frequency domain using a signal provided in a region smaller than the predetermined frequency. To adaptively encode or decode.
これにより、少ないビットを利用してオーディオ信号を符号化するか、復号化するにもかかわらず、高周波数領域に該当する信号の音質を低下させないために、コーディング効率を極大化させうる。 Thereby, although the audio signal is encoded or decoded using a small number of bits, the coding efficiency can be maximized in order not to deteriorate the sound quality of the signal corresponding to the high frequency region.
Claims (54)
前記時間ドメインに変換された周波数バンドを、既設定の周波数より小さい低周波数領域に設けられた励起信号を利用して符号化する時間ドメイン符号化部と、
前記周波数ドメインに変換された周波数バンドを、前記低周波数領域に設けられた励起スペクトルを利用して符号化する周波数ドメイン符号化部とを備えることを特徴とする適応的高周波数領域の符号化装置。 A domain converter that selects a high-frequency signal, which is a signal provided in a region larger than a preset frequency, for each frequency band, and selects either the time domain or the frequency domain and converts it,
A time domain encoding unit that encodes the frequency band converted to the time domain using an excitation signal provided in a low frequency region smaller than a preset frequency;
An adaptive high frequency domain encoding device comprising: a frequency domain encoding unit that encodes the frequency band converted to the frequency domain using an excitation spectrum provided in the low frequency region .
前記時間ドメインに変換された周波数バンドに設けられた信号に対して線形予測を行う線形予測部と、
前記行われた線形予測によって生成された包絡線に前記励起信号を乗算する乗算部と、
前記低周波数領域に設けられた信号の低周波数信号と前記励起信号が乗算された包絡線との境界を一致させる利得値を計算して符号化する利得値符号化部とを備えることを特徴とする請求項1に記載の適応的高周波数領域の符号化装置。 The time domain encoding unit includes:
A linear prediction unit that performs linear prediction on a signal provided in a frequency band converted to the time domain;
A multiplier for multiplying the envelope generated by the performed linear prediction by the excitation signal;
A gain value encoding unit that calculates and encodes a gain value that matches a boundary between a low frequency signal of the signal provided in the low frequency region and an envelope multiplied by the excitation signal; The adaptive high frequency domain encoding apparatus according to claim 1.
前記励起スペクトルのうち前記周波数ドメインに変換された周波数バンドに設けられたスペクトルを符号化するのに利用する周波数バンドを選択し、前記選択された周波数バンドに係る情報を符号化するノイズ情報符号化部と、
前記周波数ドメインに変換された周波数バンドに設けられたスペクトルの包絡線を抽出して符号化する包絡線情報符号化部とを備えることを特徴とする請求項1に記載の適応的高周波数領域の符号化装置。 The frequency domain encoding unit includes:
Noise information encoding that selects a frequency band to be used for encoding a spectrum provided in a frequency band converted to the frequency domain from the excitation spectrum, and encodes information related to the selected frequency band And
The adaptive high frequency domain according to claim 1, further comprising: an envelope information encoding unit that extracts and encodes an envelope of a spectrum provided in a frequency band converted to the frequency domain. Encoding device.
前記低周波数領域に設けられた低周波数信号のうち、時間ドメインで示した周波数バンドに設けられた信号に対して、線形予測または長区間予測を行って抽出された信号であることを特徴とする請求項1に記載の適応的高周波数領域の符号化装置。 The excitation signal is
Among the low frequency signals provided in the low frequency region, the signal is extracted by performing linear prediction or long interval prediction on a signal provided in a frequency band indicated in a time domain. The adaptive high frequency domain encoding apparatus according to claim 1.
前記低周波数領域に設けられた低周波数スペクトルのうち、周波数ドメインで示した周波数バンドに設けられたスペクトルに対して、ホワイトニング処理されたスペクトルであることを特徴とする請求項1に記載の適応的高周波数領域の符号化装置。 The excitation spectrum is
2. The adaptive spectrum according to claim 1, wherein the spectrum is a whitening-processed spectrum with respect to a spectrum provided in a frequency band indicated in a frequency domain among low-frequency spectra provided in the low-frequency region. High frequency domain encoding device.
前記高周波数スペクトルの包絡線を抽出して符号化する包絡線情報符号化部とを備えることを特徴とする適応的高周波数領域の符号化装置。 Selects the frequency band used to encode the high frequency spectrum, which is the spectrum provided in the region higher than the preset frequency, among the excitation spectrum provided in the low frequency region, which is the region smaller than the preset frequency. A noise information encoding unit that encodes information related to the selected frequency band;
An adaptive high-frequency domain encoding apparatus comprising: an envelope information encoding unit that extracts and encodes an envelope of the high-frequency spectrum.
前記低周波数領域に設けられた低周波数スペクトルに対してホワイトニング処理されたスペクトルであることを特徴とする請求項6に記載の適応的高周波数領域の符号化装置。 The excitation spectrum is
7. The adaptive high frequency region encoding apparatus according to claim 6, wherein the low frequency spectrum provided in the low frequency region is a spectrum subjected to whitening processing.
前記ドメイン選択部で時間ドメインが選択されれば、前記高周波数信号を既設定の周波数より小さい領域である低周波数領域に設けられた励起信号を利用して符号化する時間ドメイン符号化部と、
前記ドメイン選択部で周波数ドメインが選択されれば、前記高周波数信号を周波数ドメインに変換して高周波数スペクトルを生成し、前記高周波数スペクトルを前記低周波数領域に設けられた励起スペクトルを利用して符号化する周波数ドメイン符号化部とを備えることを特徴とする適応的高周波数領域の符号化装置。 A domain selection unit that selects any one of the time domain and the frequency domain according to a preset reference with respect to a high-frequency signal that is a signal provided in a region larger than the preset frequency;
If a time domain is selected by the domain selection unit, a time domain encoding unit that encodes the high frequency signal using an excitation signal provided in a low frequency region that is a region smaller than a preset frequency;
If a frequency domain is selected by the domain selection unit, the high frequency signal is converted into a frequency domain to generate a high frequency spectrum, and the high frequency spectrum is generated using an excitation spectrum provided in the low frequency region. An adaptive high frequency domain encoding apparatus comprising: a frequency domain encoding unit for encoding.
前記ドメイン選択部で時間ドメインが選択されれば、前記高周波数信号に対して線形予測を行う線形予測部と、
前記行われた線形予測によって生成された包絡線に前記励起信号を乗算する乗算部と、
前記低周波数領域に設けられた信号である低周波数信号と前記励起信号が乗算された包絡線との境界を一致させる利得値を計算して符号化する利得値符号化部とを備えることを特徴とする請求項8に記載の適応的高周波数領域の符号化装置。 The time domain encoding unit includes:
If a time domain is selected by the domain selection unit, a linear prediction unit that performs linear prediction on the high-frequency signal;
A multiplier for multiplying the envelope generated by the performed linear prediction by the excitation signal;
A gain value encoding unit that calculates and encodes a gain value that matches a boundary between a low frequency signal that is a signal provided in the low frequency region and an envelope that is multiplied by the excitation signal; The adaptive high frequency domain encoding apparatus according to claim 8.
前記ドメイン選択部で時間ドメインが選択されれば、前記高周波数信号を周波数ドメインに変換し、前記高周波数スペクトルを生成する変換部と、
前記励起スペクトルのうち前記高周波数スペクトルを符号化するのに利用する周波数バンドを選択し、前記選択された周波数バンドに係る情報を符号化するノイズ情報符号化部と、
前記高周波数スペクトルの包絡線を抽出して符号化する包絡線情報符号化部とを備えることを特徴とする請求項8に記載の適応的高周波数領域の符号化装置。 The frequency domain encoding unit includes:
When the time domain is selected by the domain selection unit, the high frequency signal is converted into a frequency domain, and the conversion unit generates the high frequency spectrum;
A noise information encoding unit that selects a frequency band to be used for encoding the high frequency spectrum from the excitation spectrum, and encodes information related to the selected frequency band;
9. The adaptive high frequency region encoding apparatus according to claim 8, further comprising an envelope information encoding unit that extracts and encodes an envelope of the high frequency spectrum.
前記低周波数領域に設けられた低周波数信号に対して線形予測または長区間予測を行って抽出された信号であることを特徴とする請求項8に記載の適応的高周波数領域の符号化装置。 The excitation signal is
9. The adaptive high frequency region encoding apparatus according to claim 8, wherein the low frequency signal is a signal extracted by performing linear prediction or long interval prediction on a low frequency signal provided in the low frequency region.
前記低周波数領域に設けられた低周波数信号に対して線形予測または長区間予測を行って抽出された信号を周波数ドメインに変換したスペクトル、または前記低周波数領域に設けられたスペクトルである低周波数スペクトルに対してホワイトニング処理されたスペクトルであることを特徴とする請求項8に記載の適応的高周波数領域の符号化装置。 The excitation spectrum is
A spectrum obtained by converting a signal extracted by performing linear prediction or long-term prediction to a low frequency signal provided in the low frequency region into a frequency domain, or a low frequency spectrum that is a spectrum provided in the low frequency region 9. The adaptive high-frequency region encoding apparatus according to claim 8, wherein the spectrum is a whitening-processed spectrum.
前記時間ドメインに符号化されたと判断された周波数バンドを既設定の周波数より小さい低周波数領域に設けられた励起信号を利用して復号化する時間ドメイン復号化部と、
前記周波数ドメインに符号化されたと判断された周波数バンドを低周波数領域に設けられた励起スペクトルを利用して復号化する周波数ドメイン復号化部とを備えることを特徴とする適応的高周波数領域の復号化装置。 A domain determination unit that determines a domain in which each frequency band provided in a high frequency region, which is a region larger than a preset frequency, is encoded;
A time domain decoding unit that decodes a frequency band determined to be encoded in the time domain using an excitation signal provided in a low frequency region smaller than a preset frequency;
A frequency domain decoding unit that decodes a frequency band determined to be encoded in the frequency domain by using an excitation spectrum provided in a low frequency region, and performing adaptive high frequency region decoding Device.
前記時間ドメインに変換された周波数バンドに設けられた信号に対するLPC(Linear Predictive Coding)係数を復号化する線形合成部と、
前記復号化されたLPC係数によって生成された包絡線に前記励起信号を乗算する乗算部と、
前記低周波数領域に設けられた信号である低周波数信号と前記高周波数領域に設けられた高周波数信号との境界を一致させる利得値を復号化し、前記励起信号が乗算された包絡線に適用する利得値適用部とを備えることを特徴とする請求項13に記載の適応的高周波数領域の復号化装置。 The time domain decoding unit includes:
A linear synthesis unit that decodes LPC (Linear Predictive Coding) coefficients for a signal provided in the frequency band converted to the time domain;
A multiplier for multiplying the envelope generated by the decoded LPC coefficients by the excitation signal;
A gain value that matches a boundary between a low-frequency signal that is a signal provided in the low-frequency region and a high-frequency signal provided in the high-frequency region is decoded and applied to an envelope that is multiplied by the excitation signal. 14. The adaptive high frequency domain decoding apparatus according to claim 13, further comprising a gain value application unit.
前記励起スペクトルのうち前記高周波数領域を復号化するのに利用する周波数バンドに係る情報を利用し、前記周波数ドメインに符号化されたと判断された周波数バンドにノイズを生成するノイズ生成部と、
前記周波数ドメインに変換された周波数バンドに設けられたスペクトルの包絡線を復号化し、前記生成されたノイズの包絡線を調節する包絡線調節部とを備えることを特徴とする請求項13に記載の適応的高周波数領域の復号化装置。 The frequency domain decoding unit includes:
A noise generation unit that generates information in a frequency band determined to be encoded in the frequency domain, using information on a frequency band used to decode the high frequency region of the excitation spectrum;
The envelope adjustment unit for decoding an envelope of a spectrum provided in a frequency band converted into the frequency domain and adjusting an envelope of the generated noise. Adaptive high frequency domain decoder.
前記低周波数領域に設けられた低周波数信号に対して線形予測または長区間予測を行って抽出された信号であることを特徴とする請求項13に記載の適応的高周波数領域の復号化装置。 The excitation signal is
14. The adaptive high frequency domain decoding apparatus according to claim 13, wherein the apparatus is a signal extracted by performing linear prediction or long interval prediction on a low frequency signal provided in the low frequency domain.
前記低周波数領域に設けられた低周波数スペクトルに対してホワイトニング処理されたスペクトルであることを特徴とする請求項13に記載の適応的高周波数領域の復号化装置。 The excitation spectrum is
14. The adaptive high frequency domain decoding apparatus according to claim 13, wherein the low frequency spectrum provided in the low frequency domain is a spectrum subjected to whitening processing.
前記高周波数領域に設けられた高周波数スペクトルの包絡線を復号化し、前記生成されたノイズの包絡線を調節する包絡線調節部とを備えることを特徴とする適応的高周波数領域の復号化装置。 Of the excitation spectrum provided in the low frequency region that is a region smaller than the preset frequency, using information related to the frequency band used to decode the high frequency region that is a region greater than the preset frequency, A noise generator for generating noise in the high frequency region;
An adaptive high frequency domain decoding device comprising: an envelope adjustment unit that decodes an envelope of a high frequency spectrum provided in the high frequency region and adjusts an envelope of the generated noise .
前記低周波数領域に設けられた低周波数スペクトルに対してホワイトニング処理されたスペクトルであることを特徴とする請求項18に記載の適応的高周波数領域の復号化装置。 The excitation spectrum is
19. The adaptive high frequency domain decoding apparatus according to claim 18, wherein the low frequency spectrum provided in the low frequency domain is a spectrum subjected to whitening processing.
前記ドメイン判断部で前記高周波数領域が時間ドメインで符号化されたと判断されれば、前記高周波数領域に設けられた高周波数信号を、既設定の周波数より小さい領域である低周波数領域に設けられた励起信号を利用して復号化する時間ドメイン復号化部と、
前記ドメイン判断部で前記高周波数領域が周波数ドメインで符号化されたと判断されれば、前記高周波数領域に設けられた高周波数スペクトルを、前記低周波数領域に設けられた励起スペクトルを利用して復号化する周波数ドメイン復号化部とを備えることを特徴とする適応的高周波数領域の復号化装置。 A domain determination unit for determining a domain in which a high frequency region, which is a region larger than a preset frequency, is encoded;
If the domain determination unit determines that the high frequency region is encoded in the time domain, the high frequency signal provided in the high frequency region is provided in a low frequency region that is smaller than a preset frequency. A time domain decoding unit for decoding using the excited excitation signal;
If the domain determination unit determines that the high frequency region is encoded in the frequency domain, the high frequency spectrum provided in the high frequency region is decoded using the excitation spectrum provided in the low frequency region. An adaptive high frequency domain decoding apparatus comprising: a frequency domain decoding unit configured to convert to a high frequency domain.
前記高周波数信号に対するLPC係数を復号化する線形合成部と、
前記復号化されたLPC係数によって生成された包絡線に前記励起信号を乗算する乗算部と、
前記低周波数領域に設けられた信号である低周波数信号と前記高周波数信号との境界を一致させる利得値を復号化し、前記励起信号が乗算された包絡線に適用する利得値適用部とを備えることを特徴とする請求項20に記載の適応的高周波数領域の復号化装置。 The time domain decoding unit includes:
A linear synthesis unit for decoding LPC coefficients for the high-frequency signal;
A multiplier for multiplying the envelope generated by the decoded LPC coefficients by the excitation signal;
A gain value application unit that decodes a gain value that matches a boundary between a low-frequency signal that is a signal provided in the low-frequency region and the high-frequency signal, and applies the decoded value to an envelope that is multiplied by the excitation signal 21. The adaptive high frequency decoding apparatus according to claim 20, wherein:
前記励起スペクトルのうち復号化するのに利用する周波数バンドに係る情報を利用し、前記高周波数領域にノイズを生成するノイズ生成部と、
前記高周波数スペクトルの包絡線を復号化し、前記生成されたノイズの包絡線を調節する包絡線調節部とを備えることを特徴とする請求項20に記載の適応的高周波数領域の復号化装置。 The frequency domain decoding unit includes:
A noise generation unit that generates information in the high frequency region using information related to a frequency band used for decoding of the excitation spectrum;
21. The adaptive high frequency domain decoding apparatus according to claim 20, further comprising: an envelope adjustment unit that decodes an envelope of the high frequency spectrum and adjusts an envelope of the generated noise.
前記低周波数領域に設けられた低周波数信号に対して線形予測または長区間予測を行って抽出された信号であることを特徴とする請求項20に記載の適応的高周波数領域の復号化装置。 The excitation signal is
21. The adaptive high frequency domain decoding apparatus according to claim 20, wherein the low frequency signal is a signal extracted by performing linear prediction or long interval prediction on a low frequency signal provided in the low frequency domain.
前記低周波数領域に設けられた信号である低周波数信号に対して線形予測または長区間予測を行って抽出された信号を周波数ドメインに変換したスペクトル、または前記低周波数領域に設けられたスペクトルである低周波数スペクトルに対してホワイトニング処理されたスペクトルであることを特徴とする請求項20に記載の適応的高周波数領域の復号化装置。 The excitation spectrum is
A spectrum obtained by converting a signal extracted by performing linear prediction or long interval prediction on a low frequency signal that is a signal provided in the low frequency region into a frequency domain, or a spectrum provided in the low frequency region. 21. The adaptive high-frequency decoding apparatus according to claim 20, wherein the low-frequency spectrum is a spectrum subjected to whitening processing.
前記時間ドメインに変換された周波数バンドを、既設定の周波数より小さい低周波数領域に設けられた励起信号を利用して符号化する段階と、
前記周波数ドメインに変換された周波数バンドを、前記低周波数領域に設けられた励起スペクトルを利用して符号化する段階とを含むことを特徴とする適応的高周波数領域の符号化方法。 Selecting a high frequency signal, which is a signal provided in a region larger than a preset frequency, for each frequency band, selecting either the time domain or the frequency domain, and converting it,
Encoding the frequency band converted to the time domain using an excitation signal provided in a low frequency region smaller than a preset frequency;
And encoding the frequency band converted into the frequency domain using an excitation spectrum provided in the low frequency region.
前記時間ドメインに変換された周波数バンドに設けられた信号に対して線形予測を行う段階と、
前記行われた線形予測によって生成された包絡線に前記励起信号を乗算する段階と、
前記低周波数領域に設けられた信号である低周波数信号と前記励起信号が乗算された包絡線との境界を一致させる利得値を計算して符号化する段階とを含むことを特徴とする請求項25に記載の適応的高周波数領域の符号化方法。 The step of encoding using the excitation signal includes:
Performing linear prediction on a signal provided in a frequency band converted to the time domain;
Multiplying the envelope generated by the performed linear prediction by the excitation signal;
And calculating and encoding a gain value for matching a boundary between a low frequency signal, which is a signal provided in the low frequency region, and an envelope multiplied by the excitation signal. 25. The adaptive high frequency domain encoding method according to 25.
前記励起スペクトルのうち前記周波数ドメインに変換された周波数バンドに設けられたスペクトルを符号化するのに利用する周波数バンドを選択し、前記選択された周波数バンドに係る情報を符号化する段階と、
前記周波数ドメインに変換された周波数バンドに設けられたスペクトルの包絡線を抽出して符号化する段階とを含むことを特徴とする請求項25に記載の適応的高周波数領域の符号化方法。 The encoding using the excitation spectrum includes:
Selecting a frequency band to be used for encoding a spectrum provided in a frequency band converted into the frequency domain from the excitation spectrum, and encoding information relating to the selected frequency band;
26. The method of claim 25, further comprising: extracting and encoding a spectrum envelope provided in a frequency band converted to the frequency domain.
前記低周波数領域に設けられた低周波数信号のうち、時間ドメインで示した周波数バンドに設けられた信号に対して、線形予測または長区間予測を行って抽出された信号であることを特徴とする請求項25に記載の適応的高周波数領域の符号化方法。 The excitation signal is
Among the low frequency signals provided in the low frequency region, the signal is extracted by performing linear prediction or long interval prediction on a signal provided in a frequency band indicated in a time domain. The adaptive high frequency domain encoding method according to claim 25.
前記低周波数領域に設けられた低周波数スペクトルのうち、周波数ドメインで示した周波数バンドに設けられたスペクトルに対して、ホワイトニング処理されたスペクトルであることを特徴とする請求項25に記載の適応的高周波数領域の符号化方法。 The excitation spectrum is
26. The adaptive spectrum according to claim 25, wherein the spectrum is a whitening-processed spectrum with respect to a spectrum provided in a frequency band indicated in a frequency domain among low frequency spectra provided in the low frequency region. High frequency domain encoding method.
前記高周波数スペクトルの包絡線を抽出して符号化する段階とを含むことを特徴とする適応的高周波数領域の符号化方法。 Selects the frequency band used to encode the high frequency spectrum, which is the spectrum provided in the region higher than the preset frequency, among the excitation spectrum provided in the low frequency region, which is the region smaller than the preset frequency. And encoding information related to the selected frequency band;
An adaptive high frequency domain encoding method comprising: extracting and encoding an envelope of the high frequency spectrum.
前記低周波数領域に設けられた低周波数スペクトルに対してホワイトニング処理されたスペクトルであることを特徴とする請求項30に記載の適応的高周波数領域の符号化方法。 The excitation spectrum is
31. The adaptive high frequency region encoding method according to claim 30, wherein the low frequency spectrum provided in the low frequency region is a spectrum subjected to whitening processing.
前記選択する段階で時間ドメインが選択されれば、前記高周波数信号を既設定の周波数より小さい領域である低周波数領域に設けられた励起信号を利用して符号化する段階と、
前記選択する段階で周波数ドメインが選択されれば、前記高周波数信号を周波数ドメインに変換して高周波数スペクトルを生成し、前記高周波数スペクトルを前記低周波数領域に設けられた励起スペクトルを利用して符号化する段階とを含むことを特徴とする適応的高周波数領域の符号化方法。 Selecting either one of the time domain and the frequency domain according to a preset criterion for a high-frequency signal that is a signal provided in a region larger than the preset frequency;
If the time domain is selected in the selecting step, the high frequency signal is encoded using an excitation signal provided in a low frequency region that is a region smaller than a preset frequency; and
If a frequency domain is selected in the selecting step, the high frequency signal is converted into a frequency domain to generate a high frequency spectrum, and the high frequency spectrum is generated using an excitation spectrum provided in the low frequency region. An adaptive high frequency domain encoding method.
前記ドメイン選択部で時間ドメインが選択されれば、前記高周波数信号に対して線形予測を行う段階と、
前記行われた線形予測によって生成された包絡線に前記励起信号を乗算する段階と、
前記低周波数領域に設けられた信号である低周波数信号と前記励起信号が乗算された包絡線との境界を一致させる利得値を計算して符号化する段階とを含むことを特徴とする請求項32に記載の適応的高周波数領域の符号化方法。 The step of encoding using the excitation signal includes:
If a time domain is selected by the domain selection unit, performing linear prediction on the high frequency signal;
Multiplying the envelope generated by the performed linear prediction by the excitation signal;
And calculating and encoding a gain value for matching a boundary between a low frequency signal, which is a signal provided in the low frequency region, and an envelope multiplied by the excitation signal. 33. The adaptive high frequency domain encoding method according to 32.
前記選択する段階で時間ドメインが選択されれば、前記高周波数信号を周波数ドメインに変換し、前記高周波数スペクトルを生成する段階と、
前記励起スペクトルのうち前記高周波数スペクトルを符号化するのに利用する周波数バンドを選択し、前記選択された周波数バンドに係る情報を符号化する段階と、
前記高周波数スペクトルの包絡線を抽出して符号化する段階とを含むことを特徴とする請求項32に記載の適応的高周波数領域の符号化方法。 The encoding using the excitation spectrum includes:
If the time domain is selected in the selecting step, converting the high frequency signal to the frequency domain and generating the high frequency spectrum;
Selecting a frequency band to be used for encoding the high frequency spectrum from the excitation spectrum, and encoding information related to the selected frequency band;
The adaptive high frequency domain encoding method of claim 32, further comprising: extracting and encoding an envelope of the high frequency spectrum.
前記低周波数領域に設けられた低周波数信号に対して線形予測または長区間予測を行って抽出された信号であることを特徴とする請求項32に記載の適応的高周波数領域の符号化方法。 The excitation signal is
The adaptive high frequency domain encoding method according to claim 32, wherein the low frequency signal provided in the low frequency domain is a signal extracted by performing linear prediction or long interval prediction.
前記低周波数領域に設けられた低周波数信号に対して線形予測または長区間予測を行って抽出された信号を周波数ドメインに変換したスペクトル、または前記低周波数領域に設けられたスペクトルである低周波数スペクトルに対してホワイトニング処理されたスペクトルであることを特徴とする請求項32に記載の適応的高周波数領域の符号化方法。 The excitation spectrum is
A spectrum obtained by converting a signal extracted by performing linear prediction or long-term prediction to a low frequency signal provided in the low frequency region into a frequency domain, or a low frequency spectrum that is a spectrum provided in the low frequency region 33. The adaptive high frequency domain encoding method according to claim 32, wherein the spectrum is a whitened spectrum.
前記時間ドメインに符号化されたと判断された周波数バンドを既設定の周波数より小さい低周波数領域に設けられた励起信号を利用して復号化する段階と、
前記周波数ドメインに符号化されたと判断された周波数バンドを低周波数領域に設けられた励起スペクトルを利用して復号化する段階とを含むことを特徴とする適応的高周波数領域の復号化方法。 Determining a domain in which each frequency band provided in a high frequency region, which is a region larger than a preset frequency, is encoded;
Decoding the frequency band determined to be encoded in the time domain using an excitation signal provided in a low frequency region smaller than a preset frequency;
And decoding the frequency band determined to be encoded in the frequency domain using an excitation spectrum provided in a low frequency region.
前記時間ドメインに変換された周波数バンドに設けられた信号に対するLPC係数を復号化する段階と、
前記復号化されたLPC係数によって生成された包絡線に前記励起信号を乗算する段階と、
前記低周波数領域に設けられた信号である低周波数信号と前記高周波数領域に設けられた高周波数信号との境界を一致させる利得値を復号化し、前記励起信号が乗算された包絡線に適用する段階とを含むことを特徴とする請求項37に記載の適応的高周波数領域復号化方法。 Decoding using the excitation signal comprises:
Decoding LPC coefficients for a signal provided in a frequency band converted to the time domain;
Multiplying the envelope generated by the decoded LPC coefficients by the excitation signal;
A gain value that matches a boundary between a low-frequency signal that is a signal provided in the low-frequency region and a high-frequency signal provided in the high-frequency region is decoded and applied to an envelope that is multiplied by the excitation signal. 38. The adaptive high frequency domain decoding method of claim 37, further comprising:
前記励起スペクトルのうち前記高周波数領域を復号化するのに利用する周波数バンドに係る情報を利用し、前記周波数ドメインに符号化されたと判断された周波数バンドにノイズを生成する段階と、
前記周波数ドメインに変換された周波数バンドに設けられたスペクトルの包絡線を復号化し、前記生成されたノイズの包絡線を調節する段階とを含むことを特徴とする請求項37に記載の適応的高周波数領域復号化方法。 Decoding using the excitation spectrum comprises:
Generating information in a frequency band determined to be encoded in the frequency domain using information related to a frequency band used to decode the high frequency region of the excitation spectrum; and
38. The method of claim 37, further comprising: decoding a spectrum envelope provided in a frequency band transformed to the frequency domain and adjusting the generated noise envelope. Frequency domain decoding method.
前記低周波数領域に設けられた低周波数信号に対して線形予測または長区間予測を行って抽出された信号であることを特徴とする請求項37に記載の適応的高周波数領域復号化方法。 The excitation signal is
38. The adaptive high frequency domain decoding method according to claim 37, wherein the adaptive high frequency domain decoding method is a signal extracted by performing linear prediction or long interval prediction on a low frequency signal provided in the low frequency region.
前記低周波数領域に設けられた低周波数スペクトルに対してホワイトニング処理されたスペクトルであることを特徴とする請求項37に記載の適応的高周波数領域復号化方法。 The excitation spectrum is
The adaptive high frequency domain decoding method according to claim 37, wherein the low frequency spectrum provided in the low frequency domain is a spectrum subjected to whitening processing.
前記高周波数領域に設けられた高周波数スペクトルの包絡線を復号化し、前記生成されたノイズの包絡線を調節する段階とを含むことを特徴とする適応的高周波数領域の復号化方法。 Of the excitation spectrum provided in the low frequency region that is a region smaller than the preset frequency, using information related to the frequency band used to decode the high frequency region that is a region greater than the preset frequency, Generating noise in the high frequency region;
And decoding an envelope of a high frequency spectrum provided in the high frequency region and adjusting an envelope of the generated noise.
前記低周波数領域に設けられた低周波数スペクトルに対してホワイトニング処理されたスペクトルであることを特徴とする請求項42に記載の適応的高周波数領域の復号化方法。 The excitation spectrum is
43. The adaptive high frequency domain decoding method according to claim 42, wherein the low frequency spectrum provided in the low frequency domain is a spectrum subjected to whitening processing.
前記判断する段階で前記高周波数領域が時間ドメインで符号化されたと判断されれば、前記高周波数領域に設けられた高周波数信号を、既設定の周波数より小さい領域である低周波数領域に設けられた励起信号を利用して復号化する段階と、
前記判断する段階で前記高周波数領域が周波数ドメインで符号化されたと判断されれば、前記高周波数領域に設けられた高周波数スペクトルを、前記低周波数領域に設けられた励起スペクトルを利用して復号化する段階とを含むことを特徴とする適応的高周波数領域の復号化方法。 Determining a domain in which a high frequency region, which is a region larger than a preset frequency, is encoded;
If it is determined that the high frequency region is encoded in the time domain in the determining step, the high frequency signal provided in the high frequency region is provided in a low frequency region that is smaller than a preset frequency. Decoding using the excited signal;
If it is determined in the determining step that the high frequency region is encoded in the frequency domain, the high frequency spectrum provided in the high frequency region is decoded using the excitation spectrum provided in the low frequency region. And an adaptive high frequency domain decoding method.
前記高周波数信号に対するLPC係数を復号化する段階と、
前記復号化されたLPC係数によって生成された包絡線に前記励起信号を乗算する段階と、
前記低周波数領域に設けられた信号である低周波数信号と前記高周波数信号との境界を一致させる利得値を復号化し、前記励起信号が乗算された包絡線に適用する段階とを含むことを特徴とする請求項44に記載の適応的高周波数領域の復号化方法。 Decoding using the excitation signal comprises:
Decoding LPC coefficients for the high frequency signal;
Multiplying the envelope generated by the decoded LPC coefficients by the excitation signal;
Decoding a gain value that matches a boundary between a low frequency signal that is a signal provided in the low frequency region and the high frequency signal, and applying the decoded value to an envelope that is multiplied by the excitation signal. 45. The adaptive high frequency domain decoding method according to claim 44.
前記励起スペクトルのうち復号化するのに利用する周波数バンドに係る情報を利用し、前記高周波数領域にノイズを生成する段階と、
前記高周波数スペクトルの包絡線を復号化し、前記生成されたノイズの包絡線を調節する段階とを含むことを特徴とする請求項44に記載の適応的高周波数領域の復号化方法。 Decoding using the excitation spectrum comprises:
Using information related to a frequency band used for decoding of the excitation spectrum, and generating noise in the high frequency region;
45. The method of claim 44, further comprising: decoding an envelope of the high frequency spectrum and adjusting an envelope of the generated noise.
前記低周波数領域に設けられた低周波数信号に対して線形予測または長区間予測を行って抽出された信号であることを特徴とする請求項44に記載の適応的高周波数領域の復号化方法。 The excitation signal is
45. The adaptive high frequency domain decoding method according to claim 44, wherein the low frequency signal provided in the low frequency domain is a signal extracted by performing linear prediction or long interval prediction.
前記低周波数領域に設けられた信号である低周波数信号に対して線形予測または長区間予測を行って抽出された信号を周波数ドメインに変換したスペクトル、または前記低周波数領域に設けられたスペクトルである低周波数スペクトルに対してホワイトニング処理されたスペクトルであることを特徴とする請求項44に記載の適応的高周波数領域の復号化方法。 The excitation spectrum is
A spectrum obtained by converting a signal extracted by performing linear prediction or long interval prediction on a low frequency signal that is a signal provided in the low frequency region into a frequency domain, or a spectrum provided in the low frequency region. 45. The adaptive high frequency domain decoding method according to claim 44, wherein the low frequency spectrum is a spectrum subjected to whitening processing.
前記時間ドメインに変換された周波数バンドを、既設定の周波数より小さい低周波数領域に設けられた励起信号を利用して符号化する段階と、
前記周波数ドメインに変換された周波数バンドを、前記低周波数領域に設けられた励起スペクトルを利用して符号化する段階とをコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体。 Selecting a high frequency signal, which is a signal provided in a region larger than a preset frequency, for each frequency band, selecting either the time domain or the frequency domain, and converting it,
Encoding the frequency band converted to the time domain using an excitation signal provided in a low frequency region smaller than a preset frequency;
The computer-readable recording medium which recorded the program for performing the step which encodes the frequency band converted into the said frequency domain using the excitation spectrum provided in the said low frequency area | region by a computer.
前記高周波数スペクトルの包絡線を抽出して符号化する段階とをコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体。 Selects the frequency band used to encode the high frequency spectrum, which is the spectrum provided in the region higher than the preset frequency, among the excitation spectrum provided in the low frequency region, which is the region smaller than the preset frequency. And encoding information related to the selected frequency band;
A computer-readable recording medium storing a program for causing a computer to extract and encode the high frequency spectrum envelope.
前記選択する段階で時間ドメインが選択されれば、前記高周波数信号を既設定の周波数より小さい領域である低周波数領域に設けられた励起信号を利用して符号化する段階と、
前記選択する段階で周波数ドメインが選択されれば、前記高周波数信号を周波数ドメインに変換して高周波数スペクトルを生成し、前記高周波数スペクトルを前記低周波数領域に設けられた励起スペクトルを利用して符号化する段階とをコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体。 Selecting either one of the time domain and the frequency domain according to a preset criterion for a high-frequency signal that is a signal provided in a region larger than the preset frequency;
If the time domain is selected in the selecting step, the high frequency signal is encoded using an excitation signal provided in a low frequency region that is a region smaller than a preset frequency; and
If a frequency domain is selected in the selecting step, the high frequency signal is converted into a frequency domain to generate a high frequency spectrum, and the high frequency spectrum is generated using an excitation spectrum provided in the low frequency region. A computer-readable recording medium storing a program for causing a computer to execute the encoding step.
前記時間ドメインに符号化されたと判断された周波数バンドを既設定の周波数より小さい低周波数領域に設けられた励起信号を利用して復号化する段階と、
前記周波数ドメインに符号化されたと判断された周波数バンドを低周波数領域に設けられた励起スペクトルを利用して復号化する段階とをコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体。 Determining a domain in which each frequency band provided in a high frequency region, which is a region larger than a preset frequency, is encoded;
Decoding the frequency band determined to be encoded in the time domain using an excitation signal provided in a low frequency region smaller than a preset frequency;
A computer-readable recording medium storing a program for causing a computer to execute a step of decoding a frequency band determined to be encoded in the frequency domain using an excitation spectrum provided in a low frequency region .
前記高周波数領域に設けられた高周波数スペクトルの包絡線を復号化し、前記生成されたノイズの包絡線を調節する段階とをコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体。 Of the excitation spectrum provided in the low frequency region that is a region smaller than the preset frequency, using information related to the frequency band used to decode the high frequency region that is a region greater than the preset frequency, Generating noise in the high frequency region;
A computer-readable recording medium storing a program for causing a computer to execute a step of decoding an envelope of a high frequency spectrum provided in the high frequency region and adjusting the envelope of the generated noise.
前記判断する段階で前記高周波数領域が時間ドメインで符号化されたと判断されれば、前記高周波数領域に設けられた高周波数信号を、既設定の周波数より小さい領域である低周波数領域に設けられた励起信号を利用して復号化する段階と、
前記判断する段階で前記高周波数領域が周波数ドメインで符号化されたと判断されれば、前記高周波数領域に設けられた高周波数スペクトルを、前記低周波数領域に設けられた励起スペクトルを利用して復号化する段階とをコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体。 Determining a domain in which a high frequency region, which is a region larger than a preset frequency, is encoded;
If it is determined that the high frequency region is encoded in the time domain in the determining step, the high frequency signal provided in the high frequency region is provided in a low frequency region that is smaller than a preset frequency. Decoding using the excited signal;
If it is determined in the determining step that the high frequency region is encoded in the frequency domain, the high frequency spectrum provided in the high frequency region is decoded using the excitation spectrum provided in the low frequency region. A computer-readable recording medium having recorded thereon a program for causing the computer to execute the step of converting.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2006-0056070 | 2006-06-21 | ||
KR20060056070 | 2006-06-21 | ||
KR1020070060688A KR101390188B1 (en) | 2006-06-21 | 2007-06-20 | Method and apparatus for encoding and decoding adaptive high frequency band |
KR10-2007-0060688 | 2007-06-20 | ||
PCT/KR2007/003007 WO2007148925A1 (en) | 2006-06-21 | 2007-06-21 | Method and apparatus for adaptively encoding and decoding high frequency band |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012143873A Division JP5684756B2 (en) | 2006-06-21 | 2012-06-27 | Encoding method and decoding method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009541790A true JP2009541790A (en) | 2009-11-26 |
JP5031829B2 JP5031829B2 (en) | 2012-09-26 |
Family
ID=39138888
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009516401A Active JP5031829B2 (en) | 2006-06-21 | 2007-06-21 | Encoding device, decoding device, encoding method, decoding method, and computer-readable recording medium |
JP2012143873A Active JP5684756B2 (en) | 2006-06-21 | 2012-06-27 | Encoding method and decoding method |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012143873A Active JP5684756B2 (en) | 2006-06-21 | 2012-06-27 | Encoding method and decoding method |
Country Status (2)
Country | Link |
---|---|
JP (2) | JP5031829B2 (en) |
KR (2) | KR101390188B1 (en) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010510540A (en) * | 2006-11-17 | 2010-04-02 | サムスン エレクトロニクス カンパニー リミテッド | Audio and / or speech signal encoding and / or decoding method and apparatus |
JP2014500521A (en) * | 2010-10-25 | 2014-01-09 | ヴォイスエイジ・コーポレーション | General audio signal coding with low bit rate and low delay |
JP2014508327A (en) * | 2011-10-08 | 2014-04-03 | 華為技術有限公司 | Audio signal encoding method and apparatus |
JP2014523548A (en) * | 2011-06-30 | 2014-09-11 | サムスン エレクトロニクス カンパニー リミテッド | Bandwidth extension signal generation apparatus and method |
JP2016105174A (en) * | 2010-12-29 | 2016-06-09 | サムスン エレクトロニクス カンパニー リミテッド | Apparatus and method for encoding/decoding for high frequency bandwidth extension |
US10152983B2 (en) | 2010-09-15 | 2018-12-11 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding/decoding for high frequency bandwidth extension |
CN111312278A (en) * | 2014-03-03 | 2020-06-19 | 三星电子株式会社 | Method and apparatus for high frequency decoding for bandwidth extension |
WO2022009505A1 (en) * | 2020-07-07 | 2022-01-13 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | Coding apparatus, decoding apparatus, coding method, decoding method, and hybrid coding system |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101390188B1 (en) * | 2006-06-21 | 2014-04-30 | 삼성전자주식회사 | Method and apparatus for encoding and decoding adaptive high frequency band |
US9159333B2 (en) | 2006-06-21 | 2015-10-13 | Samsung Electronics Co., Ltd. | Method and apparatus for adaptively encoding and decoding high frequency band |
CN106409304B (en) * | 2014-06-12 | 2020-08-25 | 华为技术有限公司 | Time domain envelope processing method and device of audio signal and encoder |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0946233A (en) * | 1995-07-31 | 1997-02-14 | Kokusai Electric Co Ltd | Sound encoding method/device and sound decoding method/ device |
JP2001521648A (en) * | 1997-06-10 | 2001-11-06 | コーディング テクノロジーズ スウェーデン アクチボラゲット | Enhanced primitive coding using spectral band duplication |
JP2001525079A (en) * | 1997-05-15 | 2001-12-04 | ヒューレット・パッカード・カンパニー | Audio coding system and method |
US6427135B1 (en) * | 1997-03-17 | 2002-07-30 | Kabushiki Kaisha Toshiba | Method for encoding speech wherein pitch periods are changed based upon input speech signal |
JP2003216190A (en) * | 2001-11-14 | 2003-07-30 | Matsushita Electric Ind Co Ltd | Encoding device and decoding device |
JP2003525473A (en) * | 2000-02-29 | 2003-08-26 | クゥアルコム・インコーポレイテッド | Closed-loop multimode mixed-domain linear prediction speech coder |
JP2004004710A (en) * | 2002-04-11 | 2004-01-08 | Matsushita Electric Ind Co Ltd | Encoder and decoder |
JP2004514179A (en) * | 2000-11-14 | 2004-05-13 | コーディング テクノロジーズ アクチボラゲット | A method for enhancing perceptual performance of high-frequency restoration coding by adaptive filtering. |
WO2005040749A1 (en) * | 2003-10-23 | 2005-05-06 | Matsushita Electric Industrial Co., Ltd. | Spectrum encoding device, spectrum decoding device, acoustic signal transmission device, acoustic signal reception device, and methods thereof |
WO2006025313A1 (en) * | 2004-08-31 | 2006-03-09 | Matsushita Electric Industrial Co., Ltd. | Audio encoding apparatus, audio decoding apparatus, communication apparatus and audio encoding method |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2807897B1 (en) * | 2000-04-18 | 2003-07-18 | France Telecom | SPECTRAL ENRICHMENT METHOD AND DEVICE |
EP1388147B1 (en) | 2001-05-11 | 2004-12-29 | Siemens Aktiengesellschaft | Method for enlarging the band width of a narrow-band filtered voice signal, especially a voice signal emitted by a telecommunication appliance |
SE0202159D0 (en) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US6988066B2 (en) | 2001-10-04 | 2006-01-17 | At&T Corp. | Method of bandwidth extension for narrow-band speech |
US7318035B2 (en) * | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
EP2071565B1 (en) * | 2003-09-16 | 2011-05-04 | Panasonic Corporation | Coding apparatus and decoding apparatus |
KR101390188B1 (en) * | 2006-06-21 | 2014-04-30 | 삼성전자주식회사 | Method and apparatus for encoding and decoding adaptive high frequency band |
-
2007
- 2007-06-20 KR KR1020070060688A patent/KR101390188B1/en not_active IP Right Cessation
- 2007-06-21 JP JP2009516401A patent/JP5031829B2/en active Active
-
2012
- 2012-06-27 JP JP2012143873A patent/JP5684756B2/en active Active
-
2013
- 2013-09-04 KR KR1020130106345A patent/KR101376099B1/en active IP Right Grant
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0946233A (en) * | 1995-07-31 | 1997-02-14 | Kokusai Electric Co Ltd | Sound encoding method/device and sound decoding method/ device |
US6427135B1 (en) * | 1997-03-17 | 2002-07-30 | Kabushiki Kaisha Toshiba | Method for encoding speech wherein pitch periods are changed based upon input speech signal |
JP2001525079A (en) * | 1997-05-15 | 2001-12-04 | ヒューレット・パッカード・カンパニー | Audio coding system and method |
JP2001521648A (en) * | 1997-06-10 | 2001-11-06 | コーディング テクノロジーズ スウェーデン アクチボラゲット | Enhanced primitive coding using spectral band duplication |
JP2005173607A (en) * | 1997-06-10 | 2005-06-30 | Coding Technologies Ab | Method and device to generate up-sampled signal of time discrete audio signal |
JP2003525473A (en) * | 2000-02-29 | 2003-08-26 | クゥアルコム・インコーポレイテッド | Closed-loop multimode mixed-domain linear prediction speech coder |
JP2004514179A (en) * | 2000-11-14 | 2004-05-13 | コーディング テクノロジーズ アクチボラゲット | A method for enhancing perceptual performance of high-frequency restoration coding by adaptive filtering. |
JP2003216190A (en) * | 2001-11-14 | 2003-07-30 | Matsushita Electric Ind Co Ltd | Encoding device and decoding device |
JP2004004710A (en) * | 2002-04-11 | 2004-01-08 | Matsushita Electric Ind Co Ltd | Encoder and decoder |
WO2005040749A1 (en) * | 2003-10-23 | 2005-05-06 | Matsushita Electric Industrial Co., Ltd. | Spectrum encoding device, spectrum decoding device, acoustic signal transmission device, acoustic signal reception device, and methods thereof |
WO2006025313A1 (en) * | 2004-08-31 | 2006-03-09 | Matsushita Electric Industrial Co., Ltd. | Audio encoding apparatus, audio decoding apparatus, communication apparatus and audio encoding method |
Non-Patent Citations (1)
Title |
---|
押切 正浩、江原 宏幸、吉田 幸司: "ピッチフィルタ処理によるスペクトル符号化を用いた7/10/15kHz帯域スケーラブル音声符号化", 電子情報通信学会論文誌, vol. 89, no. 2, JPN6011046585, February 2006 (2006-02-01), JP, pages 281 - 291, ISSN: 0002008766 * |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010510540A (en) * | 2006-11-17 | 2010-04-02 | サムスン エレクトロニクス カンパニー リミテッド | Audio and / or speech signal encoding and / or decoding method and apparatus |
US10152983B2 (en) | 2010-09-15 | 2018-12-11 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding/decoding for high frequency bandwidth extension |
JP2014500521A (en) * | 2010-10-25 | 2014-01-09 | ヴォイスエイジ・コーポレーション | General audio signal coding with low bit rate and low delay |
JP2018018113A (en) * | 2010-12-29 | 2018-02-01 | サムスン エレクトロニクス カンパニー リミテッド | Apparatus and method for encoding/decoding for high frequency bandwidth extension |
US10811022B2 (en) | 2010-12-29 | 2020-10-20 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding/decoding for high frequency bandwidth extension |
US10453466B2 (en) | 2010-12-29 | 2019-10-22 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding/decoding for high frequency bandwidth extension |
JP2016105174A (en) * | 2010-12-29 | 2016-06-09 | サムスン エレクトロニクス カンパニー リミテッド | Apparatus and method for encoding/decoding for high frequency bandwidth extension |
US9349380B2 (en) | 2011-06-30 | 2016-05-24 | Samsung Electronics Co., Ltd. | Apparatus and method for generating bandwidth extension signal |
JP2018025830A (en) * | 2011-06-30 | 2018-02-15 | サムスン エレクトロニクス カンパニー リミテッド | Apparatus for decoding bandwidth extension signal |
US9734843B2 (en) | 2011-06-30 | 2017-08-15 | Samsung Electronics Co., Ltd. | Apparatus and method for generating bandwidth extension signal |
JP2014523548A (en) * | 2011-06-30 | 2014-09-11 | サムスン エレクトロニクス カンパニー リミテッド | Bandwidth extension signal generation apparatus and method |
US10037766B2 (en) | 2011-06-30 | 2018-07-31 | Samsung Electronics Co., Ltd. | Apparatus and method for generating bandwith extension signal |
JP2016197271A (en) * | 2011-06-30 | 2016-11-24 | サムスン エレクトロニクス カンパニー リミテッド | Apparatus for decoding bandwidth extension signal |
JP2017187790A (en) * | 2011-10-08 | 2017-10-12 | 華為技術有限公司Huawei Technologies Co.,Ltd. | Audio signal encoding method and device |
US9514762B2 (en) | 2011-10-08 | 2016-12-06 | Huawei Technologies Co., Ltd. | Audio signal coding method and apparatus |
JP2015172778A (en) * | 2011-10-08 | 2015-10-01 | 華為技術有限公司Huawei Technologies Co.,Ltd. | Audio signal encoding method, and device |
US9779749B2 (en) | 2011-10-08 | 2017-10-03 | Huawei Technologies Co., Ltd. | Audio signal coding method and apparatus |
JP2014508327A (en) * | 2011-10-08 | 2014-04-03 | 華為技術有限公司 | Audio signal encoding method and apparatus |
CN111312278A (en) * | 2014-03-03 | 2020-06-19 | 三星电子株式会社 | Method and apparatus for high frequency decoding for bandwidth extension |
CN111312278B (en) * | 2014-03-03 | 2023-08-15 | 三星电子株式会社 | Method and apparatus for high frequency decoding of bandwidth extension |
WO2022009505A1 (en) * | 2020-07-07 | 2022-01-13 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | Coding apparatus, decoding apparatus, coding method, decoding method, and hybrid coding system |
Also Published As
Publication number | Publication date |
---|---|
JP5684756B2 (en) | 2015-03-18 |
KR20070121558A (en) | 2007-12-27 |
KR101390188B1 (en) | 2014-04-30 |
KR101376099B1 (en) | 2014-03-19 |
KR20130114038A (en) | 2013-10-16 |
JP5031829B2 (en) | 2012-09-26 |
JP2012208514A (en) | 2012-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5031829B2 (en) | Encoding device, decoding device, encoding method, decoding method, and computer-readable recording medium | |
US8340962B2 (en) | Method and apparatus for adaptively encoding and decoding high frequency band | |
KR101747918B1 (en) | Method and apparatus for decoding high frequency signal | |
US7864843B2 (en) | Method and apparatus to encode and/or decode signal using bandwidth extension technology | |
JP5869537B2 (en) | Bandwidth extended decoding method | |
JP5404418B2 (en) | Encoding device, decoding device, and encoding method | |
US8639500B2 (en) | Method, medium, and apparatus with bandwidth extension encoding and/or decoding | |
KR101435893B1 (en) | Method and apparatus for encoding and decoding audio signal using band width extension technique and stereo encoding technique | |
CN104916290B (en) | Audio decoding apparatus, sound encoding device, tone decoding method and voice coding method | |
WO2009113316A1 (en) | Encoding device, decoding device, and method thereof | |
WO2008072737A1 (en) | Encoding device, decoding device, and method thereof | |
US20100169087A1 (en) | Selective scaling mask computation based on peak detection | |
US9847095B2 (en) | Method and apparatus for adaptively encoding and decoding high frequency band | |
KR20070012194A (en) | Scalable speech coding/decoding methods and apparatus using mixed structure | |
CN102272829A (en) | Method and apparatus for generating an enhancement layer within a multiple-channel audio coding system | |
JP5565914B2 (en) | Encoding device, decoding device and methods thereof | |
KR20080045047A (en) | Method and apparatus for bandwidth extension encoding and decoding | |
WO2011058752A1 (en) | Encoder apparatus, decoder apparatus and methods of these |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110823 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110906 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111206 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120306 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120529 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120627 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5031829 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150706 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |