JP2010020333A - Scalable coder and scalable decoder - Google Patents
Scalable coder and scalable decoder Download PDFInfo
- Publication number
- JP2010020333A JP2010020333A JP2009204962A JP2009204962A JP2010020333A JP 2010020333 A JP2010020333 A JP 2010020333A JP 2009204962 A JP2009204962 A JP 2009204962A JP 2009204962 A JP2009204962 A JP 2009204962A JP 2010020333 A JP2010020333 A JP 2010020333A
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- signal
- encoding
- unit
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001228 spectrum Methods 0.000 claims abstract description 276
- 238000005070 sampling Methods 0.000 claims abstract description 113
- 238000006243 chemical reaction Methods 0.000 claims abstract description 69
- 238000000034 method Methods 0.000 claims description 47
- 230000005236 sound signal Effects 0.000 claims description 24
- 230000001131 transforming effect Effects 0.000 claims 2
- 238000004458 analytical method Methods 0.000 abstract description 43
- 238000012545 processing Methods 0.000 abstract description 28
- 238000010586 diagram Methods 0.000 description 31
- 238000004891 communication Methods 0.000 description 20
- 238000012937 correction Methods 0.000 description 13
- 230000005540 biological transmission Effects 0.000 description 12
- 230000000694 effects Effects 0.000 description 9
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 238000000926 separation method Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Abstract
Description
本発明は、音声信号、オーディオ信号等を符号化するスケーラブル符号化装置と、このスケーラブル符号化装置によって符号化された信号の復号を行うスケーラブル復号化装置とに関する。 The present invention relates to a scalable encoding device that encodes an audio signal, an audio signal, and the like, and a scalable decoding device that decodes a signal encoded by the scalable encoding device.
今日、世の中には、コンパクトディスク用の44.1kHz、DAT(Digital Audio Tape)、ディジタルVTR、もしくは衛星テレビジョン用の32kHzもしくは48kHz、またはDVDオーディオ信号用の48kHzもしくは96kHzというように、多くの異なるサンプリングレートが存在する。従って、再生装置もしくは記録装置のデコーダの内部サンプリングレートが、これから復号化しようとするデータのサンプリングレートと異なる場合、サンプリングレートを変換する必要が生じる。このサンプリングレートの変換を行う従来装置としては、例えば、特許文献1に示すものがある。
Today, there are many different things, such as 44.1 kHz for compact discs, 32 or 48 kHz for digital audio tape (DAT), digital VTR, or satellite television, or 48 or 96 kHz for DVD audio signals. There is a sampling rate. Therefore, when the internal sampling rate of the decoder of the playback device or recording device is different from the sampling rate of the data to be decoded, it is necessary to convert the sampling rate. An example of a conventional apparatus that performs this sampling rate conversion is disclosed in
また近年、有線系でのADSL(Asymmetric Digital Subscriber Line)や光ファイバの普及、または無線系でのW−CDMA(Wideband - Code Division Multiple Access)や無線LANの実用化等により、ネットワークにおける伝送路容量が大きく改善され、それに伴い音声通信において信号帯域を広げることによる高臨場感化および高品質化が求められてきている。 Also, in recent years, transmission line capacity in networks has been increasing due to the widespread use of ADSL (Asymmetric Digital Subscriber Line) and optical fiber in wired systems, or practical application of W-CDMA (Wideband-Code Division Multiple Access) and wireless LANs in wireless systems. Accordingly, there has been a demand for higher realism and higher quality by expanding the signal band in voice communication.
現在、狭帯域信号を符号化する代表的な方式に、ITU(International Telecommunication Union)で規格化されているG.726、G.729等がある。また、広帯域信号を符号化する代表的な方法として、ITU−T(International Telecommunication Union Telecommunication Standardization Sector)のG722、G722.1や、3GPP(The 3rd Generation Partnership Project)のAMR−WB等がある。 Currently, G. standardized by ITU (International Telecommunication Union) is a typical method for encoding narrowband signals. 726, G.G. 729 etc. Moreover, as a typical method for encoding a wideband signal, there are G722 and G722.1 of ITU-T (International Telecommunication Union Telecommunication Standardization Sector), AMR-WB of 3GPP (The 3rd Generation Partnership Project), and the like.
さらに最近、IP(Internet Protocol)ネットワーク等の様々なネットワーク環境で使用されることを意図して、音声符号化方式にスケーラブル機能の実現が求められている。スケーラブル機能とは、符号化コードの一部からでも、音声信号を復号できる機能を表す。このスケーラブル機能を有することにより、条件の良い通信路では全ての符号化コードを用いて高品質な音声信号を復号し、条件の悪い通信路では符号化コードの一部のみ伝送することでパケットロスの発生の頻度を抑えることができる。また、多地点間での通信時におけるネットワーク資源の効率化等の効果が得られるようになる。 In recent years, there has been a demand for the implementation of a scalable function in a speech coding system intended to be used in various network environments such as an IP (Internet Protocol) network. The scalable function represents a function capable of decoding an audio signal even from a part of an encoded code. By having this scalable function, packet loss can be achieved by decoding high-quality audio signals using all coded codes in a good channel and transmitting only a part of the coded code in a bad channel. The frequency of occurrence can be suppressed. In addition, it is possible to obtain an effect such as efficiency of network resources at the time of communication between multiple points.
このスケーラブル機能を有する高品質な符号化方式の実現には、様々なサンプリングレートの信号を利用して符号化を行う必要性がある。例えば、サンプリングレートが8kHzの信号をITU−Tで規格化されているG.726、G.729等の方式を用いて符号化を行い、サンプリングレートが16kHzの領域でその誤差信号をさらに符号化することで、信号帯域の拡張による品質の改善およびスケーラブル性が実現できる。 In order to realize a high-quality encoding method having a scalable function, it is necessary to perform encoding using signals of various sampling rates. For example, a signal with a sampling rate of 8 kHz is standardized by ITU-T. 726, G.G. By performing encoding using a method such as 729 and further encoding the error signal in a region where the sampling rate is 16 kHz, quality improvement and scalability can be realized by extending the signal band.
図22は、スケーラブル符号化を行う従来の符号化装置の代表的な構成を示したブロック図である。この例では、レイヤ数N=3であり、レイヤnで取り扱う信号のサンプリングレートをFS(n)と表し、FS(1)=16[kHz]、FS(2)=24[kHz]、FS(3)=32[kHz]であるとする。 FIG. 22 is a block diagram showing a typical configuration of a conventional coding apparatus that performs scalable coding. In this example, the number of layers N = 3, the sampling rate of the signal handled in layer n is represented as FS (n), FS (1) = 16 [kHz], FS (2) = 24 [kHz], FS ( 3) Assume that 32 [kHz].
入力端子11を介してダウンサンプリング部12に入力された音響信号(音声信号、オーディオ信号等)は、サンプリング周波数が32kHzから16kHzへとダウンサンプリングされ、第1レイヤ符号化部13に与えられる。第1レイヤ符号化部13は、入力された音響信号と符号化後に生成される復号信号との間の聴感的な歪が最小となるように第1符号化コードを決定する。この第1符号化コードは多重化部26に送られるとともに第1レイヤ復号化部14に送られる。第1レイヤ復号化部14は、第1符号化コードを用いて第1レイヤ復号信号を生成する。アップサンプリング部15は、第1レイヤ復号信号のサンプリング周波数を16kHzから24kHzへアップサンプリングし、この信号を減算器18および加算器21に与える。
The acoustic signal (sound signal, audio signal, etc.) input to the
また、入力端子11を介してダウンサンプリング部16に入力された音響信号は、サンプリング周波数が32kHzから24kHzへとダウンサンプリングされ、遅延部17に与えられる。遅延部17は、ダウンサンプリング後の信号を所定の時間長だけ遅延させる。減算器18は、遅延部17の出力信号とアップサンプリング部15の出力信号との差を求め、第2レイヤ残差信号を生成し、第2レイヤ符号化部19に与えられる。第2レイヤ符号化部19は、第2レイヤ残差信号を聴感的に品質改善が成されるように符号化を行い、第2符号化コードを決定し、この第2符号化コードを多重化部26および第2レイヤ復号化部20に与える。第2レイヤ復号化部20は、第2符号化コードを用いて復号処理を行い、第2レイヤ復号残差信号を生成する。加算器21は、前述の第1レイヤ復号信号と第2レイヤ復号残差信号との和をとり、第2レイヤ復号信号を生成する。アップサンプリング部22は、第2レイヤ復号信号のサンプリング周波数を24kHzから32kHzへアップサンプリングし、この信号を減算器24に与える。
The acoustic signal input to the down-
さらに、入力端子11を介して遅延部23に入力された音響信号は、所定の時間長だけ遅延され、減算器24に与えられる。減算器24は、遅延部23の出力信号とアップサンプリング部22の出力信号との差をとり、第3レイヤ残差信号を生成する。この第3レイヤ残差信号が第3レイヤ符号化部25に与えられる。第3レイヤ符号化部25は、第3レイヤ残差信号を聴感的に品質改善が成されるように符号化を行い、第3符号化コードを決定し、多重化部26にその符号化コードを与える。多重化部26は、第1レイヤ符号化部13、第2レイヤ符号化部19、および第3レイヤ符号化部25から得られた符号化コードを多重化し、出力端子27を介し出力する。
Further, the acoustic signal input to the
しかしながら、上記のようにG.726やG.729、またはAMR−WBのような時間領域の符号化方式に基づいてスケーラブル機能を実現する従来の符号化装置においては、種々の信号のサンプリングレートを変換する必要があり(上記の例では、ダウンサンプリング部12、アップサンプリング部15、ダウンサンプリング部16、およびアップサンプリング部22が必要)、符号化装置の構成が複雑になり、符号化の処理演算量も増大するという問題がある。また、この符号化装置によって符号化された信号を復号する復号化装置の回路構成も複雑になり、復号化の処理演算量が増大する。
However, as described above, G.M. 726 and G.G. In the conventional coding apparatus that realizes the scalable function based on the time domain coding scheme such as 729 or AMR-WB, it is necessary to convert the sampling rate of various signals (in the above example, downsampling is performed). The
本発明は、かかる点に鑑みてなされたものであり、回路規模を縮小でき、処理演算量も削減できるスケーラブル符号化装置およびスケーラブル復号化装置を提供することを目的とする。 The present invention has been made in view of this point, and an object of the present invention is to provide a scalable encoding device and a scalable decoding device that can reduce the circuit scale and the amount of processing computation.
本発明の第1の態様に係るサンプリングレート変換装置は、入力された時間領域信号を周波数領域変換して第1スペクトルを得る変換手段と、得られた第1スペクトルの周波数帯域を拡張する拡張手段と、拡張後の第1スペクトルの拡張された周波数帯域に第2スペクトルを挿入する挿入手段と、を具備する構成を採る。 The sampling rate conversion device according to the first aspect of the present invention includes a conversion unit that obtains a first spectrum by performing frequency domain conversion on an input time domain signal, and an expansion unit that extends a frequency band of the obtained first spectrum. And an insertion means for inserting the second spectrum into the expanded frequency band of the expanded first spectrum.
この構成によれば、入力された時間領域の信号を周波数領域の信号に変換し、得られたスペクトルの周波数帯域を拡張することにより、時間領域においてアップサンプリングした信号と等価な信号を得ることができる。 According to this configuration, an input time-domain signal is converted into a frequency-domain signal, and a signal equivalent to an up-sampled signal in the time domain can be obtained by extending the frequency band of the obtained spectrum. it can.
本発明の第2の態様に係る符号化装置は、第1および第2の時間領域信号を取得する取得手段と、取得された第1および第2の時間領域信号をそれぞれ周波数領域変換して第1および第2のスペクトルを得る変換手段と、前記第1スペクトルの周波数帯域を前記第2スペクトルの周波数帯域に応じて拡張する拡張手段と、前記第1スペクトルの拡張された周波数帯域に前記第2スペクトルを挿入する挿入手段と、前記挿入手段によって得られたスペクトルを符号化する符号化手段と、を具備する構成を採る。 An encoding apparatus according to a second aspect of the present invention includes an acquisition means for acquiring first and second time domain signals, and frequency domain transforms of the acquired first and second time domain signals, respectively. Conversion means for obtaining first and second spectra; expansion means for extending the frequency band of the first spectrum in accordance with the frequency band of the second spectrum; and the second spectrum in the expanded frequency band of the first spectrum. A configuration is provided that includes an inserting unit that inserts a spectrum and an encoding unit that encodes the spectrum obtained by the inserting unit.
この構成によれば、符号化装置の回路規模を縮小でき、符号化の処理演算量も削減することができる。 According to this configuration, the circuit scale of the encoding device can be reduced, and the amount of processing for encoding can be reduced.
本発明の第3の態様に係る符号化装置は、入力されたサンプリング周波数がFxの信号を分析長2・Naで周波数分析してNa点の第1スペクトルを得る変換手段と、得られた第1スペクトルの周波数帯域をNb点に拡張する拡張手段と、拡張後の第1スペクトルの拡張された周波数帯域に挿入される第2スペクトルを特定し、この第2スペクトルを表す符号化コードを出力する符号化手段と、を具備する構成を採る。 The encoding apparatus according to the third aspect of the present invention includes a conversion means that obtains a first spectrum at the Na point by performing frequency analysis of an input signal having a sampling frequency of Fx with an analysis length of 2 · Na, An extension means for extending the frequency band of one spectrum to the Nb point, a second spectrum to be inserted into the expanded frequency band of the first spectrum after extension, are specified, and an encoded code representing the second spectrum is output. And a coding means.
この構成によれば、時間領域でのサンプリング変換をせずに、サンプリングレートFS=Fx・Nb/Naのスペクトルを得ることができる。 According to this configuration, it is possible to obtain a spectrum of the sampling rate FS = Fx · Nb / Na without performing sampling conversion in the time domain.
本発明の第4の態様に係る符号化装置は、上記の構成において、前記第2スペクトルは、前記第1スペクトルに基づいて生成される構成を採る。 The encoding device according to a fourth aspect of the present invention employs a configuration in which, in the above configuration, the second spectrum is generated based on the first spectrum.
この構成によれば、デコーダで得られる情報を基に拡張スペクトルを生成することができるため、低ビットレート化が可能になる。 According to this configuration, since an extended spectrum can be generated based on information obtained by the decoder, a low bit rate can be achieved.
本発明の第5の態様に係る符号化装置は、上記の構成において、前記第2スペクトルは、サンプリング周波数がFyの入力信号を2・Nb点で周波数分析して求められるスペクトルの内、Na≦k<Nbの周波数帯域に含まれるスペクトルと類似するように決定される構成を採る。 In the encoding device according to a fifth aspect of the present invention, in the configuration described above, the second spectrum includes Na ≦ of a spectrum obtained by frequency analysis of an input signal having a sampling frequency Fy at 2 · Nb points. A configuration that is determined to be similar to a spectrum included in the frequency band of k <Nb is adopted.
この構成によれば、拡張スペクトルを原信号のスペクトルを基準に決定することができるため、より精度の高い拡張スペクトルを求めることができる。 According to this configuration, since the extended spectrum can be determined based on the spectrum of the original signal, an extended spectrum with higher accuracy can be obtained.
本発明の第6の態様に係る符号化装置は、上記の構成において、前記符号化手段は、Na≦k<Nbの周波数帯域を2つ以上のサブバンドに分割し、それぞれのサブバンド毎に前記第2スペクトルを表す符号化コードを出力する構成を採る。 In the encoding device according to a sixth aspect of the present invention, in the above configuration, the encoding unit divides a frequency band of Na ≦ k <Nb into two or more subbands, and each subband A configuration is adopted in which an encoded code representing the second spectrum is output.
この構成によれば、スケーラブル機能を有する符号化コードを生成できるという効果が得られる。 According to this configuration, it is possible to generate an encoded code having a scalable function.
本発明の第7の態様に係る符号化装置は、上記の構成において、前記サンプリング周波数がFxの信号は、階層符号化における下位レイヤで復号化された信号である構成を採る。 The encoding apparatus according to a seventh aspect of the present invention employs a configuration in which, in the above configuration, the signal having the sampling frequency Fx is a signal decoded in a lower layer in hierarchical encoding.
この構成によれば、複数レイヤの符号化部より構成される階層符号化に本発明を適用することができ、最小限のサンプリング変換のみで階層符号化を実現できる。 According to this configuration, the present invention can be applied to hierarchical encoding composed of a plurality of layers of encoding units, and hierarchical encoding can be realized with minimal sampling conversion.
本発明の第8の態様に係る復号化装置は、サンプリング周波数がFxの信号を分析長2・Naで周波数分析して0≦k<Naの周波数帯域の第1のスペクトルを取得する取得手段と、符号化コードを受信し、Na≦k<Nbの周波数帯域の第2のスペクトルを復号する復号化手段と、前記第1および第2のスペクトルを結合して0≦k<Nbの周波数帯域のスペクトルを生成する生成手段と、0≦k<Nbの周波数帯域に含まれるスペクトルを時間領域の信号に変換する変換手段と、を具備する構成を採る。 The decoding apparatus according to the eighth aspect of the present invention comprises: acquisition means for acquiring a first spectrum in a frequency band of 0 ≦ k <Na by performing frequency analysis of a signal having a sampling frequency of Fx with an analysis length of 2 · Na. A decoding means for receiving the encoded code and decoding the second spectrum in the frequency band of Na ≦ k <Nb, and combining the first and second spectrums in the frequency band of 0 ≦ k <Nb A configuration is provided that includes generation means for generating a spectrum and conversion means for converting a spectrum included in a frequency band of 0 ≦ k <Nb into a signal in the time domain.
この構成によれば、上記いずれかに記載の符号化装置により生成された符号化コードを復号することができる。 According to this configuration, it is possible to decode the encoded code generated by any of the encoding apparatuses described above.
本発明の第9の態様に係る復号化装置は、上記の構成において、前記第2のスペクトルは、0≦k<Naの周波数帯域のスペクトルに基づいて生成される構成を採る。 The decoding device according to a ninth aspect of the present invention employs a configuration in which, in the above configuration, the second spectrum is generated based on a spectrum in a frequency band of 0 ≦ k <Na.
この構成によれば、デコーダで得られる情報を基に拡張スペクトルを生成する符号化方法による符号化コードを復号することができるため、低ビットレート化が可能になる。 According to this configuration, it is possible to decode the encoded code by the encoding method for generating the extended spectrum based on the information obtained by the decoder, so that the bit rate can be reduced.
本発明の第10の態様に係る復号化装置は、上記の構成において、前記生成手段によって得られた結合後のスペクトルの周波数帯域の幅が、予め定められた幅と一致するように前記結合後のスペクトルの高域部に規定値を挿入するか若しくは前記結合後のスペクトルの高域部を廃棄する手段、をさらに具備する構成を採る。 In the decoding device according to the tenth aspect of the present invention, in the above configuration, the combined frequency band of the combined spectrum obtained by the generating unit is combined with the predetermined width so as to match a predetermined width. And a means for inserting a specified value into the high band part of the spectrum or discarding the high band part of the combined spectrum.
この構成によれば、ネットワークの状況等の要因によって受信されるスペクトルの帯域幅が変動する場合でもスペクトルの帯域幅が一定になるよう処理を加えた後に復号信号を生成するために所望のサンプリングレートの復号信号を安定して生成することができる。 According to this configuration, even when the bandwidth of the received spectrum fluctuates due to factors such as network conditions, a desired sampling rate is generated in order to generate a decoded signal after processing is performed so that the spectrum bandwidth is constant. Can be stably generated.
本発明の第11の態様に係る復号化装置は、上記の構成において、前記サンプリング周波数がFxの信号は、階層符号化における下位レイヤで復号化された信号である構成を採る。 A decoding device according to an eleventh aspect of the present invention employs a configuration in which, in the above configuration, the signal having the sampling frequency Fx is a signal decoded in a lower layer in hierarchical encoding.
この構成によれば、複数レイヤの符号化部より構成される階層符号化により求められた符号化コードを復号することができる。 According to this configuration, it is possible to decode an encoded code obtained by hierarchical encoding composed of a plurality of layers of encoding units.
本発明の第12の態様に係る送受信装置は、上記いずれかに記載の符号化装置または復号化装置を具備する構成を採る。 A transmission / reception device according to a twelfth aspect of the present invention employs a configuration including any of the above-described encoding device or decoding device.
この構成によれば、上記と同様の作用効果を有する送受信装置を提供することができる。 According to this configuration, it is possible to provide a transmission / reception device having the same function and effect as described above.
本発明の第13の態様に係るサンプリングレート変換方法は、入力された時間領域信号を周波数領域変換して第1スペクトルを得る変換ステップと、得られた第1スペクトルの周波数帯域を拡張する拡張ステップと、拡張後の第1スペクトルの拡張された周波数帯域に第2スペクトルを挿入する挿入ステップと、を具備するようにした。 The sampling rate conversion method according to the thirteenth aspect of the present invention includes a conversion step of obtaining a first spectrum by frequency domain conversion of an input time domain signal, and an expansion step of extending the frequency band of the obtained first spectrum. And an insertion step of inserting the second spectrum into the expanded frequency band of the first spectrum after expansion.
この方法によれば、入力された時間領域の信号を周波数領域の信号に変換し、得られたスペクトルの周波数帯域を拡張することにより、時間領域においてアップサンプリングした信号と等価な信号を得ることができる。 According to this method, a signal equivalent to an upsampled signal in the time domain can be obtained by converting the input time domain signal into a frequency domain signal and extending the frequency band of the obtained spectrum. it can.
本発明の第14の態様に係る符号化方法は、第1および第2の時間領域信号を取得する取得ステップと、取得された第1および第2の時間領域信号をそれぞれ周波数領域変換して第1および第2のスペクトルを得る変換ステップと、前記第1スペクトルの周波数帯域を前記第2スペクトルの周波数帯域に応じて拡張する拡張ステップと、前記第1スペクトルの拡張された周波数帯域に前記第2スペクトルを挿入する挿入ステップと、前記挿入ステップによって得られたスペクトルを符号化する符号化ステップと、を具備するようにした。 An encoding method according to a fourteenth aspect of the present invention includes an acquisition step of acquiring first and second time domain signals, and first and second frequency domain transforms of the acquired first and second time domain signals, respectively. A conversion step of obtaining first and second spectra, an expansion step of extending a frequency band of the first spectrum in accordance with a frequency band of the second spectrum, and the second frequency band into the expanded frequency band of the first spectrum. An insertion step for inserting a spectrum and an encoding step for encoding the spectrum obtained by the insertion step are provided.
この方法によれば、符号化装置の回路規模を縮小でき、符号化の処理演算量も削減することができる。 According to this method, the circuit scale of the encoding device can be reduced, and the amount of processing for encoding can be reduced.
本発明の第15の態様に係る符号化方法は、入力されたサンプリング周波数がFxの信号を分析長2・Naで周波数分析してNa点の第1スペクトルを得る変換ステップと、得られた第1スペクトルの周波数帯域をNb点に拡張する拡張ステップと、拡張後の第1スペクトルの拡張された周波数帯域に挿入される第2スペクトルを特定し、この第2スペクトルを表す符号化コードを出力する符号化ステップと、を具備するようにした。 The encoding method according to the fifteenth aspect of the present invention includes a conversion step of obtaining a first spectrum of Na point by performing frequency analysis of an input signal having a sampling frequency of Fx with an analysis length of 2 · Na, and the obtained first step. An expansion step for extending the frequency band of one spectrum to the Nb point, a second spectrum to be inserted into the expanded frequency band of the expanded first spectrum, are specified, and an encoded code representing the second spectrum is output. And an encoding step.
この方法によれば、時間領域でのサンプリング変換をせずに、サンプリングレートFS=Fx・Nb/Naのスペクトルを得ることができる。 According to this method, it is possible to obtain a spectrum of the sampling rate FS = Fx · Nb / Na without performing sampling conversion in the time domain.
本発明の第16の態様に係る復号化方法は、サンプリング周波数がFxの信号を分析長2・Naで周波数分析して0≦k<Naの周波数帯域の第1のスペクトルを取得する取得ステップと、符号化コードを受信し、Na≦k<Nbの周波数帯域の第2のスペクトルを復号する復号化ステップと、前記第1および第2のスペクトルを結合して0≦k<Nbの周波数帯域のスペクトルを生成する生成ステップと、0≦k<Nbの周波数帯域に含まれるスペクトルを時間領域の信号に変換する変換ステップと、を具備するようにした。 The decoding method according to the sixteenth aspect of the present invention includes an obtaining step of obtaining a first spectrum in a frequency band of 0 ≦ k <Na by performing frequency analysis of a signal having a sampling frequency of Fx with an analysis length of 2 · Na. A decoding step of receiving the encoded code and decoding a second spectrum in a frequency band of Na ≦ k <Nb, and combining the first and second spectrums in a frequency band of 0 ≦ k <Nb A generation step for generating a spectrum and a conversion step for converting a spectrum included in a frequency band of 0 ≦ k <Nb into a signal in a time domain are provided.
この方法によれば、上記いずれかに記載の符号化方法により生成された符号化コードを復号することができる。 According to this method, the encoded code generated by any one of the encoding methods described above can be decoded.
本発明によれば、回路規模を縮小でき、処理演算量も削減することができる。 According to the present invention, the circuit scale can be reduced and the amount of processing calculations can also be reduced.
本発明の骨子は、入力信号に対し、時間領域でサンプリング変換(特に、アップサンプリング)を行う代わりに、周波数領域でスペクトルの有効周波数帯域を拡張することにより、時間領域の信号においてアップサンプリングを行った場合と等価な信号を得ることである。 The essence of the present invention is that upsampling is performed on the time domain signal by extending the effective frequency band of the spectrum in the frequency domain instead of performing sampling conversion (particularly upsampling) on the input signal. It is to obtain a signal equivalent to the case.
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.
(実施の形態1)
図1は、本発明の実施の形態1に係るスペクトル符号化装置100の主要な構成を示すブロック図である。
(Embodiment 1)
FIG. 1 is a block diagram showing the main configuration of spectrum coding apparatus 100 according to
本実施の形態に係るスペクトル符号化装置100は、サンプリングレート変換部101、入力端子102、スペクトル情報特定部106、および出力端子107を有する。また、サンプリングレート変換部101は、周波数領域変換部103、帯域拡張部104、および拡張スペクトル付与部105を有する。
Spectrum coding apparatus 100 according to the present embodiment has sampling rate conversion section 101,
スペクトル符号化装置100には、入力端子102を介し、サンプリングレートFxでサンプリングされた信号が入力される。
A signal sampled at the sampling rate Fx is input to the spectrum encoding device 100 via the
周波数領域変換部103は、この信号を分析長2・Naで周波数分析することにより時間領域の信号を周波数領域の信号に変換(周波数領域変換)し、第1スペクトルS1(k)(0≦k<Na)を算出する。そして、求められた第1スペクトルS1(k)を帯域拡張部104に与える。ここで、周波数分析は、修正離散コサイン変換(MDCT)を用いる。MDCTは、前後の隣接フレームと分析フレームを半分ずつ重ね合わせて分析を行い、分析フレームの前半部は奇関数、後半部は偶関数となる直交基底を使うことにより、フレーム間の歪がキャンセルされるという特徴がある。なお、周波数分析の方法として、離散フーリエ変換(DFT)、離散コサイン変換(DCT)等を使用することも可能である。
The frequency
帯域拡張部104は、入力された第1スペクトルS1(k)の周波数k=Na以降に新たなスペクトルを付与できるように新たな領域(周波数帯域)を確保し、第1スペクトルS1(k)の有効周波数帯域を0≦k<Nbに拡張する。この有効周波数帯域を拡張する処理については後ほど詳述する。
The
拡張スペクトル付与部105は、帯域拡張部104にて拡張された周波数帯域に外部から入力される拡張スペクトルS1’(k)(Na≦k<Nb)を付与し、スペクトル情報特定部106に出力する。
The extended
スペクトル情報特定部106は、拡張スペクトル付与部105から与えられたスペクトルのうち、拡張スペクトルS1’(k)を特定するために必要な情報を符号化コードとして出力端子107を介し出力する。この符号化コードは、拡張スペクトルS1’(k)のサブバンドエネルギーを表す情報や有効周波数帯域を表す情報等である。この詳細についても後述する。
The spectrum
次いで、上記の帯域拡張部104が第1スペクトルS1(k)の有効周波数帯域を拡張する処理の詳細について、図2を用いて説明する。
Next, details of the process in which the
図2(a)は、周波数領域変換部103より与えられる第1スペクトルS1(k)を表しており、図2(b)は、帯域拡張部104において有効周波数帯域を拡張された後のスペクトルS1(k)を表している。帯域拡張部104は、第1スペクトルS1(k)の周波数kがNa≦k<Nbの範囲で表される周波数帯域に新規のスペクトル情報を格納できる領域を確保する。この新規な領域の大きさはNb−Naで表される。
2A shows the first spectrum S1 (k) given from the frequency
ここでNbは、入力端子102を介し外部から与えられる信号のサンプリングレートFxと周波数領域変換部103の分析長2・Naと復号化部(図示せず)にて復号される信号のサンプリングレートFyとの関係から決まる。具体的には、次式
図3は、帯域拡張部104において行われたスペクトルの有効周波数帯域を拡張する処理の効果を原理的に説明するための図である。図3(a)は、サンプリングレートFxの信号を分析長2・Naで周波数分析した際に得られるスペクトルSa(k)を表している。横軸は周波数、縦軸はスペクトル強度を表す。
FIG. 3 is a diagram for explaining in principle the effect of the process of extending the effective frequency band of the spectrum performed in the
信号の有効周波数帯域は、ナイキスト定理から0〜Fx/2となる。このとき、分析長が2・Naであるので、周波数インデックスkの範囲は0≦k<Naとなり、スペクトルSa(k)の周波数解像度はFx/(2・Na)となる。他方、同一信号をサンプリングレートFyへとアップサンプリングした後に、分析長2・Nbで周波数分析して得られるスペクトルSb(k)を図3(b)に示すと、信号の有効周波数帯域は0〜Fy/2まで拡張されており、周波数インデックスkの範囲は0≦k<Nbとなる。ここで、Nbが(式1)を満足する場合、スペクトルSb(k)の周波数解像度Fy/(2・Nb)は、Fx/(2・Na)と等しくなる。すなわち、帯域0≦k<NaのスペクトルSa(k)とスペクトルSb(k)とは等しくなる。逆の見方をすると、スペクトルSa(k)(0≦k<Na)の帯域をNbまで広げたときのスペクトルSb(k)は、サンプリングFxの信号をサンプリングFyにアップサンプリングした後に、分析長2・Nbで周波数分析して得られるスペクトルと一致する、ことを意味する。この原理を利用することにより、時間領域においてアップサンプリングすることなく、アップサンプリングされた信号と等価のスペクトルを得ることができる。
The effective frequency band of the signal is 0 to Fx / 2 from the Nyquist theorem. At this time, since the analysis length is 2 · Na, the range of the frequency index k is 0 ≦ k <Na, and the frequency resolution of the spectrum Sa (k) is Fx / (2 · Na). On the other hand, when the spectrum Sb (k) obtained by frequency analysis with the
このように、サンプリングレート変換部101において、入力された時間領域の信号を周波数領域の信号に変換し、得られたスペクトルの有効周波数帯域を拡張することにより、時間領域においてアップサンプリングした信号を周波数変換して求められるスペクトルと等価なスペクトルを得ることができる。 In this way, the sampling rate conversion unit 101 converts the input time domain signal into a frequency domain signal and expands the effective frequency band of the obtained spectrum, thereby frequency-sampling the signal up-sampled in the time domain. A spectrum equivalent to the spectrum obtained by conversion can be obtained.
なお、サンプリングレート変換部101から出力される信号は周波数領域の信号であるため、時間領域の信号が必要とされる場合は、時間領域変換部を設けて時間領域への再変換を行えば良い。上記の例では、サンプリングレート変換部101はスペクトル符号化装置100内に設置されているので、時間領域の信号に戻すことなく周波数領域の信号のままスペクトル情報特定部106に入力され、符号化コードが生成される。
Since the signal output from the sampling rate conversion unit 101 is a frequency domain signal, if a time domain signal is required, a time domain conversion unit may be provided to perform reconversion to the time domain. . In the above example, since the sampling rate conversion unit 101 is installed in the spectrum encoding device 100, the signal is input to the spectrum
ここで、拡張スペクトル付与部105に入力される拡張スペクトルの選択と、スペクトル情報特定部106におけるスペクトル情報の特定の仕方とを調整することにより、スペクトル情報特定部106から出力される符号化コードの符号化率は異なってくる。すなわち、サンプリングレート変換部101内の一部の処理は符号化にも大きな影響を与えている。これは、スペクトル符号化装置100が、入力信号のサンプリングレートの変換と符号化とを同時に実現していることを意味している。
Here, by adjusting the selection of the extended spectrum input to the extended
また、ここでは説明を簡単にするために、拡張スペクトル付与部105において拡張スペクトルが元のスペクトルに付与される場合を例にとって説明したが、スペクトル情報特定部106で行われる処理は、拡張スペクトルを特定するために必要な情報を符号化コードとして出力することであるため、付与されるべき拡張スペクトルが特定されていれば充分であるので、必ずしも拡張スペクトルが実際に付与されなければならないわけではない。
In addition, here, in order to simplify the explanation, the case where the extended spectrum is added to the original spectrum in the extended
また、ここではサンプリングレート変換の一例としてアップサンプリングを例にとって説明したが、上記の原理はダウンサンプリングの場合にも適用できる。 In addition, although up sampling has been described as an example of sampling rate conversion here, the above principle can be applied to down sampling.
図4は、本実施の形態に係る符号化装置120が無線通信システムの送信側に搭載された場合の無線送信装置130の主要な構成を示すブロック図である。
FIG. 4 is a block diagram showing the main configuration of radio transmission apparatus 130 when encoding
この無線送信装置130は、符号化装置120、入力装置131、A/D変換装置132、RF変調装置133、およびアンテナ134を有する。
The wireless transmission device 130 includes an
入力装置131は、人間の耳に聞こえる音波W11を電気的信号であるアナログ信号に変換し、A/D変換装置132に出力する。A/D変換装置132は、このアナログ信号をディジタル信号に変換し、符号化装置120に出力する(信号S1)。符号化装置120は、入力されたディジタル信号S1を符号化して符号化信号を生成し、RF変調装置133に出力する(信号S2)。RF変調装置133は、符号化信号S2を変調して変調符号化信号を生成し、アンテナ134に出力する。アンテナ134は、変調符号化信号を電波W12として送信する。
The
図5は、上記の符号化装置120の内部構成を示すブロック図である。ここでは、階層符号化(スケーラブル符号化)を行う場合を例にとって説明する。
FIG. 5 is a block diagram showing an internal configuration of the
符号化装置120は、入力端子121、ダウンサンプリング部122、第1レイヤ符号化部123、第1レイヤ復号化部124、遅延部126、スペクトル符号化部100a、多重化部127、および出力端子128を有する。
The
入力端子121には、サンプリングレートFyの音響信号S1が入力される。ダウンサンプリング部122は、入力端子121を介し入力された信号S1にダウンサンプリングを施してサンプリングレートFxの信号を生成し、出力する。第1レイヤ符号化部123は、このダウンサンプリング後の信号を符号化し、得られた符号化コードを多重化部(マルチプレクサ)127に出力すると共に、第1レイヤ復号化部124にも出力する。第1レイヤ復号化部124は、この符号化コードを基に第1レイヤの復号信号を生成する。
An acoustic signal S1 having a sampling rate Fy is input to the
一方、遅延部126は、入力端子121を介し入力される信号S1に対し、所定の長さの遅延を与える。この遅延の大きさは、信号がダウンサンプリング部122、第1レイヤ符号化部123,および第1レイヤ復号化部124を介した際に生じる時間遅れと同値とする。スペクトル符号化部100aは、第1レイヤ復号化部124から出力されるサンプリングレートFxの信号S3と、遅延部126から出力されるサンプリングレートFyの信号S4とを用いてスペクトル符号化を行い、生成した符号化コードS5を多重化部127に出力する。多重化部127は、第1レイヤ符号化部123で求められる符号化コードとスペクトル符号化部100aで求められる符号化コードS5を多重化し、出力コードS2として出力端子128を介し出力する。この出力コードS2は、RF変調装置133に与えられる。
On the other hand, the
図6は、上記のスペクトル符号化部100aの内部構成を示すブロック図である。なお、このスペクトル符号化部100aは、図1に示したスペクトル符号化装置100と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
FIG. 6 is a block diagram showing an internal configuration of the
スペクトル符号化部100aの特徴は、サンプリングレートFyの入力信号S3のスペクトルを利用して、拡張スペクトルS1’(k)(Na≦k<Nb)を付与することである。これによれば、拡張スペクトルS1’(k)を決定するための目標信号が与えられるため、拡張スペクトルS1’(k)の精度が向上し、結果として品質向上につながるという効果が得られる。
A feature of the
周波数領域変換部112は、入力端子111を介し入力されたサンプリングレートFyの信号S4を分析長2・Nbにて周波数分析し、第2スペクトルS2(k)(0≦k<Nb)を求める。ここで、サンプリング周波数Fx、Fy、および分析長Na、Nbには(式1)で表される関係が成立しているものとする。
The
スペクトル情報特定部106は、拡張スペクトルS1’(k)を表す符号化コードを決定する。ここでは、拡張スペクトルS1’(k)を周波数領域変換部112にて求められた第2スペクトルS2(k)を利用して決定する。スペクトル情報特定部106は、拡張スペクトルS1’(k)の形状を決定するステップと拡張スペクトルS1’(k)のゲインを決定するステップとの2つのステップを経て符号化コードを決定する。
The spectrum
まず、拡張スペクトルS1’(k)の形状を決定するステップについて以下説明する。 First, the step of determining the shape of the extended spectrum S1 '(k) will be described below.
このステップでは、第1スペクトルS1(k)の帯域0≦k<Naを利用して、拡張スペクトルS1’(k)を決定する。その具体的な方法として、次式
また別の方法として、上記のように固定値Cではなく、ある定められた範囲TMIN〜TMAXの値をとる変数Tを用い、拡張スペクトルS1’(k)と第2スペクトルS2(k)の形状が最も類似するときの変数Tの値T’を符号化コードの一部として出力しても良い。このとき、拡張スペクトルS1’(k)は次式
次に、スペクトル情報特定部106にて行われる拡張スペクトルS1’(k)のゲインを決定するステップについて以下説明する。
Next, the step of determining the gain of the extended spectrum S1 ′ (k) performed by the spectrum
拡張スペクトルS1’(k)のゲインは、第2スペクトルS2(k)の帯域Na≦k<Nbのパワと一致するように決定される。具体的には、次式
また、拡張スペクトルS1’(k)を複数のサブバンドに分割し、それぞれのサブバンドについて独立に符号化コードを決定する態様でも良い。かかる場合、拡張スペクトルS1’(k)の形状を決定するステップにおいては、サブバンド毎に(式4)に表されるT’をそれぞれ決定して符号化コードとして出力しても良いし、共通のT’を一つだけ決定して符号化コードとして出力しても良い。そして、拡張スペクトルS1’(k)のゲインを決定するステップにおいては、サブバンド毎にパワの偏差V(j)を算出し、この値を量子化して得られるインデックスを符号化コードとして出力端子107を介して出力する。サブバンド毎のパワの変動量は、次式
なお、図6に示したような、第2スペクトルS2(k)を算出する態様とは別に、図7に示すように、サンプリングレートFyの信号をLPC分析する態様(スペクトル符号化部100b)でも良い。すなわち、サンプリングレートFyの信号をLPC分析してLPC係数を求め、このLPC係数を用いて拡張スペクトルS1’(k)を決定することもできる。この構成では、LPC係数をDFTしてスペクトル情報に変換し、このスペクトルを用いて拡張スペクトルS1’(k)を決定することができる。 In addition to the mode for calculating the second spectrum S2 (k) as shown in FIG. 6, as shown in FIG. 7, the mode (spectrum encoding unit 100b) for LPC analysis of the signal at the sampling rate Fy is also possible. good. That is, the LPC coefficient is obtained by LPC analysis of the signal of the sampling rate Fy, and the extended spectrum S1 '(k) can be determined using the LPC coefficient. In this configuration, the LPC coefficient is DFT converted into spectral information, and the extended spectrum S1 '(k) can be determined using this spectrum.
このように、本実施の形態の符号化装置によれば、符号化装置の回路規模を縮小でき、符号化の処理演算量も削減することができる。 Thus, according to the encoding apparatus of the present embodiment, the circuit scale of the encoding apparatus can be reduced, and the processing amount of encoding processing can also be reduced.
また、上記の効果の他に、スケーラブル符号化に本実施の形態の符号化装置を適用した場合には、次のようなさらなる効果が得られる。 In addition to the above effects, when the coding apparatus according to the present embodiment is applied to scalable coding, the following further effects can be obtained.
従来のように時間領域にてサンプリングレート変換を行う場合は、エイリアシングの発生を避けるために入力信号を低域通過フィルタ(以後LPFと呼ぶ)に通す必要がある。一般に、時間領域でフィルタリング処理を行うと、入力信号に対して出力信号に時間遅れ(遅延)が生じる。LPFにFIR型フィルタを適用する場合には、カットオフ特性を急峻にするためにフィルタ次数を大きくする必要があり、演算量の大幅な増加と共にフィルタ次数の半分のサンプル値に相当する時間遅れが生じてしまう。 When sampling rate conversion is performed in the time domain as in the prior art, it is necessary to pass the input signal through a low-pass filter (hereinafter referred to as LPF) in order to avoid aliasing. In general, when filtering processing is performed in the time domain, a time delay (delay) occurs in the output signal with respect to the input signal. When an FIR type filter is applied to an LPF, it is necessary to increase the filter order in order to make the cut-off characteristic steep, and a time delay corresponding to a sample value that is half the filter order increases with a large increase in the amount of calculation. It will occur.
例えば、サンプリング周波数Fs=24kHzの信号に対して256次のフィルタを適用した場合には、サンプリングレート変換だけで5ms以上の遅延が生じる。こういった遅延の発生は、双方向音声通話へ適用した場合、通話相手の反応が遅くなったように感じてしまい問題である。 For example, when a 256th-order filter is applied to a signal having a sampling frequency Fs = 24 kHz, a delay of 5 ms or more occurs only by sampling rate conversion. The occurrence of such a delay is a problem when it is applied to a two-way voice call and it feels that the reaction of the other party has been delayed.
また、LPFにIIR型フィルタを使用した場合には、比較的次数を少なくしてもカットオフ特性を急峻にすることができ、かつFIR型フィルタほど遅延が大きくなることはない。しかし、IIR型フィルタではFIR型フィルタのように全周波数で生じる遅延量が一定となるフィルタを設計することができない。これは、スケーラブル符号化において、入力信号からサンプリングレート変換後の信号を減算するときに、サンプリングレート変換後の信号の時間遅れに合わせて入力信号に一定の遅延量を与える必要があるが、IIR型のLPFを用いた場合には周波数に対する遅延量が一定でないため、その減算処理が的確に行えないという問題が生じる。 Further, when an IIR filter is used for the LPF, the cut-off characteristic can be made steep even if the order is relatively reduced, and the delay is not increased as much as the FIR filter. However, an IIR filter cannot design a filter in which the amount of delay generated at all frequencies is constant, unlike an FIR filter. In scalable coding, when subtracting the signal after sampling rate conversion from the input signal, it is necessary to give a certain delay amount to the input signal in accordance with the time delay of the signal after sampling rate conversion. When the type LPF is used, the amount of delay with respect to the frequency is not constant, so that there is a problem that the subtraction process cannot be performed accurately.
本実施の形態の符号化装置は、スケーラブル符号化において発生するこれらの問題点を解消することができる。 The encoding apparatus according to the present embodiment can solve these problems that occur in scalable encoding.
図8は、無線送信装置130から送信された信号を受信する無線受信装置180の主要な構成を示すブロック図である。 FIG. 8 is a block diagram showing the main configuration of radio receiving apparatus 180 that receives a signal transmitted from radio transmitting apparatus 130.
この無線受信装置180は、アンテナ181、RF復調装置182、復号化装置170、D/A変換装置183、および出力装置184を有している。
The wireless reception device 180 includes an
アンテナ181は、電波W12としてのディジタルの符号化音響信号を受けて電気信号のディジタルの受信符号化音響信号を生成してRF復調装置182に与える。RF復調装置182は、アンテナ181からの受信符号化音響信号を復調して復調符号化音響信号S11を生成して復号化装置170に与える。
The
復号化装置170は、RF復調装置182からのディジタルの復調符号化音響信号S11を受けて復号化処理を行ってディジタルの復号化音響信号S12を生成してD/A変換装置183に与える。D/A変換装置183は、復号化装置170からのディジタルの復号化音響信号S12を変換してアナログの復号化音声信号を生成して出力装置184に与える。出力装置184は、電気的信号であるアナログの復号化音声信号を空気の振動に変換して音波W13として人間の耳に聴こえるように出力する。
The
図9は、上記の復号化装置170の内部構成を示すブロック図である。ここでも、階層符号化された信号を復号する場合を例にとって説明する。
FIG. 9 is a block diagram showing an internal configuration of the
この復号化装置170は、入力端子171、分離部172、第1レイヤ復号化部173、スペクトル復号化部150、および出力端子176を有する。
The
入力端子171には、RF復調装置182から階層符号化されたコードS11が入力される。分離部172は、入力端子171を介し入力された復調符号化音響信号S11を分離し、第1レイヤ復号化部173用の符号化コードとスペクトル復号化部150用の符号化コードとを生成する。第1レイヤ復号化部173は、分離部172で得られた符号化コードを用いてサンプリングレートFxの復号信号を復号し、この復号信号S13をスペクトル復号化部150に与える。スペクトル復号化部150は、分離部172で分離された符号化コードS14と第1レイヤ復号化部173で生成されたサンプリングレートFxの信号S13に対し、後述するスペクトル復号化を行い、サンプリングレートFyの復号信号S12を生成し、出力端子176を介しこれを出力する。
The
図10は、上記のスペクトル復号化部150の内部構成を示すブロック図である。
FIG. 10 is a block diagram showing an internal configuration of the
このスペクトル復号化部150は、入力端子152、153、周波数領域変換部154、帯域拡張部155、復号部156、結合部157、時間領域変換部158、および出力端子159を有する。
The
入力端子152には、サンプリングレートFxでサンプリングされた信号S13が入力される。また、入力端子153には、拡張スペクトルS1’(k)に関する符号化コードS14が入力される。
A signal S13 sampled at the sampling rate Fx is input to the
周波数領域変換部154は、入力端子152から入力された時間領域信号S13に対し分析長2・Naで周波数分析を行い、第1スペクトルS1(k)を算出する。周波数分析法は、修正離散コサイン変換(MDCT)を用いる。MDCTは、前後の隣接フレームと分析フレームを半分ずつ重ね合わせて分析を行い、分析フレームの前半部は奇関数、後半部は偶関数となる直交基底を使うことにより、フレーム間の歪がキャンセルされるという特徴がある。このようにして求められた第1スペクトルS1(k)は、帯域拡張部155に与えられる。なお、周波数分析法としては、離散フーリエ変換(DFT)、離散コサイン変換(DCT)等を使用することも可能である。
The frequency
帯域拡張部155は、入力された第1スペクトルS1(k)の周波数k=Na以降に新たにスペクトルを付与できるような領域を確保し、第1スペクトルS1(k)の帯域が0≦k<Nbとなるようにする。帯域が拡張された第1スペクトルS1(k)は、結合部157に出力される。
The
一方、復号部156は、入力端子153を介し入力された拡張スペクトルS1’(k)に関する符号化コードS14を復号して、拡張スペクトルS1’(k)を得て、結合部157に出力する。
On the other hand, the
結合部157は、帯域拡張部155より与えられた第1スペクトルS1(k)と拡張スペクトルS1’(k)を結合させる。この結合は、第1スペクトルS1(k)の帯域Na≦k<Nbに拡張スペクトルS1’(k)を挿入することにより実現される。この処理により得られる第1スペクトルS1(k)は、時間領域変換部158に出力される。
The combining
時間領域変換部158は、スペクトル符号化部100aで施された周波数領域変換の逆変換に相当する時間領域変換処理を施し、適切な窓関数の乗算および重ね合わせ加算を経て、時間領域の信号S12を生成する。このようにして生成された時間領域の信号S12は、復号信号として出力端子159を介して出力される。
The time
次いで、帯域拡張部155で行われる処理について、図11を用いて説明する。
Next, processing performed by the
図11(a)は、周波数領域変換部154より与えられる第1スペクトルS1(k)を表す。図11(b)は、帯域拡張部155の処理の結果得られるスペクトルを表し、周波数kがNa≦k<Nbの範囲で表される帯域に新規のスペクトル情報を格納できる領域が確保される。この新規領域の大きさはNb−Naで表される。Nbは、入力端子152から与えられる信号のサンプリングレートFxと、周波数領域変換部154の分析長2・Naと、スペクトル復号化部150にて復号される信号のサンプリングレートFyとの間の関係に依存し、次式
図12は、スペクトルが結合部157および時間領域変換部158における処理を経てどのように復号信号が生成されるかを示した図である。
FIG. 12 is a diagram showing how a spectrum is subjected to processing in the combining
結合部157は、帯域が拡張された第1スペクトルS1(k)のNa≦k<Nbの帯域に拡張スペクトルS1’(k)(Na≦k<Nb)を挿入し、これにより得られる結合後の第1スペクトルS1(k)(0≦k<Nb)を時間領域変換部158に送る。時間領域変換部158は、時間領域の復号信号を生成し、これによりサンプリングレートFS(=Fx・Nb/Na)の復号信号を得ることができる。
The combining
このように、本実施の形態の復号化装置によれば、本実施の形態に係る符号化装置によって符号化された信号を復号することができる。 Thus, according to the decoding apparatus of the present embodiment, it is possible to decode the signal encoded by the encoding apparatus according to the present embodiment.
なお、ここでは、本実施の形態に係る符号化装置または復号化装置が無線通信システムに適用される場合を例にとって説明したが、本実施の形態に係る符号化装置または復号化装置は、以下に示すように、有線通信システムにも適用することができる。 Here, the case where the encoding apparatus or decoding apparatus according to the present embodiment is applied to a wireless communication system has been described as an example, but the encoding apparatus or decoding apparatus according to the present embodiment is described below. As shown in FIG. 6, the present invention can also be applied to a wired communication system.
図13(a)は、本実施の形態に係る符号化装置が有線通信システムに適用された場合の送信側の主要な構成を示したブロック図である。なお、図4に示した構成要素と同一のものには同一の符号を付し、その説明を省略する。 FIG. 13A is a block diagram showing a main configuration on the transmission side when the coding apparatus according to the present embodiment is applied to a wired communication system. The same components as those shown in FIG. 4 are denoted by the same reference numerals, and the description thereof is omitted.
有線送信装置140は、符号化装置120、入力装置131、およびA/D変換装置132を有し、出力がネットワークN1に接続されている。
The wired transmission device 140 includes an
A/D変換装置132の入力端子は、入力装置131の出力端子に接続されている。符号化装置120の入力端子は、A/D変換装置132の出力端子に接続されている。符号化装置120の出力端子はネットワークN1に接続されている。
The input terminal of the A /
入力装置131は、人間の耳に聞こえる音波W11を電気的信号であるアナログ信号に変換してA/D変換装置132に与える。A/D変換装置132は、アナログ信号をディジタル信号に変換して符号化装置120に与える。符号化装置120は、入力されてくるディジタル信号を符号化してコードを生成し、ネットワークN1に出力する。
The
図13(b)は、本実施の形態に係る復号化装置が有線通信システムに適用された場合の受信側の主要な構成を示したブロック図である。なお、図8に示した構成要素と同一のものには同一の符号を付し、その説明を省略する。 FIG. 13B is a block diagram showing a main configuration on the receiving side when the decoding apparatus according to the present embodiment is applied to a wired communication system. In addition, the same code | symbol is attached | subjected to the same thing as the component shown in FIG. 8, and the description is abbreviate | omitted.
有線受信装置190は、ネットークN1に接続されている受信装置191、復号化装置170、D/A変換装置183、および出力装置184を有している。
The wired receiving device 190 includes a receiving
受信装置191の入力端子は、ネットワークN1に接続されている。復号化装置170の入力端子は、受信装置191の出力端子に接続されている。D/A変換装置183の入力端子は、復号化装置170の出力端子に接続されている。出力装置184の入力端子は、D/A変換装置183の出力端子に接続されている。
The input terminal of the receiving
受信装置191は、ネットワークN1からのディジタルの符号化音響信号を受けてディジタルの受信音響信号を生成して復号化装置170に与える。復号化装置170は、受信装置191からの受信音響信号を受けてこの受信音響信号に復号化処理を行ってディジタルの復号化音響信号を生成してD/A変換装置183に与える。D/A変換装置183は、復号化装置170からのディジタルの復号音声信号を変換してアナログの復号音声信号を生成して出力装置184に与える。出力装置184は、電気的信号であるアナログの復号音響信号を空気の振動に変換して音波W13として人間の耳に聴こえるように出力する。
The receiving
このように、上記の構成によれば、上記の無線送受信装置と同様の作用効果を有する有線送受信装置を提供することができる。 Thus, according to said structure, the wired transmission / reception apparatus which has the same effect as said wireless transmission / reception apparatus can be provided.
(実施の形態2)
図14は、本発明の実施の形態2に係る復号化装置270の主要な構成を示すブロック図である。なお、この復号化装置270は、図9に示した復号化装置170と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
(Embodiment 2)
FIG. 14 is a block diagram showing the main configuration of
本実施の形態の特徴は、結合後の第1スペクトルS1(k)(0≦k<Nb)の最大周波数インデックスNbを所望の値Ncに修正することにより、所望のサンプリングレートにて復号信号を生成することである。 The feature of this embodiment is that the decoded signal is converted at a desired sampling rate by correcting the maximum frequency index Nb of the combined first spectrum S1 (k) (0 ≦ k <Nb) to a desired value Nc. Is to generate.
スペクトル復号化部250は、分離部172で分離された符号化コードS14、第1レイヤ復号化部173で生成されたサンプリングレートFxの信号S13、および入力端子271を介し入力された係数Nc(信号S21)を用いて、スペクトル復号化を行う。そして、得られたサンプリングレートFyの復号信号を出力端子176を介し出力する。スペクトル復号化部250における周波数領域変換の分析長が2・Naであるとき、復号信号のサンプリングレートFyはFy=Fx・Nc/Naで表される。
The
図15は、上記のスペクトル復号化部250の内部構成を示すブロック図である。
FIG. 15 is a block diagram showing the internal configuration of the
入力端子271を介し入力された係数Ncは、修正部251および時間領域変換部158aに与えられる。
The coefficient Nc input via the
修正部251は、結合部157より与えられる第1スペクトルS1(k)(0≦k<Nb)の有効な帯域を、入力端子271を介し与えられた係数Nc(信号S21)に基づいて0≦k<Ncに修正する。そして、帯域修正後の第1スペクトルS1(k)(0≦k<Nc)を時間領域変換部158aに与える。
The correcting
時間領域変換部158aは、入力端子271を介し与えられた係数Ncに従い、分析長2・Ncの下で修正部251から与えられる第1スペクトルS1(k)(0≦k<Nc)に対し変換処理を施し、適切な窓関数の乗算および重ね合わせ加算を行い、時間領域の信号を生成して出力端子159を介して出力する。この復号信号のサンプリングレートは、FS=Fx・Nc/Naとなる。
The time
図16および図17は、修正部251の処理をより詳細に説明するための図である。
16 and 17 are diagrams for explaining the processing of the
図16は、Nc<Nbの場合における修正部251の処理を表している。結合部157から与えられる第1スペクトルS1(k)(信号S21)の帯域は、0≦k<Nbとなっている。そこで、修正部251は、この第1スペクトルS1(k)の帯域が0≦k<Ncとなるように、Nc≦k<Nbの範囲のスペクトルを削除する。この結果得られる第1スペクトルS1(k)(0≦k<Nc)(信号S22)を時間領域変換部158aに与え、時間領域の復号信号S23が生成される。この復号信号S23のサンプリングレートは、FS=Fx・Nc/Naとなる。
FIG. 16 shows the processing of the
図17は、同様に修正部251の処理であるが、Nc>Nbの場合の処理を表している。結合部251から与えられる第1スペクトルS1(k)(信号S25)の帯域は、図16と同様に0≦k<Nbとなっている。修正部251は、この第1スペクトルS1(k)の帯域が0≦k<NcとなるようにNb≦k<Ncの帯域を拡張し、その領域に特定の値(例えば、ゼロ値)を付与する。この結果得られる第1スペクトルS1(k)(0≦k<Nc)(信号S26)を時間領域変換部158aに与え、時間領域の復号信号S27が生成される。この復号信号S27のサンプリングレートは、FS=Fx・Nc/Naとなる。
FIG. 17 similarly shows the processing of the
図18および図19を用いて、スペクトル復号化部250の動作をさらに説明する。
The operation of the
まず、入力端子153を介し入力される符号化コードがフレーム毎に変動していることを想定する。すなわち、結合部157から出力される第1スペクトルS1(k)の帯域には、図18に示されるような0≦k<Na(帯域R1)、0≦k<Nb1(帯域R2)、0≦k<Nb2(帯域R3)の3通りの帯域が存在し(ただし、Na<Nb1<Nb2)、フレーム毎にこれらの帯域の内の一つが選択されているものとする。
First, it is assumed that the encoded code input via the
図19(a)は、係数NcがNb2に等しい場合のスペクトル復号化部250の動作、図19(b)は、係数NcがNb1に等しい場合のスペクトル復号化部250の動作を説明するための図である。
FIG. 19A illustrates the operation of the
これらの図では、第iフレームで得られるスペクトルの帯域が、R1、R2、R3のいずれかであることを表している。また、処理1はNb1≦k<Nb2の帯域にゼロ値を挿入する処理、処理2はNa≦k<Nb2の帯域にゼロ値を挿入する処理、処理3はNb1≦k<Nb2の帯域を削除する処理、処理4はNa≦k<Nb1の帯域にゼロ値を挿入する処理を表している。
In these figures, the spectrum band obtained in the i-th frame is any one of R1, R2, and R3.
まず、図19(a)の場合について説明する。 First, the case of FIG. 19A will be described.
この図において、第0フレーム〜第1フレームおよび第7フレーム〜第8フレームではスペクトルの帯域がR3、すなわち第1スペクトルS1(k)の帯域が0≦k<Nb2であるため、修正部251は何の処理も施さずに第1スペクトルS1(k)(0≦k<Nb2)を時間領域変換部158aに出力する。
In this figure, since the spectrum band is R3 in the 0th frame to the 1st frame and the 7th frame to the 8th frame, that is, the band of the first spectrum S1 (k) is 0 ≦ k <Nb2, the
また、第2フレーム〜第4フレームおよび第9フレームではスペクトルの帯域がR2、すなわち第1スペクトルS1(k)の帯域が0≦k<Nb1であるため、修正部251は第1スペクトルS1(k)の帯域をNb2まで拡張し、かつNb1≦k<Nb2の帯域にゼロ値を挿入した後に、第1スペクトルS1(k)(0≦k<Nb2)を時間領域変換部158aに出力する。
Further, in the second to fourth frames and the ninth frame, the spectrum band is R2, that is, the band of the first spectrum S1 (k) is 0 ≦ k <Nb1, and therefore the correcting
一方、第5フレーム〜第6フレームではスペクトルの帯域がR1、すなわち第1スペクトルS1(k)の帯域が0≦k<Naであるため、修正部251は第1スペクトルS1(k)の帯域をNb2まで拡張し、かつNa≦k<Nb2の範囲にゼロ値を挿入した後に、第1スペクトルS1(k)(0≦k<Nb2)を時間領域変換部158aに出力する。
On the other hand, in the fifth to sixth frames, the spectrum band is R1, that is, the band of the first spectrum S1 (k) is 0 ≦ k <Na. Therefore, the
次に、図19(b)の場合について説明する。 Next, the case of FIG. 19B will be described.
この図において、第2フレーム〜第4フレームおよび第9フレームではスペクトルの帯域がR2、すなわち第1スペクトルS1(k)の帯域が0≦k<Nb1であるため、修正部251は何の処理も施さずに第1スペクトルS1(k)(0≦k<Nb1)を時間領域変換部158aに出力する。
In this figure, in the second to fourth frames and the ninth frame, since the spectrum band is R2, that is, the band of the first spectrum S1 (k) is 0 ≦ k <Nb1, the
また、第0フレーム〜第1フレームおよび第7フレーム〜第8フレームではスペクトルの帯域がR3、すなわち第1スペクトルS1(k)の帯域が0≦k<Nb2であるため、修正部251はNb1≦k<Nb2の帯域を削除した後に、第1スペクトルS1(k)(0≦k<Nb1)を時間領域変換部158aに出力する。
Further, in the 0th frame to the 1st frame and the 7th frame to the 8th frame, the spectrum band is R3, that is, the band of the first spectrum S1 (k) is 0 ≦ k <Nb2, and therefore the correcting
一方、第5フレーム〜第6フレームではスペクトルの帯域がR1、すなわち第1スペクトルS1(k)の帯域が0≦k<Naであるため、修正部251は第1スペクトルS1(k)の帯域をNb1まで拡張し、かつNa≦k<Nb1の帯域にゼロ値を挿入した後に、第1スペクトルS1(k)(0≦k<Nb1)を時間領域変換部158aに出力する。
On the other hand, in the fifth to sixth frames, the spectrum band is R1, that is, the band of the first spectrum S1 (k) is 0 ≦ k <Na. Therefore, the
このように、本実施の形態によれば、受信される第1スペクトルS1(k)の有効な周波数帯域が時間的に変動する場合でも、適切な係数Ncを与えることにより、所望のサンプリングレートの復号信号を安定して得ることができる。 As described above, according to the present embodiment, even when the effective frequency band of the received first spectrum S1 (k) fluctuates with time, by giving an appropriate coefficient Nc, a desired sampling rate can be obtained. The decoded signal can be obtained stably.
(実施の形態3)
図20は、本発明の実施の形態3に係る通信システムの主要な構成を示す図である。
(Embodiment 3)
FIG. 20 is a diagram showing a main configuration of a communication system according to
本実施の形態の特徴は、通信ネットワークの状況(通信環境)によって受信側で受信される第1スペクトルS1(k)の有効周波数帯域が時間的に変動する場合に対処することである。 The feature of this embodiment is to cope with a case where the effective frequency band of the first spectrum S1 (k) received on the receiving side varies with time depending on the situation (communication environment) of the communication network.
階層符号化部301は、サンプリングレートFyの入力信号に対し、実施の形態1で示した階層符号化処理を施し、スケーラブルな符号化コードを生成する。ここでは、生成される符号化コードが、帯域0≦k<Neに関する情報(R31)、帯域Ne≦k<Nfに関する情報(R32)、および帯域Nf≦k<Ngに関する情報(R33)により構成されるものとする。階層符号化部301は、この符号化コードをネットワーク制御部302に与える。
ネットワーク制御部302は、階層符号化部301より与えられる符号化コードを階層復号化部303に転送する。ここで、ネットワーク制御部302は、ネットワークの状況に応じて階層復号化部303に転送する符号化コードの一部を廃棄する。そのため、階層復号化部303に入力される符号化コードは、廃棄される符号化コードが全くない場合は情報R31〜R33により構成された符号化コード、情報R33の符号化コードが廃棄される場合は情報R31およびR32により構成された符号化コード、情報R32およびR33の符号化コードが廃棄される場合は情報R31により構成された符号化コード、のいずれかとなる。
The
階層復号化部303は、与えられた符号化コードに対し、実施の形態1または実施の形態2に示した階層復号化方法を適用して復号信号を生成する。なお、階層復号化部303に実施の形態1を適用した場合には、出力される復号信号のサンプリングレートFzは、Fyとなる(Fz=Fy・Ng/Ngのため)。また、階層復号化部303に実施の形態2を適用した場合には、所望の係数Ncによって復号信号のサンプリングレートを設定することができ、その復号信号のサンプリングレートFzは、Fy・Nc/Ngとなる。
このように、本実施の形態によれば、通信ネットワークの状況によって受信側で受信される第1スペクトルS1(k)の有効周波数帯域が時間的に変動する場合でも、受信側は所望のサンプリングレートの復号信号を安定して求めることができる。 As described above, according to the present embodiment, even when the effective frequency band of the first spectrum S1 (k) received on the receiving side varies with time depending on the state of the communication network, the receiving side has a desired sampling rate. Can be obtained stably.
(実施の形態4)
図21は、本発明の実施の形態4に係る通信システムの主要な構成を示す図である。
(Embodiment 4)
FIG. 21 is a diagram showing a main configuration of a communication system according to
本実施の形態の特徴は、1つの階層符号部により生成された1つの符号化コードを、それぞれ復号可能なサンプリングレートの異なる(復号能力の異なる)複数の階層復号化部に対して同時に送信しても、受信側がこれに対応し、それぞれ異なるサンプリングレートの復号信号を得ることである。 A feature of this embodiment is that one encoded code generated by one hierarchical encoder is simultaneously transmitted to a plurality of hierarchical decoders having different decoding rates (different decoding capabilities). However, the receiving side responds to this and obtains decoded signals having different sampling rates.
階層符号化部401は、サンプリングレートFyの入力信号に対して実施の形態1に示した符号化処理を施し、スケーラブルな符号化コードを生成する。ここでは、生成される符号化コードは、帯域0≦k<Nhに関する情報(R41)、帯域Nh≦k<Niに関する情報(R42)、帯域Ni≦k<Njに関する情報(R43)により構成されるものとする。階層符号化部401は、この符号化コードを、第1階層復号化部402−1、第2階層復号化部402−2、第3階層復号化部402−3にそれぞれ与える。
第1階層復号化部402−1、第2階層復号化部402−2、および第3階層復号化部402−3は、与えられた符号化コードに対し、実施の形態1または実施の形態2に示した階層復号化法を適用して復号信号を生成する。第1階層復号化部402−1は係数Nc=Njとしたときの復号化処理、第2階層復号化部402−2は係数Nc=Niとしたときの復号化処理、第3階層復号化部402−3は係数Nc=Nhとしたときの復号化処理を行う。 First layer decoding section 402-1, second layer decoding section 402-2, and third layer decoding section 402-3 perform the first or second embodiment on the given encoded code. The decoded signal is generated by applying the hierarchical decoding method shown in FIG. First hierarchy decoding section 402-1 is a decoding process when coefficient Nc = Nj, second hierarchy decoding section 402-2 is a decoding process when coefficient Nc = Ni, and third hierarchy decoding section 402-3 performs a decoding process when the coefficient Nc = Nh.
第1階層復号化部402−1は、係数Nc=Njとしたときの復号化処理を行い、復号信号を生成する。この復号信号のサンプリングレートF1はFyとなる(F1=Fy・Nj/Njのため)。 First layer decoding section 402-1 performs a decoding process when coefficient Nc = Nj, and generates a decoded signal. The sampling rate F1 of this decoded signal is Fy (because F1 = Fy · Nj / Nj).
第2階層復号化部402−2は、係数Nc=Niとしたときの復号化処理を行い、復号信号を生成する。この復号信号のサンプリングレートF2はFy・Ni/Njとなる。 Second layer decoding section 402-2 performs a decoding process when coefficient Nc = Ni, and generates a decoded signal. The sampling rate F2 of this decoded signal is Fy · Ni / Nj.
第3階層復号化部402−3は、係数Nc=Nhとしたときの復号化処理を行い、復号信号を生成する。この復号信号のサンプリングレートF3はFy・Nh/Njとなる。 Third layer decoding section 402-3 performs a decoding process when coefficient Nc = Nh, and generates a decoded signal. The sampling rate F3 of this decoded signal is Fy · Nh / Nj.
このように、本実施の形態によれば、送信側は受信側の復号能力を考慮することなく符号化コードを送信することができるので、通信ネットワークの負荷を抑えることができる。また、これら複数種類のサンプリングレートの復号信号は、簡易な構成かつ少ない演算量で生成することができる。 As described above, according to the present embodiment, the transmitting side can transmit the encoded code without considering the decoding capability of the receiving side, so that the load on the communication network can be suppressed. Also, the decoded signals of these plural types of sampling rates can be generated with a simple configuration and a small amount of calculation.
本発明は、移動体通信システムにおける通信端末装置および基地局装置に適用することも可能であり、これにより上記と同様の作用効果を有する通信端末装置および基地局装置を提供することができる。 The present invention can also be applied to a communication terminal apparatus and a base station apparatus in a mobile communication system, thereby providing a communication terminal apparatus and a base station apparatus having the same effects as described above.
なお、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、ソフトウェアで実現することも可能である。 Here, the case where the present invention is configured by hardware has been described as an example, but it can also be realized by software.
本発明は、簡易な構成および少ない演算量でスケーラブル符号化を実現する効果を有し、IPネットワーク等の通信システムの用途に適用できる。 The present invention has the effect of realizing scalable coding with a simple configuration and a small amount of computation, and can be applied to the use of a communication system such as an IP network.
103、112、154 周波数領域変換部
104、155 帯域拡張部
105 拡張スペクトル付与部
106 スペクトル情報特定部
113 LPC分析部
156 復号部
157 結合部
158 時間領域変換部
251 修正部
103, 112, 154 Frequency
Claims (4)
前記音声信号または前記オーディオ信号の第2帯域を符号化する第2符号化手段と、を具備し、
前記第2符号化手段は、
前記第1符号化手段で得られる第1サンプリングレートの時間領域信号から、周波数領域変換によってスペクトルを得る変換手段と、
前記第1サンプリングレート、および前記第2帯域に相当する第2サンプリングレートの比に対応する帯域幅の拡張スペクトルを前記スペクトルに基づいて生成する生成手段と、
前記スペクトルおよび前記拡張スペクトルを符号化する符号化手段と、を具備する、
スケーラブル符号化装置。 First encoding means for encoding a first band of an audio signal or an audio signal;
A second encoding means for encoding a second band of the audio signal or the audio signal,
The second encoding means includes
Conversion means for obtaining a spectrum by frequency domain conversion from a time domain signal at a first sampling rate obtained by the first encoding means;
Generating means for generating, based on the spectrum, an extended spectrum of a bandwidth corresponding to a ratio of the first sampling rate and a second sampling rate corresponding to the second band;
Encoding means for encoding the spectrum and the extended spectrum;
Scalable encoding device.
前記符号化情報を復号して音声信号またはオーディオ信号の第2帯域に相当する第2サンプリングレートの時間領域信号を生成する第2復号化手段と、を具備し、
前記第2復号化手段は、
前記第1復号化手段で得られる第1サンプリングレートの時間領域信号から、周波数領域変換によってスペクトルを得る第1変換手段と、
スケーラブル符号化装置で生成される符号化情報を復号して、前記第1サンプリングレートおよび前記第2サンプリングレートの比に対応する帯域幅の拡張スペクトルを生成する生成手段と、
前記スペクトルおよび前記拡張スペクトルから、時間領域変換によって時間領域信号を得る第2変換手段と、を具備する、
スケーラブル復号化装置。 First decoding means for decoding encoded information generated by the scalable encoding device to generate a time-domain signal having a first sampling rate corresponding to the first band of the audio signal or audio signal;
Decoding the encoded information to generate a time domain signal having a second sampling rate corresponding to the second band of the audio signal or the audio signal; and
The second decoding means includes
First transforming means for obtaining a spectrum by frequency domain transform from a time domain signal at a first sampling rate obtained by the first decoding means;
Generating means for decoding encoded information generated by the scalable encoding device and generating an extended spectrum of a bandwidth corresponding to a ratio of the first sampling rate and the second sampling rate;
Second conversion means for obtaining a time domain signal by time domain conversion from the spectrum and the extended spectrum,
Scalable decoding device.
前記音声信号または前記オーディオ信号の第2帯域を符号化する第2符号化ステップと、を具備し、
前記第2符号化ステップは、
前記第1符号化ステップで得られる第1サンプリングレートの時間領域信号から、周波数領域変換によってスペクトルを得る変換ステップと、
前記第1サンプリングレート、および前記第2帯域に相当する第2サンプリングレートの比に対応する帯域幅の拡張スペクトルを前記スペクトルに基づいて生成する生成ステップと、
前記スペクトルおよび前記拡張スペクトルを符号化する符号化ステップと、を具備する、
スケーラブル符号化方法。 A first encoding step of encoding a first band of the audio signal or audio signal;
A second encoding step for encoding a second band of the audio signal or the audio signal,
The second encoding step includes
A conversion step of obtaining a spectrum by frequency domain conversion from a time-domain signal at a first sampling rate obtained in the first encoding step;
Generating an extended spectrum of a bandwidth corresponding to a ratio of the first sampling rate and a second sampling rate corresponding to the second band based on the spectrum;
An encoding step for encoding the spectrum and the extended spectrum;
Scalable encoding method.
前記符号化情報を復号して音声信号またはオーディオ信号の第2帯域に相当する第2サンプリングレートの時間領域信号を生成する第2復号化ステップと、を具備し、
前記第2復号化ステップは、
前記第1復号化ステップで得られる第1サンプリングレートの時間領域信号から、周波数領域変換によってスペクトルを得る第1変換ステップと、
スケーラブル符号化装置で生成される符号化情報を復号して、前記第1サンプリングレートおよび前記第2サンプリングレートの比に対応する帯域幅の拡張スペクトルを生成する生成ステップと、
前記スペクトルおよび前記拡張スペクトルから、時間領域変換によって時間領域信号を得る第2変換ステップと、を具備する、
スケーラブル復号化方法。 A first decoding step of decoding time-domain signals having a first sampling rate corresponding to a first band of an audio signal or an audio signal by decoding encoded information generated by the scalable encoding device;
A second decoding step of decoding the encoded information to generate a time domain signal having a second sampling rate corresponding to the second band of the audio signal or the audio signal,
The second decoding step includes
A first transform step for obtaining a spectrum by frequency domain transform from a time domain signal at a first sampling rate obtained in the first decoding step;
A generation step of decoding encoded information generated by the scalable encoding device to generate an extended spectrum of a bandwidth corresponding to a ratio of the first sampling rate and the second sampling rate;
A second transforming step of obtaining a time domain signal from the spectrum and the extended spectrum by time domain transform,
Scalable decoding method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009204962A JP5031006B2 (en) | 2009-09-04 | 2009-09-04 | Scalable decoding apparatus and scalable decoding method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009204962A JP5031006B2 (en) | 2009-09-04 | 2009-09-04 | Scalable decoding apparatus and scalable decoding method |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003341717A Division JP4679049B2 (en) | 2003-09-30 | 2003-09-30 | Scalable decoding device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010020333A true JP2010020333A (en) | 2010-01-28 |
JP5031006B2 JP5031006B2 (en) | 2012-09-19 |
Family
ID=41705206
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009204962A Expired - Lifetime JP5031006B2 (en) | 2009-09-04 | 2009-09-04 | Scalable decoding apparatus and scalable decoding method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5031006B2 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011171968A (en) * | 2010-02-18 | 2011-09-01 | Jvc Kenwood Holdings Inc | Apparatus and method for noise elimination |
JP2014510299A (en) * | 2011-02-07 | 2014-04-24 | クゥアルコム・インコーポレイテッド | Device for encoding and decoding watermarked signals |
US9767823B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and detecting a watermarked signal |
JP2019032543A (en) * | 2016-01-22 | 2019-02-28 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | Apparatus and method for encoding or decoding multi-channel signal using spectral domain resampling |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08263096A (en) * | 1995-03-24 | 1996-10-11 | Nippon Telegr & Teleph Corp <Ntt> | Acoustic signal encoding method and decoding method |
JP2001521648A (en) * | 1997-06-10 | 2001-11-06 | コーディング テクノロジーズ スウェーデン アクチボラゲット | Enhanced primitive coding using spectral band duplication |
JP2001356788A (en) * | 2000-06-14 | 2001-12-26 | Kenwood Corp | Device and method for frequency interpolation and recording medium |
JP2003502704A (en) * | 1999-06-21 | 2003-01-21 | デジタル・シアター・システムズ・インコーポレーテッド | Improve sound quality in established low bit rate audio coding systems without losing decoder compatibility |
JP2003216199A (en) * | 2001-11-15 | 2003-07-30 | Matsushita Electric Ind Co Ltd | Decoder, decoding method and program distribution medium therefor |
JP2003216190A (en) * | 2001-11-14 | 2003-07-30 | Matsushita Electric Ind Co Ltd | Encoding device and decoding device |
JP2003241799A (en) * | 2002-02-15 | 2003-08-29 | Nippon Telegr & Teleph Corp <Ntt> | Sound encoding method, decoding method, encoding device, decoding device, encoding program, and decoding program |
-
2009
- 2009-09-04 JP JP2009204962A patent/JP5031006B2/en not_active Expired - Lifetime
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08263096A (en) * | 1995-03-24 | 1996-10-11 | Nippon Telegr & Teleph Corp <Ntt> | Acoustic signal encoding method and decoding method |
JP2001521648A (en) * | 1997-06-10 | 2001-11-06 | コーディング テクノロジーズ スウェーデン アクチボラゲット | Enhanced primitive coding using spectral band duplication |
JP2003502704A (en) * | 1999-06-21 | 2003-01-21 | デジタル・シアター・システムズ・インコーポレーテッド | Improve sound quality in established low bit rate audio coding systems without losing decoder compatibility |
JP2001356788A (en) * | 2000-06-14 | 2001-12-26 | Kenwood Corp | Device and method for frequency interpolation and recording medium |
JP2003216190A (en) * | 2001-11-14 | 2003-07-30 | Matsushita Electric Ind Co Ltd | Encoding device and decoding device |
JP2003216199A (en) * | 2001-11-15 | 2003-07-30 | Matsushita Electric Ind Co Ltd | Decoder, decoding method and program distribution medium therefor |
JP2003241799A (en) * | 2002-02-15 | 2003-08-29 | Nippon Telegr & Teleph Corp <Ntt> | Sound encoding method, decoding method, encoding device, decoding device, encoding program, and decoding program |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011171968A (en) * | 2010-02-18 | 2011-09-01 | Jvc Kenwood Holdings Inc | Apparatus and method for noise elimination |
JP2014510299A (en) * | 2011-02-07 | 2014-04-24 | クゥアルコム・インコーポレイテッド | Device for encoding and decoding watermarked signals |
US9767822B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and decoding a watermarked signal |
US9767823B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and detecting a watermarked signal |
JP2019032543A (en) * | 2016-01-22 | 2019-02-28 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | Apparatus and method for encoding or decoding multi-channel signal using spectral domain resampling |
US10706861B2 (en) | 2016-01-22 | 2020-07-07 | Fraunhofer-Gesellschaft Zur Foerderung Der Andgewandten Forschung E.V. | Apparatus and method for estimating an inter-channel time difference |
US10854211B2 (en) | 2016-01-22 | 2020-12-01 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatuses and methods for encoding or decoding a multi-channel signal using frame control synchronization |
US10861468B2 (en) | 2016-01-22 | 2020-12-08 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding or decoding a multi-channel signal using a broadband alignment parameter and a plurality of narrowband alignment parameters |
JP2021101253A (en) * | 2016-01-22 | 2021-07-08 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | Apparatus for and method of encoding or decoding multi-channel signal using spectral domain resampling |
US11410664B2 (en) | 2016-01-22 | 2022-08-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for estimating an inter-channel time difference |
JP7258935B2 (en) | 2016-01-22 | 2023-04-17 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | Apparatus and method for encoding or decoding multi-channel signals using spectral domain resampling |
US11887609B2 (en) | 2016-01-22 | 2024-01-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for estimating an inter-channel time difference |
Also Published As
Publication number | Publication date |
---|---|
JP5031006B2 (en) | 2012-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4679049B2 (en) | Scalable decoding device | |
JP5013863B2 (en) | Encoding apparatus, decoding apparatus, communication terminal apparatus, base station apparatus, encoding method, and decoding method | |
EP1798724B1 (en) | Encoder, decoder, encoding method, and decoding method | |
US8793126B2 (en) | Time/frequency two dimension post-processing | |
US8738372B2 (en) | Spectrum coding apparatus and decoding apparatus that respectively encodes and decodes a spectrum including a first band and a second band | |
KR101835156B1 (en) | Signal processing apparatus and method, and program | |
JP2015172706A (en) | Sound decoding device and program | |
JPWO2006134992A1 (en) | Post filter, decoding device, and post filter processing method | |
JP2000305599A (en) | Speech synthesizing device and method, telephone device, and program providing media | |
WO2009131066A1 (en) | System, device, method, and program for signal analysis control and signal control | |
WO2005027095A1 (en) | Encoder apparatus and decoder apparatus | |
KR20000069494A (en) | Method and devices for coding discrete signals or for decoding coded discrete signals | |
JP5031006B2 (en) | Scalable decoding apparatus and scalable decoding method | |
JP5668923B2 (en) | Signal analysis control system and method, signal control apparatus and method, and program | |
JP5425066B2 (en) | Quantization apparatus, encoding apparatus, and methods thereof | |
JP2005114814A (en) | Method, device, and program for speech encoding and decoding, and recording medium where same is recorded | |
KR20100024426A (en) | Signal analysis device, signal control device, its system, method, and program | |
JP3594829B2 (en) | MPEG audio decoding method | |
JP2005110018A (en) | METHOD AND SYSTEM FOR VoIP VOICE COMMUNICATION, AND ITS TRANSMITTING TERMINAL, RECEIVING TERMINAL AND PROGRAM | |
JP4024784B2 (en) | Audio decoding device | |
JPWO2009038158A1 (en) | Speech decoding apparatus, speech decoding method, program, and portable terminal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111115 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120403 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120509 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120605 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120626 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5031006 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150706 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |