JP2010020333A - Scalable coder and scalable decoder - Google Patents

Scalable coder and scalable decoder Download PDF

Info

Publication number
JP2010020333A
JP2010020333A JP2009204962A JP2009204962A JP2010020333A JP 2010020333 A JP2010020333 A JP 2010020333A JP 2009204962 A JP2009204962 A JP 2009204962A JP 2009204962 A JP2009204962 A JP 2009204962A JP 2010020333 A JP2010020333 A JP 2010020333A
Authority
JP
Japan
Prior art keywords
spectrum
signal
encoding
unit
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009204962A
Other languages
Japanese (ja)
Other versions
JP5031006B2 (en
Inventor
Masahiro Oshikiri
正浩 押切
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Priority to JP2009204962A priority Critical patent/JP5031006B2/en
Publication of JP2010020333A publication Critical patent/JP2010020333A/en
Application granted granted Critical
Publication of JP5031006B2 publication Critical patent/JP5031006B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a scalable coder and a scalable decoder capable of contracting a circuit scale and also reducing a processing operational quantity of coding. <P>SOLUTION: A frequency area conversion part 103 performs the analysis of frequency of a signal sampled at a sampling rate Fx with an analysis length 2×Na to calculate a first spectrum S1(k)(0≤k<Na). A band extension part 104 extends an effective frequency band of the first spectrum S1(k) to 0≤k<Nb to permit the impartment of new spectrum on and after the frequency k=Na of the first spectrum S1(k). An extension spectrum-imparting part 105 imparts an extension spectrum S1'(k)(Na≤k<Nb) which is inputted to an extended frequency band from an external part. A spectrum information specification part 106 outputs information required for specifying the extension spectrum S1'(k) among spectra imparted from the extension spectrum-imparting part 105 as coding codes. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は、音声信号、オーディオ信号等を符号化するスケーラブル符号化装置と、このスケーラブル符号化装置によって符号化された信号の復号を行うスケーラブル復号化装置とに関する。   The present invention relates to a scalable encoding device that encodes an audio signal, an audio signal, and the like, and a scalable decoding device that decodes a signal encoded by the scalable encoding device.

今日、世の中には、コンパクトディスク用の44.1kHz、DAT(Digital Audio Tape)、ディジタルVTR、もしくは衛星テレビジョン用の32kHzもしくは48kHz、またはDVDオーディオ信号用の48kHzもしくは96kHzというように、多くの異なるサンプリングレートが存在する。従って、再生装置もしくは記録装置のデコーダの内部サンプリングレートが、これから復号化しようとするデータのサンプリングレートと異なる場合、サンプリングレートを変換する必要が生じる。このサンプリングレートの変換を行う従来装置としては、例えば、特許文献1に示すものがある。   Today, there are many different things, such as 44.1 kHz for compact discs, 32 or 48 kHz for digital audio tape (DAT), digital VTR, or satellite television, or 48 or 96 kHz for DVD audio signals. There is a sampling rate. Therefore, when the internal sampling rate of the decoder of the playback device or recording device is different from the sampling rate of the data to be decoded, it is necessary to convert the sampling rate. An example of a conventional apparatus that performs this sampling rate conversion is disclosed in Patent Document 1.

また近年、有線系でのADSL(Asymmetric Digital Subscriber Line)や光ファイバの普及、または無線系でのW−CDMA(Wideband - Code Division Multiple Access)や無線LANの実用化等により、ネットワークにおける伝送路容量が大きく改善され、それに伴い音声通信において信号帯域を広げることによる高臨場感化および高品質化が求められてきている。   Also, in recent years, transmission line capacity in networks has been increasing due to the widespread use of ADSL (Asymmetric Digital Subscriber Line) and optical fiber in wired systems, or practical application of W-CDMA (Wideband-Code Division Multiple Access) and wireless LANs in wireless systems. Accordingly, there has been a demand for higher realism and higher quality by expanding the signal band in voice communication.

現在、狭帯域信号を符号化する代表的な方式に、ITU(International Telecommunication Union)で規格化されているG.726、G.729等がある。また、広帯域信号を符号化する代表的な方法として、ITU−T(International Telecommunication Union Telecommunication Standardization Sector)のG722、G722.1や、3GPP(The 3rd Generation Partnership Project)のAMR−WB等がある。   Currently, G. standardized by ITU (International Telecommunication Union) is a typical method for encoding narrowband signals. 726, G.G. 729 etc. Moreover, as a typical method for encoding a wideband signal, there are G722 and G722.1 of ITU-T (International Telecommunication Union Telecommunication Standardization Sector), AMR-WB of 3GPP (The 3rd Generation Partnership Project), and the like.

さらに最近、IP(Internet Protocol)ネットワーク等の様々なネットワーク環境で使用されることを意図して、音声符号化方式にスケーラブル機能の実現が求められている。スケーラブル機能とは、符号化コードの一部からでも、音声信号を復号できる機能を表す。このスケーラブル機能を有することにより、条件の良い通信路では全ての符号化コードを用いて高品質な音声信号を復号し、条件の悪い通信路では符号化コードの一部のみ伝送することでパケットロスの発生の頻度を抑えることができる。また、多地点間での通信時におけるネットワーク資源の効率化等の効果が得られるようになる。   In recent years, there has been a demand for the implementation of a scalable function in a speech coding system intended to be used in various network environments such as an IP (Internet Protocol) network. The scalable function represents a function capable of decoding an audio signal even from a part of an encoded code. By having this scalable function, packet loss can be achieved by decoding high-quality audio signals using all coded codes in a good channel and transmitting only a part of the coded code in a bad channel. The frequency of occurrence can be suppressed. In addition, it is possible to obtain an effect such as efficiency of network resources at the time of communication between multiple points.

このスケーラブル機能を有する高品質な符号化方式の実現には、様々なサンプリングレートの信号を利用して符号化を行う必要性がある。例えば、サンプリングレートが8kHzの信号をITU−Tで規格化されているG.726、G.729等の方式を用いて符号化を行い、サンプリングレートが16kHzの領域でその誤差信号をさらに符号化することで、信号帯域の拡張による品質の改善およびスケーラブル性が実現できる。   In order to realize a high-quality encoding method having a scalable function, it is necessary to perform encoding using signals of various sampling rates. For example, a signal with a sampling rate of 8 kHz is standardized by ITU-T. 726, G.G. By performing encoding using a method such as 729 and further encoding the error signal in a region where the sampling rate is 16 kHz, quality improvement and scalability can be realized by extending the signal band.

図22は、スケーラブル符号化を行う従来の符号化装置の代表的な構成を示したブロック図である。この例では、レイヤ数N=3であり、レイヤnで取り扱う信号のサンプリングレートをFS(n)と表し、FS(1)=16[kHz]、FS(2)=24[kHz]、FS(3)=32[kHz]であるとする。   FIG. 22 is a block diagram showing a typical configuration of a conventional coding apparatus that performs scalable coding. In this example, the number of layers N = 3, the sampling rate of the signal handled in layer n is represented as FS (n), FS (1) = 16 [kHz], FS (2) = 24 [kHz], FS ( 3) Assume that 32 [kHz].

入力端子11を介してダウンサンプリング部12に入力された音響信号(音声信号、オーディオ信号等)は、サンプリング周波数が32kHzから16kHzへとダウンサンプリングされ、第1レイヤ符号化部13に与えられる。第1レイヤ符号化部13は、入力された音響信号と符号化後に生成される復号信号との間の聴感的な歪が最小となるように第1符号化コードを決定する。この第1符号化コードは多重化部26に送られるとともに第1レイヤ復号化部14に送られる。第1レイヤ復号化部14は、第1符号化コードを用いて第1レイヤ復号信号を生成する。アップサンプリング部15は、第1レイヤ復号信号のサンプリング周波数を16kHzから24kHzへアップサンプリングし、この信号を減算器18および加算器21に与える。   The acoustic signal (sound signal, audio signal, etc.) input to the downsampling unit 12 via the input terminal 11 is downsampled from 32 kHz to 16 kHz and supplied to the first layer encoding unit 13. The first layer encoding unit 13 determines the first encoded code so that audible distortion between the input acoustic signal and the decoded signal generated after encoding is minimized. The first encoded code is sent to the multiplexing unit 26 and also sent to the first layer decoding unit 14. The first layer decoding unit 14 generates a first layer decoded signal using the first encoded code. The upsampling unit 15 upsamples the sampling frequency of the first layer decoded signal from 16 kHz to 24 kHz, and supplies this signal to the subtracter 18 and the adder 21.

また、入力端子11を介してダウンサンプリング部16に入力された音響信号は、サンプリング周波数が32kHzから24kHzへとダウンサンプリングされ、遅延部17に与えられる。遅延部17は、ダウンサンプリング後の信号を所定の時間長だけ遅延させる。減算器18は、遅延部17の出力信号とアップサンプリング部15の出力信号との差を求め、第2レイヤ残差信号を生成し、第2レイヤ符号化部19に与えられる。第2レイヤ符号化部19は、第2レイヤ残差信号を聴感的に品質改善が成されるように符号化を行い、第2符号化コードを決定し、この第2符号化コードを多重化部26および第2レイヤ復号化部20に与える。第2レイヤ復号化部20は、第2符号化コードを用いて復号処理を行い、第2レイヤ復号残差信号を生成する。加算器21は、前述の第1レイヤ復号信号と第2レイヤ復号残差信号との和をとり、第2レイヤ復号信号を生成する。アップサンプリング部22は、第2レイヤ復号信号のサンプリング周波数を24kHzから32kHzへアップサンプリングし、この信号を減算器24に与える。   The acoustic signal input to the down-sampling unit 16 via the input terminal 11 is down-sampled from 32 kHz to 24 kHz and supplied to the delay unit 17. The delay unit 17 delays the downsampled signal by a predetermined time length. The subtractor 18 obtains a difference between the output signal of the delay unit 17 and the output signal of the upsampling unit 15, generates a second layer residual signal, and provides the second layer encoding unit 19. The second layer encoding unit 19 encodes the second layer residual signal so that the quality improvement is made audibly, determines a second encoded code, and multiplexes the second encoded code To the unit 26 and the second layer decoding unit 20. Second layer decoding section 20 performs a decoding process using the second encoded code, and generates a second layer decoded residual signal. The adder 21 calculates the sum of the first layer decoded signal and the second layer decoded residual signal, and generates a second layer decoded signal. The upsampling unit 22 upsamples the sampling frequency of the second layer decoded signal from 24 kHz to 32 kHz, and supplies this signal to the subtractor 24.

さらに、入力端子11を介して遅延部23に入力された音響信号は、所定の時間長だけ遅延され、減算器24に与えられる。減算器24は、遅延部23の出力信号とアップサンプリング部22の出力信号との差をとり、第3レイヤ残差信号を生成する。この第3レイヤ残差信号が第3レイヤ符号化部25に与えられる。第3レイヤ符号化部25は、第3レイヤ残差信号を聴感的に品質改善が成されるように符号化を行い、第3符号化コードを決定し、多重化部26にその符号化コードを与える。多重化部26は、第1レイヤ符号化部13、第2レイヤ符号化部19、および第3レイヤ符号化部25から得られた符号化コードを多重化し、出力端子27を介し出力する。   Further, the acoustic signal input to the delay unit 23 via the input terminal 11 is delayed by a predetermined time length and is given to the subtractor 24. The subtractor 24 takes the difference between the output signal of the delay unit 23 and the output signal of the upsampling unit 22 and generates a third layer residual signal. This third layer residual signal is provided to the third layer encoding unit 25. The third layer encoding unit 25 encodes the third layer residual signal so that quality improvement is made audibly, determines a third encoded code, and sends the encoded code to the multiplexing unit 26. give. The multiplexing unit 26 multiplexes the encoded codes obtained from the first layer encoding unit 13, the second layer encoding unit 19, and the third layer encoding unit 25 and outputs the multiplexed code via the output terminal 27.

特開2000−68948号公報JP 2000-68948 A

しかしながら、上記のようにG.726やG.729、またはAMR−WBのような時間領域の符号化方式に基づいてスケーラブル機能を実現する従来の符号化装置においては、種々の信号のサンプリングレートを変換する必要があり(上記の例では、ダウンサンプリング部12、アップサンプリング部15、ダウンサンプリング部16、およびアップサンプリング部22が必要)、符号化装置の構成が複雑になり、符号化の処理演算量も増大するという問題がある。また、この符号化装置によって符号化された信号を復号する復号化装置の回路構成も複雑になり、復号化の処理演算量が増大する。   However, as described above, G.M. 726 and G.G. In the conventional coding apparatus that realizes the scalable function based on the time domain coding scheme such as 729 or AMR-WB, it is necessary to convert the sampling rate of various signals (in the above example, downsampling is performed). The sampling unit 12, the upsampling unit 15, the downsampling unit 16, and the upsampling unit 22 are required), and the configuration of the encoding device becomes complicated, and there is a problem that the amount of processing computation for encoding increases. In addition, the circuit configuration of the decoding device that decodes the signal encoded by the encoding device becomes complicated, and the amount of processing for decoding increases.

本発明は、かかる点に鑑みてなされたものであり、回路規模を縮小でき、処理演算量も削減できるスケーラブル符号化装置およびスケーラブル復号化装置を提供することを目的とする。   The present invention has been made in view of this point, and an object of the present invention is to provide a scalable encoding device and a scalable decoding device that can reduce the circuit scale and the amount of processing computation.

本発明の第1の態様に係るサンプリングレート変換装置は、入力された時間領域信号を周波数領域変換して第1スペクトルを得る変換手段と、得られた第1スペクトルの周波数帯域を拡張する拡張手段と、拡張後の第1スペクトルの拡張された周波数帯域に第2スペクトルを挿入する挿入手段と、を具備する構成を採る。   The sampling rate conversion device according to the first aspect of the present invention includes a conversion unit that obtains a first spectrum by performing frequency domain conversion on an input time domain signal, and an expansion unit that extends a frequency band of the obtained first spectrum. And an insertion means for inserting the second spectrum into the expanded frequency band of the expanded first spectrum.

この構成によれば、入力された時間領域の信号を周波数領域の信号に変換し、得られたスペクトルの周波数帯域を拡張することにより、時間領域においてアップサンプリングした信号と等価な信号を得ることができる。   According to this configuration, an input time-domain signal is converted into a frequency-domain signal, and a signal equivalent to an up-sampled signal in the time domain can be obtained by extending the frequency band of the obtained spectrum. it can.

本発明の第2の態様に係る符号化装置は、第1および第2の時間領域信号を取得する取得手段と、取得された第1および第2の時間領域信号をそれぞれ周波数領域変換して第1および第2のスペクトルを得る変換手段と、前記第1スペクトルの周波数帯域を前記第2スペクトルの周波数帯域に応じて拡張する拡張手段と、前記第1スペクトルの拡張された周波数帯域に前記第2スペクトルを挿入する挿入手段と、前記挿入手段によって得られたスペクトルを符号化する符号化手段と、を具備する構成を採る。   An encoding apparatus according to a second aspect of the present invention includes an acquisition means for acquiring first and second time domain signals, and frequency domain transforms of the acquired first and second time domain signals, respectively. Conversion means for obtaining first and second spectra; expansion means for extending the frequency band of the first spectrum in accordance with the frequency band of the second spectrum; and the second spectrum in the expanded frequency band of the first spectrum. A configuration is provided that includes an inserting unit that inserts a spectrum and an encoding unit that encodes the spectrum obtained by the inserting unit.

この構成によれば、符号化装置の回路規模を縮小でき、符号化の処理演算量も削減することができる。   According to this configuration, the circuit scale of the encoding device can be reduced, and the amount of processing for encoding can be reduced.

本発明の第3の態様に係る符号化装置は、入力されたサンプリング周波数がFxの信号を分析長2・Naで周波数分析してNa点の第1スペクトルを得る変換手段と、得られた第1スペクトルの周波数帯域をNb点に拡張する拡張手段と、拡張後の第1スペクトルの拡張された周波数帯域に挿入される第2スペクトルを特定し、この第2スペクトルを表す符号化コードを出力する符号化手段と、を具備する構成を採る。   The encoding apparatus according to the third aspect of the present invention includes a conversion means that obtains a first spectrum at the Na point by performing frequency analysis of an input signal having a sampling frequency of Fx with an analysis length of 2 · Na, An extension means for extending the frequency band of one spectrum to the Nb point, a second spectrum to be inserted into the expanded frequency band of the first spectrum after extension, are specified, and an encoded code representing the second spectrum is output. And a coding means.

この構成によれば、時間領域でのサンプリング変換をせずに、サンプリングレートFS=Fx・Nb/Naのスペクトルを得ることができる。   According to this configuration, it is possible to obtain a spectrum of the sampling rate FS = Fx · Nb / Na without performing sampling conversion in the time domain.

本発明の第4の態様に係る符号化装置は、上記の構成において、前記第2スペクトルは、前記第1スペクトルに基づいて生成される構成を採る。   The encoding device according to a fourth aspect of the present invention employs a configuration in which, in the above configuration, the second spectrum is generated based on the first spectrum.

この構成によれば、デコーダで得られる情報を基に拡張スペクトルを生成することができるため、低ビットレート化が可能になる。   According to this configuration, since an extended spectrum can be generated based on information obtained by the decoder, a low bit rate can be achieved.

本発明の第5の態様に係る符号化装置は、上記の構成において、前記第2スペクトルは、サンプリング周波数がFyの入力信号を2・Nb点で周波数分析して求められるスペクトルの内、Na≦k<Nbの周波数帯域に含まれるスペクトルと類似するように決定される構成を採る。   In the encoding device according to a fifth aspect of the present invention, in the configuration described above, the second spectrum includes Na ≦ of a spectrum obtained by frequency analysis of an input signal having a sampling frequency Fy at 2 · Nb points. A configuration that is determined to be similar to a spectrum included in the frequency band of k <Nb is adopted.

この構成によれば、拡張スペクトルを原信号のスペクトルを基準に決定することができるため、より精度の高い拡張スペクトルを求めることができる。   According to this configuration, since the extended spectrum can be determined based on the spectrum of the original signal, an extended spectrum with higher accuracy can be obtained.

本発明の第6の態様に係る符号化装置は、上記の構成において、前記符号化手段は、Na≦k<Nbの周波数帯域を2つ以上のサブバンドに分割し、それぞれのサブバンド毎に前記第2スペクトルを表す符号化コードを出力する構成を採る。   In the encoding device according to a sixth aspect of the present invention, in the above configuration, the encoding unit divides a frequency band of Na ≦ k <Nb into two or more subbands, and each subband A configuration is adopted in which an encoded code representing the second spectrum is output.

この構成によれば、スケーラブル機能を有する符号化コードを生成できるという効果が得られる。   According to this configuration, it is possible to generate an encoded code having a scalable function.

本発明の第7の態様に係る符号化装置は、上記の構成において、前記サンプリング周波数がFxの信号は、階層符号化における下位レイヤで復号化された信号である構成を採る。   The encoding apparatus according to a seventh aspect of the present invention employs a configuration in which, in the above configuration, the signal having the sampling frequency Fx is a signal decoded in a lower layer in hierarchical encoding.

この構成によれば、複数レイヤの符号化部より構成される階層符号化に本発明を適用することができ、最小限のサンプリング変換のみで階層符号化を実現できる。   According to this configuration, the present invention can be applied to hierarchical encoding composed of a plurality of layers of encoding units, and hierarchical encoding can be realized with minimal sampling conversion.

本発明の第8の態様に係る復号化装置は、サンプリング周波数がFxの信号を分析長2・Naで周波数分析して0≦k<Naの周波数帯域の第1のスペクトルを取得する取得手段と、符号化コードを受信し、Na≦k<Nbの周波数帯域の第2のスペクトルを復号する復号化手段と、前記第1および第2のスペクトルを結合して0≦k<Nbの周波数帯域のスペクトルを生成する生成手段と、0≦k<Nbの周波数帯域に含まれるスペクトルを時間領域の信号に変換する変換手段と、を具備する構成を採る。   The decoding apparatus according to the eighth aspect of the present invention comprises: acquisition means for acquiring a first spectrum in a frequency band of 0 ≦ k <Na by performing frequency analysis of a signal having a sampling frequency of Fx with an analysis length of 2 · Na. A decoding means for receiving the encoded code and decoding the second spectrum in the frequency band of Na ≦ k <Nb, and combining the first and second spectrums in the frequency band of 0 ≦ k <Nb A configuration is provided that includes generation means for generating a spectrum and conversion means for converting a spectrum included in a frequency band of 0 ≦ k <Nb into a signal in the time domain.

この構成によれば、上記いずれかに記載の符号化装置により生成された符号化コードを復号することができる。   According to this configuration, it is possible to decode the encoded code generated by any of the encoding apparatuses described above.

本発明の第9の態様に係る復号化装置は、上記の構成において、前記第2のスペクトルは、0≦k<Naの周波数帯域のスペクトルに基づいて生成される構成を採る。   The decoding device according to a ninth aspect of the present invention employs a configuration in which, in the above configuration, the second spectrum is generated based on a spectrum in a frequency band of 0 ≦ k <Na.

この構成によれば、デコーダで得られる情報を基に拡張スペクトルを生成する符号化方法による符号化コードを復号することができるため、低ビットレート化が可能になる。   According to this configuration, it is possible to decode the encoded code by the encoding method for generating the extended spectrum based on the information obtained by the decoder, so that the bit rate can be reduced.

本発明の第10の態様に係る復号化装置は、上記の構成において、前記生成手段によって得られた結合後のスペクトルの周波数帯域の幅が、予め定められた幅と一致するように前記結合後のスペクトルの高域部に規定値を挿入するか若しくは前記結合後のスペクトルの高域部を廃棄する手段、をさらに具備する構成を採る。   In the decoding device according to the tenth aspect of the present invention, in the above configuration, the combined frequency band of the combined spectrum obtained by the generating unit is combined with the predetermined width so as to match a predetermined width. And a means for inserting a specified value into the high band part of the spectrum or discarding the high band part of the combined spectrum.

この構成によれば、ネットワークの状況等の要因によって受信されるスペクトルの帯域幅が変動する場合でもスペクトルの帯域幅が一定になるよう処理を加えた後に復号信号を生成するために所望のサンプリングレートの復号信号を安定して生成することができる。   According to this configuration, even when the bandwidth of the received spectrum fluctuates due to factors such as network conditions, a desired sampling rate is generated in order to generate a decoded signal after processing is performed so that the spectrum bandwidth is constant. Can be stably generated.

本発明の第11の態様に係る復号化装置は、上記の構成において、前記サンプリング周波数がFxの信号は、階層符号化における下位レイヤで復号化された信号である構成を採る。   A decoding device according to an eleventh aspect of the present invention employs a configuration in which, in the above configuration, the signal having the sampling frequency Fx is a signal decoded in a lower layer in hierarchical encoding.

この構成によれば、複数レイヤの符号化部より構成される階層符号化により求められた符号化コードを復号することができる。   According to this configuration, it is possible to decode an encoded code obtained by hierarchical encoding composed of a plurality of layers of encoding units.

本発明の第12の態様に係る送受信装置は、上記いずれかに記載の符号化装置または復号化装置を具備する構成を採る。   A transmission / reception device according to a twelfth aspect of the present invention employs a configuration including any of the above-described encoding device or decoding device.

この構成によれば、上記と同様の作用効果を有する送受信装置を提供することができる。   According to this configuration, it is possible to provide a transmission / reception device having the same function and effect as described above.

本発明の第13の態様に係るサンプリングレート変換方法は、入力された時間領域信号を周波数領域変換して第1スペクトルを得る変換ステップと、得られた第1スペクトルの周波数帯域を拡張する拡張ステップと、拡張後の第1スペクトルの拡張された周波数帯域に第2スペクトルを挿入する挿入ステップと、を具備するようにした。   The sampling rate conversion method according to the thirteenth aspect of the present invention includes a conversion step of obtaining a first spectrum by frequency domain conversion of an input time domain signal, and an expansion step of extending the frequency band of the obtained first spectrum. And an insertion step of inserting the second spectrum into the expanded frequency band of the first spectrum after expansion.

この方法によれば、入力された時間領域の信号を周波数領域の信号に変換し、得られたスペクトルの周波数帯域を拡張することにより、時間領域においてアップサンプリングした信号と等価な信号を得ることができる。   According to this method, a signal equivalent to an upsampled signal in the time domain can be obtained by converting the input time domain signal into a frequency domain signal and extending the frequency band of the obtained spectrum. it can.

本発明の第14の態様に係る符号化方法は、第1および第2の時間領域信号を取得する取得ステップと、取得された第1および第2の時間領域信号をそれぞれ周波数領域変換して第1および第2のスペクトルを得る変換ステップと、前記第1スペクトルの周波数帯域を前記第2スペクトルの周波数帯域に応じて拡張する拡張ステップと、前記第1スペクトルの拡張された周波数帯域に前記第2スペクトルを挿入する挿入ステップと、前記挿入ステップによって得られたスペクトルを符号化する符号化ステップと、を具備するようにした。   An encoding method according to a fourteenth aspect of the present invention includes an acquisition step of acquiring first and second time domain signals, and first and second frequency domain transforms of the acquired first and second time domain signals, respectively. A conversion step of obtaining first and second spectra, an expansion step of extending a frequency band of the first spectrum in accordance with a frequency band of the second spectrum, and the second frequency band into the expanded frequency band of the first spectrum. An insertion step for inserting a spectrum and an encoding step for encoding the spectrum obtained by the insertion step are provided.

この方法によれば、符号化装置の回路規模を縮小でき、符号化の処理演算量も削減することができる。   According to this method, the circuit scale of the encoding device can be reduced, and the amount of processing for encoding can be reduced.

本発明の第15の態様に係る符号化方法は、入力されたサンプリング周波数がFxの信号を分析長2・Naで周波数分析してNa点の第1スペクトルを得る変換ステップと、得られた第1スペクトルの周波数帯域をNb点に拡張する拡張ステップと、拡張後の第1スペクトルの拡張された周波数帯域に挿入される第2スペクトルを特定し、この第2スペクトルを表す符号化コードを出力する符号化ステップと、を具備するようにした。   The encoding method according to the fifteenth aspect of the present invention includes a conversion step of obtaining a first spectrum of Na point by performing frequency analysis of an input signal having a sampling frequency of Fx with an analysis length of 2 · Na, and the obtained first step. An expansion step for extending the frequency band of one spectrum to the Nb point, a second spectrum to be inserted into the expanded frequency band of the expanded first spectrum, are specified, and an encoded code representing the second spectrum is output. And an encoding step.

この方法によれば、時間領域でのサンプリング変換をせずに、サンプリングレートFS=Fx・Nb/Naのスペクトルを得ることができる。   According to this method, it is possible to obtain a spectrum of the sampling rate FS = Fx · Nb / Na without performing sampling conversion in the time domain.

本発明の第16の態様に係る復号化方法は、サンプリング周波数がFxの信号を分析長2・Naで周波数分析して0≦k<Naの周波数帯域の第1のスペクトルを取得する取得ステップと、符号化コードを受信し、Na≦k<Nbの周波数帯域の第2のスペクトルを復号する復号化ステップと、前記第1および第2のスペクトルを結合して0≦k<Nbの周波数帯域のスペクトルを生成する生成ステップと、0≦k<Nbの周波数帯域に含まれるスペクトルを時間領域の信号に変換する変換ステップと、を具備するようにした。   The decoding method according to the sixteenth aspect of the present invention includes an obtaining step of obtaining a first spectrum in a frequency band of 0 ≦ k <Na by performing frequency analysis of a signal having a sampling frequency of Fx with an analysis length of 2 · Na. A decoding step of receiving the encoded code and decoding a second spectrum in a frequency band of Na ≦ k <Nb, and combining the first and second spectrums in a frequency band of 0 ≦ k <Nb A generation step for generating a spectrum and a conversion step for converting a spectrum included in a frequency band of 0 ≦ k <Nb into a signal in a time domain are provided.

この方法によれば、上記いずれかに記載の符号化方法により生成された符号化コードを復号することができる。   According to this method, the encoded code generated by any one of the encoding methods described above can be decoded.

本発明によれば、回路規模を縮小でき、処理演算量も削減することができる。   According to the present invention, the circuit scale can be reduced and the amount of processing calculations can also be reduced.

実施の形態1に係るスペクトル符号化装置の主要な構成を示すブロック図FIG. 1 is a block diagram showing the main configuration of a spectrum encoding apparatus according to Embodiment 1 (a)第1スペクトルを表す図、(b)有効周波数帯域を拡張された後のスペクトルを表す図(a) The figure showing the first spectrum, (b) The figure showing the spectrum after the effective frequency band is expanded. スペクトルの有効周波数帯域を拡張する処理の効果を原理的に説明するための図Diagram for explaining in principle the effect of the process of extending the effective frequency band of the spectrum 実施の形態1に係る無線送信装置の主要な構成を示すブロック図FIG. 2 is a block diagram showing a main configuration of a radio transmission apparatus according to Embodiment 1 実施の形態1に係る符号化装置の内部構成を示すブロック図FIG. 2 is a block diagram showing an internal configuration of the encoding apparatus according to Embodiment 1 実施の形態1に係るスペクトル符号化部の内部構成を示すブロック図FIG. 2 is a block diagram showing an internal configuration of a spectrum encoding unit according to Embodiment 1 実施の形態1に係るスペクトル符号化部のバリエーションを示すブロック図FIG. 9 is a block diagram showing variations of the spectrum encoding unit according to Embodiment 1. 実施の形態1に係る無線受信装置の主要な構成を示すブロック図FIG. 2 is a block diagram showing a main configuration of a radio reception apparatus according to Embodiment 1 実施の形態1に係る復号化装置の内部構成を示すブロック図FIG. 2 is a block diagram showing an internal configuration of a decoding apparatus according to Embodiment 1 実施の形態1に係るスペクトル復号化部の内部構成を示すブロック図FIG. 3 is a block diagram showing an internal configuration of a spectrum decoding unit according to Embodiment 1 実施の形態1に係る帯域拡張部で行われる処理について説明する図The figure explaining the process performed in the band expansion part which concerns on Embodiment 1. FIG. スペクトルが実施の形態1に係る結合部および時間領域変換部における処理を経てどのように復号信号が生成されるかを示した図The figure which showed how a spectrum produced | generated through the process in the coupling | bond part and time domain conversion part which concern on Embodiment 1 (a)実施の形態1に係る符号化装置が有線通信システムに適用された場合の送信側の主要な構成を示したブロック図、(b)実施の形態1に係る復号化装置が有線通信システムに適用された場合の受信側の主要な構成を示したブロック図(a) The block diagram which showed the main structures of the transmission side when the encoding apparatus which concerns on Embodiment 1 is applied to a wired communication system, (b) The decoding apparatus which concerns on Embodiment 1 is a wired communication system Block diagram showing the main configuration of the receiving side when applied to 実施の形態2に係る復号化装置の主要な構成を示すブロック図FIG. 9 is a block diagram showing the main configuration of a decoding apparatus according to Embodiment 2. 実施の形態2に係るスペクトル復号化部の内部構成を示すブロック図FIG. 7 is a block diagram showing an internal configuration of a spectrum decoding unit according to Embodiment 2 実施の形態2に係る修正部の処理をより詳細に説明するための図The figure for demonstrating in detail the process of the correction part which concerns on Embodiment 2. FIG. 実施の形態2に係る修正部の処理をより詳細に説明するための図The figure for demonstrating in detail the process of the correction part which concerns on Embodiment 2. FIG. 実施の形態2に係るスペクトル復号化部の動作をさらに説明するための図The figure for further explaining operation | movement of the spectrum decoding part which concerns on Embodiment 2. FIG. 実施の形態2に係るスペクトル復号化部の動作をさらに説明するための図The figure for further explaining operation | movement of the spectrum decoding part which concerns on Embodiment 2. FIG. 実施の形態3に係る通信システムの主要な構成を示す図The figure which shows the main structures of the communication system which concerns on Embodiment 3. 実施の形態4に係る通信システムの主要な構成を示す図The figure which shows the main structures of the communication system which concerns on Embodiment 4. スケーラブル符号化を行う従来の符号化装置の代表的な構成を示したブロック図The block diagram which showed the typical structure of the conventional encoding apparatus which performs scalable encoding

本発明の骨子は、入力信号に対し、時間領域でサンプリング変換(特に、アップサンプリング)を行う代わりに、周波数領域でスペクトルの有効周波数帯域を拡張することにより、時間領域の信号においてアップサンプリングを行った場合と等価な信号を得ることである。   The essence of the present invention is that upsampling is performed on the time domain signal by extending the effective frequency band of the spectrum in the frequency domain instead of performing sampling conversion (particularly upsampling) on the input signal. It is to obtain a signal equivalent to the case.

以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.

(実施の形態1)
図1は、本発明の実施の形態1に係るスペクトル符号化装置100の主要な構成を示すブロック図である。
(Embodiment 1)
FIG. 1 is a block diagram showing the main configuration of spectrum coding apparatus 100 according to Embodiment 1 of the present invention.

本実施の形態に係るスペクトル符号化装置100は、サンプリングレート変換部101、入力端子102、スペクトル情報特定部106、および出力端子107を有する。また、サンプリングレート変換部101は、周波数領域変換部103、帯域拡張部104、および拡張スペクトル付与部105を有する。   Spectrum coding apparatus 100 according to the present embodiment has sampling rate conversion section 101, input terminal 102, spectrum information specifying section 106, and output terminal 107. In addition, the sampling rate conversion unit 101 includes a frequency domain conversion unit 103, a band extension unit 104, and an extended spectrum addition unit 105.

スペクトル符号化装置100には、入力端子102を介し、サンプリングレートFxでサンプリングされた信号が入力される。   A signal sampled at the sampling rate Fx is input to the spectrum encoding device 100 via the input terminal 102.

周波数領域変換部103は、この信号を分析長2・Naで周波数分析することにより時間領域の信号を周波数領域の信号に変換(周波数領域変換)し、第1スペクトルS1(k)(0≦k<Na)を算出する。そして、求められた第1スペクトルS1(k)を帯域拡張部104に与える。ここで、周波数分析は、修正離散コサイン変換(MDCT)を用いる。MDCTは、前後の隣接フレームと分析フレームを半分ずつ重ね合わせて分析を行い、分析フレームの前半部は奇関数、後半部は偶関数となる直交基底を使うことにより、フレーム間の歪がキャンセルされるという特徴がある。なお、周波数分析の方法として、離散フーリエ変換(DFT)、離散コサイン変換(DCT)等を使用することも可能である。   The frequency domain transform unit 103 performs frequency analysis of this signal with an analysis length of 2 · Na to transform a time domain signal into a frequency domain signal (frequency domain transformation), and the first spectrum S1 (k) (0 ≦ k). <Na) is calculated. Then, the obtained first spectrum S <b> 1 (k) is given to the band extending unit 104. Here, the frequency analysis uses a modified discrete cosine transform (MDCT). In MDCT, analysis is performed by superimposing adjacent frames in front and back and analysis frames, and the distortion between frames is canceled by using an orthogonal basis in which the first half of the analysis frame is an odd function and the second half is an even function. There is a feature that. As a frequency analysis method, discrete Fourier transform (DFT), discrete cosine transform (DCT), or the like can be used.

帯域拡張部104は、入力された第1スペクトルS1(k)の周波数k=Na以降に新たなスペクトルを付与できるように新たな領域(周波数帯域)を確保し、第1スペクトルS1(k)の有効周波数帯域を0≦k<Nbに拡張する。この有効周波数帯域を拡張する処理については後ほど詳述する。   The band extension unit 104 secures a new region (frequency band) so that a new spectrum can be assigned after the frequency k = Na of the input first spectrum S1 (k), and the first spectrum S1 (k) The effective frequency band is extended to 0 ≦ k <Nb. The process of extending the effective frequency band will be described in detail later.

拡張スペクトル付与部105は、帯域拡張部104にて拡張された周波数帯域に外部から入力される拡張スペクトルS1’(k)(Na≦k<Nb)を付与し、スペクトル情報特定部106に出力する。   The extended spectrum giving unit 105 gives an extended spectrum S1 ′ (k) (Na ≦ k <Nb) input from the outside to the frequency band extended by the band extending unit 104, and outputs it to the spectrum information specifying unit 106. .

スペクトル情報特定部106は、拡張スペクトル付与部105から与えられたスペクトルのうち、拡張スペクトルS1’(k)を特定するために必要な情報を符号化コードとして出力端子107を介し出力する。この符号化コードは、拡張スペクトルS1’(k)のサブバンドエネルギーを表す情報や有効周波数帯域を表す情報等である。この詳細についても後述する。   The spectrum information specifying unit 106 outputs information necessary for specifying the extended spectrum S <b> 1 ′ (k) out of the spectrum given from the extended spectrum giving unit 105 as an encoded code via the output terminal 107. This encoded code is information representing the subband energy of the extended spectrum S1 '(k), information representing the effective frequency band, and the like. Details of this will also be described later.

次いで、上記の帯域拡張部104が第1スペクトルS1(k)の有効周波数帯域を拡張する処理の詳細について、図2を用いて説明する。   Next, details of the process in which the band extending unit 104 extends the effective frequency band of the first spectrum S1 (k) will be described with reference to FIG.

図2(a)は、周波数領域変換部103より与えられる第1スペクトルS1(k)を表しており、図2(b)は、帯域拡張部104において有効周波数帯域を拡張された後のスペクトルS1(k)を表している。帯域拡張部104は、第1スペクトルS1(k)の周波数kがNa≦k<Nbの範囲で表される周波数帯域に新規のスペクトル情報を格納できる領域を確保する。この新規な領域の大きさはNb−Naで表される。   2A shows the first spectrum S1 (k) given from the frequency domain transform unit 103, and FIG. 2B shows the spectrum S1 after the effective frequency band is extended by the band extension unit 104. (k) is shown. The band extension unit 104 secures an area where new spectrum information can be stored in a frequency band in which the frequency k of the first spectrum S1 (k) is represented by a range of Na ≦ k <Nb. The size of this new region is represented by Nb-Na.

ここでNbは、入力端子102を介し外部から与えられる信号のサンプリングレートFxと周波数領域変換部103の分析長2・Naと復号化部(図示せず)にて復号される信号のサンプリングレートFyとの関係から決まる。具体的には、次式

Figure 2010020333
により、Nbは設定される。また、Nbが決まっているときに、復号化部で復号される信号のサンプリングレートFyは次式
Figure 2010020333
により決定される。例えば、Na=128、Fx=16kHzの条件で符号化部を設計し、復号化部でFy=32kHzの復号信号を生成する場合には、Nb=128・32/16=256とする必要がある。よって、この場合には、128≦k<256の領域を確保することになる。また、別の例としては、Na=128、Nb=384、Fx=8kHzの条件で符号化部を設計した場合には、復号化部で生成される復号信号のサンプリングレートは、Fy=8・384/128=24kHzとなる。 Here, Nb is the sampling rate Fx of the signal given from the outside via the input terminal 102, the analysis length 2 · Na of the frequency domain conversion unit 103, and the sampling rate Fy of the signal decoded by the decoding unit (not shown). Determined from the relationship. Specifically, the following formula
Figure 2010020333
Thus, Nb is set. Also, when Nb is determined, the sampling rate Fy of the signal decoded by the decoding unit is
Figure 2010020333
Determined by. For example, when the encoding unit is designed under the conditions of Na = 128 and Fx = 16 kHz, and the decoding unit generates a decoded signal of Fy = 32 kHz, it is necessary to set Nb = 128 · 32/16 = 256. . Therefore, in this case, an area of 128 ≦ k <256 is secured. As another example, when the encoding unit is designed under the conditions of Na = 128, Nb = 384, and Fx = 8 kHz, the sampling rate of the decoded signal generated by the decoding unit is Fy = 8 · 384/128 = 24 kHz.

図3は、帯域拡張部104において行われたスペクトルの有効周波数帯域を拡張する処理の効果を原理的に説明するための図である。図3(a)は、サンプリングレートFxの信号を分析長2・Naで周波数分析した際に得られるスペクトルSa(k)を表している。横軸は周波数、縦軸はスペクトル強度を表す。   FIG. 3 is a diagram for explaining in principle the effect of the process of extending the effective frequency band of the spectrum performed in the band extending unit 104. FIG. 3A shows a spectrum Sa (k) obtained when frequency analysis is performed on the signal of the sampling rate Fx with the analysis length 2 · Na. The horizontal axis represents frequency and the vertical axis represents spectrum intensity.

信号の有効周波数帯域は、ナイキスト定理から0〜Fx/2となる。このとき、分析長が2・Naであるので、周波数インデックスkの範囲は0≦k<Naとなり、スペクトルSa(k)の周波数解像度はFx/(2・Na)となる。他方、同一信号をサンプリングレートFyへとアップサンプリングした後に、分析長2・Nbで周波数分析して得られるスペクトルSb(k)を図3(b)に示すと、信号の有効周波数帯域は0〜Fy/2まで拡張されており、周波数インデックスkの範囲は0≦k<Nbとなる。ここで、Nbが(式1)を満足する場合、スペクトルSb(k)の周波数解像度Fy/(2・Nb)は、Fx/(2・Na)と等しくなる。すなわち、帯域0≦k<NaのスペクトルSa(k)とスペクトルSb(k)とは等しくなる。逆の見方をすると、スペクトルSa(k)(0≦k<Na)の帯域をNbまで広げたときのスペクトルSb(k)は、サンプリングFxの信号をサンプリングFyにアップサンプリングした後に、分析長2・Nbで周波数分析して得られるスペクトルと一致する、ことを意味する。この原理を利用することにより、時間領域においてアップサンプリングすることなく、アップサンプリングされた信号と等価のスペクトルを得ることができる。   The effective frequency band of the signal is 0 to Fx / 2 from the Nyquist theorem. At this time, since the analysis length is 2 · Na, the range of the frequency index k is 0 ≦ k <Na, and the frequency resolution of the spectrum Sa (k) is Fx / (2 · Na). On the other hand, when the spectrum Sb (k) obtained by frequency analysis with the analysis length 2 · Nb after up-sampling the same signal to the sampling rate Fy is shown in FIG. The frequency index k is expanded to Fy / 2, and the range of the frequency index k is 0 ≦ k <Nb. Here, when Nb satisfies (Expression 1), the frequency resolution Fy / (2 · Nb) of the spectrum Sb (k) is equal to Fx / (2 · Na). That is, the spectrum Sa (k) and the spectrum Sb (k) in the band 0 ≦ k <Na are equal. In other words, the spectrum Sb (k) obtained when the band of the spectrum Sa (k) (0 ≦ k <Na) is expanded to Nb is obtained by upsampling the signal of the sampling Fx to the sampling Fy, It means that it matches the spectrum obtained by frequency analysis with Nb. By utilizing this principle, a spectrum equivalent to the upsampled signal can be obtained without upsampling in the time domain.

このように、サンプリングレート変換部101において、入力された時間領域の信号を周波数領域の信号に変換し、得られたスペクトルの有効周波数帯域を拡張することにより、時間領域においてアップサンプリングした信号を周波数変換して求められるスペクトルと等価なスペクトルを得ることができる。   In this way, the sampling rate conversion unit 101 converts the input time domain signal into a frequency domain signal and expands the effective frequency band of the obtained spectrum, thereby frequency-sampling the signal up-sampled in the time domain. A spectrum equivalent to the spectrum obtained by conversion can be obtained.

なお、サンプリングレート変換部101から出力される信号は周波数領域の信号であるため、時間領域の信号が必要とされる場合は、時間領域変換部を設けて時間領域への再変換を行えば良い。上記の例では、サンプリングレート変換部101はスペクトル符号化装置100内に設置されているので、時間領域の信号に戻すことなく周波数領域の信号のままスペクトル情報特定部106に入力され、符号化コードが生成される。   Since the signal output from the sampling rate conversion unit 101 is a frequency domain signal, if a time domain signal is required, a time domain conversion unit may be provided to perform reconversion to the time domain. . In the above example, since the sampling rate conversion unit 101 is installed in the spectrum encoding device 100, the signal is input to the spectrum information specifying unit 106 as the frequency domain signal without returning to the time domain signal, and the encoded code Is generated.

ここで、拡張スペクトル付与部105に入力される拡張スペクトルの選択と、スペクトル情報特定部106におけるスペクトル情報の特定の仕方とを調整することにより、スペクトル情報特定部106から出力される符号化コードの符号化率は異なってくる。すなわち、サンプリングレート変換部101内の一部の処理は符号化にも大きな影響を与えている。これは、スペクトル符号化装置100が、入力信号のサンプリングレートの変換と符号化とを同時に実現していることを意味している。   Here, by adjusting the selection of the extended spectrum input to the extended spectrum providing unit 105 and the method of specifying the spectrum information in the spectrum information specifying unit 106, the encoded code output from the spectrum information specifying unit 106 is adjusted. The coding rate is different. That is, a part of the processing in the sampling rate conversion unit 101 has a great influence on the encoding. This means that the spectrum encoding apparatus 100 simultaneously realizes conversion and encoding of the sampling rate of the input signal.

また、ここでは説明を簡単にするために、拡張スペクトル付与部105において拡張スペクトルが元のスペクトルに付与される場合を例にとって説明したが、スペクトル情報特定部106で行われる処理は、拡張スペクトルを特定するために必要な情報を符号化コードとして出力することであるため、付与されるべき拡張スペクトルが特定されていれば充分であるので、必ずしも拡張スペクトルが実際に付与されなければならないわけではない。   In addition, here, in order to simplify the explanation, the case where the extended spectrum is added to the original spectrum in the extended spectrum adding unit 105 has been described as an example. However, the processing performed in the spectrum information specifying unit 106 is performed using the extended spectrum. Since it is to output information necessary for identification as an encoded code, it is sufficient if the extended spectrum to be assigned is specified. Therefore, the extended spectrum does not necessarily have to be actually assigned. .

また、ここではサンプリングレート変換の一例としてアップサンプリングを例にとって説明したが、上記の原理はダウンサンプリングの場合にも適用できる。   In addition, although up sampling has been described as an example of sampling rate conversion here, the above principle can be applied to down sampling.

図4は、本実施の形態に係る符号化装置120が無線通信システムの送信側に搭載された場合の無線送信装置130の主要な構成を示すブロック図である。   FIG. 4 is a block diagram showing the main configuration of radio transmission apparatus 130 when encoding apparatus 120 according to the present embodiment is installed on the transmission side of the radio communication system.

この無線送信装置130は、符号化装置120、入力装置131、A/D変換装置132、RF変調装置133、およびアンテナ134を有する。   The wireless transmission device 130 includes an encoding device 120, an input device 131, an A / D conversion device 132, an RF modulation device 133, and an antenna 134.

入力装置131は、人間の耳に聞こえる音波W11を電気的信号であるアナログ信号に変換し、A/D変換装置132に出力する。A/D変換装置132は、このアナログ信号をディジタル信号に変換し、符号化装置120に出力する(信号S1)。符号化装置120は、入力されたディジタル信号S1を符号化して符号化信号を生成し、RF変調装置133に出力する(信号S2)。RF変調装置133は、符号化信号S2を変調して変調符号化信号を生成し、アンテナ134に出力する。アンテナ134は、変調符号化信号を電波W12として送信する。   The input device 131 converts the sound wave W11 that can be heard by the human ear into an analog signal that is an electrical signal, and outputs the analog signal to the A / D conversion device 132. The A / D converter 132 converts this analog signal into a digital signal and outputs it to the encoder 120 (signal S1). The encoding device 120 encodes the input digital signal S1 to generate an encoded signal, and outputs the encoded signal to the RF modulation device 133 (signal S2). The RF modulation device 133 modulates the encoded signal S2 to generate a modulated encoded signal, and outputs the modulated encoded signal to the antenna 134. The antenna 134 transmits the modulated encoded signal as a radio wave W12.

図5は、上記の符号化装置120の内部構成を示すブロック図である。ここでは、階層符号化(スケーラブル符号化)を行う場合を例にとって説明する。   FIG. 5 is a block diagram showing an internal configuration of the encoding apparatus 120 described above. Here, a case where hierarchical coding (scalable coding) is performed will be described as an example.

符号化装置120は、入力端子121、ダウンサンプリング部122、第1レイヤ符号化部123、第1レイヤ復号化部124、遅延部126、スペクトル符号化部100a、多重化部127、および出力端子128を有する。   The encoding apparatus 120 includes an input terminal 121, a downsampling unit 122, a first layer encoding unit 123, a first layer decoding unit 124, a delay unit 126, a spectrum encoding unit 100a, a multiplexing unit 127, and an output terminal 128. Have

入力端子121には、サンプリングレートFyの音響信号S1が入力される。ダウンサンプリング部122は、入力端子121を介し入力された信号S1にダウンサンプリングを施してサンプリングレートFxの信号を生成し、出力する。第1レイヤ符号化部123は、このダウンサンプリング後の信号を符号化し、得られた符号化コードを多重化部(マルチプレクサ)127に出力すると共に、第1レイヤ復号化部124にも出力する。第1レイヤ復号化部124は、この符号化コードを基に第1レイヤの復号信号を生成する。   An acoustic signal S1 having a sampling rate Fy is input to the input terminal 121. The downsampling unit 122 performs downsampling on the signal S1 input via the input terminal 121 to generate and output a signal at the sampling rate Fx. The first layer encoding unit 123 encodes the signal after downsampling, and outputs the obtained encoded code to the multiplexing unit (multiplexer) 127 and also to the first layer decoding unit 124. First layer decoding section 124 generates a first layer decoded signal based on the encoded code.

一方、遅延部126は、入力端子121を介し入力される信号S1に対し、所定の長さの遅延を与える。この遅延の大きさは、信号がダウンサンプリング部122、第1レイヤ符号化部123,および第1レイヤ復号化部124を介した際に生じる時間遅れと同値とする。スペクトル符号化部100aは、第1レイヤ復号化部124から出力されるサンプリングレートFxの信号S3と、遅延部126から出力されるサンプリングレートFyの信号S4とを用いてスペクトル符号化を行い、生成した符号化コードS5を多重化部127に出力する。多重化部127は、第1レイヤ符号化部123で求められる符号化コードとスペクトル符号化部100aで求められる符号化コードS5を多重化し、出力コードS2として出力端子128を介し出力する。この出力コードS2は、RF変調装置133に与えられる。   On the other hand, the delay unit 126 gives a delay of a predetermined length to the signal S <b> 1 input via the input terminal 121. The magnitude of this delay is the same as the time delay that occurs when the signal passes through the downsampling unit 122, the first layer encoding unit 123, and the first layer decoding unit 124. The spectrum encoding unit 100a performs spectrum encoding using the signal S3 of the sampling rate Fx output from the first layer decoding unit 124 and the signal S4 of the sampling rate Fy output from the delay unit 126 to generate The encoded code S5 is output to the multiplexing unit 127. The multiplexing unit 127 multiplexes the encoded code obtained by the first layer encoding unit 123 and the encoded code S5 obtained by the spectrum encoding unit 100a, and outputs the result as an output code S2 via the output terminal 128. The output code S2 is given to the RF modulation device 133.

図6は、上記のスペクトル符号化部100aの内部構成を示すブロック図である。なお、このスペクトル符号化部100aは、図1に示したスペクトル符号化装置100と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。   FIG. 6 is a block diagram showing an internal configuration of the spectrum encoding unit 100a. The spectrum encoding unit 100a has the same basic configuration as that of the spectrum encoding device 100 shown in FIG. 1, and the same components are denoted by the same reference numerals and the description thereof is omitted. .

スペクトル符号化部100aの特徴は、サンプリングレートFyの入力信号S3のスペクトルを利用して、拡張スペクトルS1’(k)(Na≦k<Nb)を付与することである。これによれば、拡張スペクトルS1’(k)を決定するための目標信号が与えられるため、拡張スペクトルS1’(k)の精度が向上し、結果として品質向上につながるという効果が得られる。   A feature of the spectrum encoding unit 100a is that an extended spectrum S1 ′ (k) (Na ≦ k <Nb) is given using the spectrum of the input signal S3 having the sampling rate Fy. According to this, since the target signal for determining the extended spectrum S1 '(k) is given, the accuracy of the extended spectrum S1' (k) is improved, and as a result, the quality can be improved.

周波数領域変換部112は、入力端子111を介し入力されたサンプリングレートFyの信号S4を分析長2・Nbにて周波数分析し、第2スペクトルS2(k)(0≦k<Nb)を求める。ここで、サンプリング周波数Fx、Fy、および分析長Na、Nbには(式1)で表される関係が成立しているものとする。   The frequency domain converter 112 performs frequency analysis on the signal S4 of the sampling rate Fy input via the input terminal 111 with an analysis length of 2 · Nb, and obtains a second spectrum S2 (k) (0 ≦ k <Nb). Here, it is assumed that the relationship represented by (Expression 1) is established between the sampling frequencies Fx and Fy and the analysis lengths Na and Nb.

スペクトル情報特定部106は、拡張スペクトルS1’(k)を表す符号化コードを決定する。ここでは、拡張スペクトルS1’(k)を周波数領域変換部112にて求められた第2スペクトルS2(k)を利用して決定する。スペクトル情報特定部106は、拡張スペクトルS1’(k)の形状を決定するステップと拡張スペクトルS1’(k)のゲインを決定するステップとの2つのステップを経て符号化コードを決定する。   The spectrum information specifying unit 106 determines an encoded code representing the extended spectrum S1 '(k). Here, the extended spectrum S1 ′ (k) is determined using the second spectrum S2 (k) obtained by the frequency domain transform unit 112. The spectrum information specifying unit 106 determines the encoding code through two steps: a step of determining the shape of the extended spectrum S1 '(k) and a step of determining the gain of the extended spectrum S1' (k).

まず、拡張スペクトルS1’(k)の形状を決定するステップについて以下説明する。   First, the step of determining the shape of the extended spectrum S1 '(k) will be described below.

このステップでは、第1スペクトルS1(k)の帯域0≦k<Naを利用して、拡張スペクトルS1’(k)を決定する。その具体的な方法として、次式

Figure 2010020333
に示すように、周波数軸上である固定値Cだけ離れた第1スペクトルS1(k)を拡張スペクトルS1’(k)にコピーする。ここでCは、あらかじめ定められた固定値であり、C≦Naの条件を満たす必要がある。この方法では、拡張スペクトルS1’(k)の形状を表すための情報は符号化コードとして出力されない。 In this step, the extended spectrum S1 ′ (k) is determined using the band 0 ≦ k <Na of the first spectrum S1 (k). The specific method is as follows:
Figure 2010020333
As shown, the first spectrum S1 (k) separated by a fixed value C on the frequency axis is copied to the extended spectrum S1 ′ (k). Here, C is a predetermined fixed value and needs to satisfy the condition of C ≦ Na. In this method, information for representing the shape of the extended spectrum S1 ′ (k) is not output as an encoded code.

また別の方法として、上記のように固定値Cではなく、ある定められた範囲TMIN〜TMAXの値をとる変数Tを用い、拡張スペクトルS1’(k)と第2スペクトルS2(k)の形状が最も類似するときの変数Tの値T’を符号化コードの一部として出力しても良い。このとき、拡張スペクトルS1’(k)は次式

Figure 2010020333
で表される。 As another method, the extended spectrum S1 ′ (k) and the second spectrum S2 (k) are used instead of the fixed value C as described above, using a variable T that takes a value in a predetermined range T MIN to T MAX. The value T ′ of the variable T when the shapes are the most similar may be output as part of the encoded code. At this time, the extended spectrum S1 ′ (k) is given by
Figure 2010020333
It is represented by

次に、スペクトル情報特定部106にて行われる拡張スペクトルS1’(k)のゲインを決定するステップについて以下説明する。   Next, the step of determining the gain of the extended spectrum S1 ′ (k) performed by the spectrum information specifying unit 106 will be described below.

拡張スペクトルS1’(k)のゲインは、第2スペクトルS2(k)の帯域Na≦k<Nbのパワと一致するように決定される。具体的には、次式

Figure 2010020333
に従い、パワの偏差Vを算出し、この値を量子化して得られるインデックスを符号化コードとして出力端子107を介し出力する。 The gain of the extended spectrum S1 ′ (k) is determined so as to coincide with the power of the band Na ≦ k <Nb of the second spectrum S2 (k). Specifically, the following formula
Figure 2010020333
Accordingly, the power deviation V is calculated, and an index obtained by quantizing this value is output as an encoded code via the output terminal 107.

また、拡張スペクトルS1’(k)を複数のサブバンドに分割し、それぞれのサブバンドについて独立に符号化コードを決定する態様でも良い。かかる場合、拡張スペクトルS1’(k)の形状を決定するステップにおいては、サブバンド毎に(式4)に表されるT’をそれぞれ決定して符号化コードとして出力しても良いし、共通のT’を一つだけ決定して符号化コードとして出力しても良い。そして、拡張スペクトルS1’(k)のゲインを決定するステップにおいては、サブバンド毎にパワの偏差V(j)を算出し、この値を量子化して得られるインデックスを符号化コードとして出力端子107を介して出力する。サブバンド毎のパワの変動量は、次式

Figure 2010020333
で表される。ここで、jはサブバンドの番号を表し、BL(j)は第jサブバンドの最小周波数に相当する周波数インデックス、BH(j)は第jサブバンドの最大周波数に相当する周波数インデックスを表す。このようにサブバンド毎に符号化コードを出力する構成にすることで、スケーラブル機能を実現することができる。 Alternatively, the extended spectrum S1 ′ (k) may be divided into a plurality of subbands, and the encoding code may be determined independently for each subband. In such a case, in the step of determining the shape of the extended spectrum S1 ′ (k), T ′ represented in (Equation 4) may be determined for each subband and output as an encoded code. Only one T ′ may be determined and output as an encoded code. Then, in the step of determining the gain of the extended spectrum S1 ′ (k), a power deviation V (j) is calculated for each subband, and an index obtained by quantizing this value is used as an encoded code. Output via. The amount of power fluctuation for each subband is
Figure 2010020333
It is represented by Here, j represents a subband number, BL (j) represents a frequency index corresponding to the minimum frequency of the jth subband, and BH (j) represents a frequency index corresponding to the maximum frequency of the jth subband. Thus, a scalable function is realizable by setting it as the structure which outputs an encoding code for every subband.

なお、図6に示したような、第2スペクトルS2(k)を算出する態様とは別に、図7に示すように、サンプリングレートFyの信号をLPC分析する態様(スペクトル符号化部100b)でも良い。すなわち、サンプリングレートFyの信号をLPC分析してLPC係数を求め、このLPC係数を用いて拡張スペクトルS1’(k)を決定することもできる。この構成では、LPC係数をDFTしてスペクトル情報に変換し、このスペクトルを用いて拡張スペクトルS1’(k)を決定することができる。   In addition to the mode for calculating the second spectrum S2 (k) as shown in FIG. 6, as shown in FIG. 7, the mode (spectrum encoding unit 100b) for LPC analysis of the signal at the sampling rate Fy is also possible. good. That is, the LPC coefficient is obtained by LPC analysis of the signal of the sampling rate Fy, and the extended spectrum S1 '(k) can be determined using the LPC coefficient. In this configuration, the LPC coefficient is DFT converted into spectral information, and the extended spectrum S1 '(k) can be determined using this spectrum.

このように、本実施の形態の符号化装置によれば、符号化装置の回路規模を縮小でき、符号化の処理演算量も削減することができる。   Thus, according to the encoding apparatus of the present embodiment, the circuit scale of the encoding apparatus can be reduced, and the processing amount of encoding processing can also be reduced.

また、上記の効果の他に、スケーラブル符号化に本実施の形態の符号化装置を適用した場合には、次のようなさらなる効果が得られる。   In addition to the above effects, when the coding apparatus according to the present embodiment is applied to scalable coding, the following further effects can be obtained.

従来のように時間領域にてサンプリングレート変換を行う場合は、エイリアシングの発生を避けるために入力信号を低域通過フィルタ(以後LPFと呼ぶ)に通す必要がある。一般に、時間領域でフィルタリング処理を行うと、入力信号に対して出力信号に時間遅れ(遅延)が生じる。LPFにFIR型フィルタを適用する場合には、カットオフ特性を急峻にするためにフィルタ次数を大きくする必要があり、演算量の大幅な増加と共にフィルタ次数の半分のサンプル値に相当する時間遅れが生じてしまう。   When sampling rate conversion is performed in the time domain as in the prior art, it is necessary to pass the input signal through a low-pass filter (hereinafter referred to as LPF) in order to avoid aliasing. In general, when filtering processing is performed in the time domain, a time delay (delay) occurs in the output signal with respect to the input signal. When an FIR type filter is applied to an LPF, it is necessary to increase the filter order in order to make the cut-off characteristic steep, and a time delay corresponding to a sample value that is half the filter order increases with a large increase in the amount of calculation. It will occur.

例えば、サンプリング周波数Fs=24kHzの信号に対して256次のフィルタを適用した場合には、サンプリングレート変換だけで5ms以上の遅延が生じる。こういった遅延の発生は、双方向音声通話へ適用した場合、通話相手の反応が遅くなったように感じてしまい問題である。   For example, when a 256th-order filter is applied to a signal having a sampling frequency Fs = 24 kHz, a delay of 5 ms or more occurs only by sampling rate conversion. The occurrence of such a delay is a problem when it is applied to a two-way voice call and it feels that the reaction of the other party has been delayed.

また、LPFにIIR型フィルタを使用した場合には、比較的次数を少なくしてもカットオフ特性を急峻にすることができ、かつFIR型フィルタほど遅延が大きくなることはない。しかし、IIR型フィルタではFIR型フィルタのように全周波数で生じる遅延量が一定となるフィルタを設計することができない。これは、スケーラブル符号化において、入力信号からサンプリングレート変換後の信号を減算するときに、サンプリングレート変換後の信号の時間遅れに合わせて入力信号に一定の遅延量を与える必要があるが、IIR型のLPFを用いた場合には周波数に対する遅延量が一定でないため、その減算処理が的確に行えないという問題が生じる。   Further, when an IIR filter is used for the LPF, the cut-off characteristic can be made steep even if the order is relatively reduced, and the delay is not increased as much as the FIR filter. However, an IIR filter cannot design a filter in which the amount of delay generated at all frequencies is constant, unlike an FIR filter. In scalable coding, when subtracting the signal after sampling rate conversion from the input signal, it is necessary to give a certain delay amount to the input signal in accordance with the time delay of the signal after sampling rate conversion. When the type LPF is used, the amount of delay with respect to the frequency is not constant, so that there is a problem that the subtraction process cannot be performed accurately.

本実施の形態の符号化装置は、スケーラブル符号化において発生するこれらの問題点を解消することができる。   The encoding apparatus according to the present embodiment can solve these problems that occur in scalable encoding.

図8は、無線送信装置130から送信された信号を受信する無線受信装置180の主要な構成を示すブロック図である。   FIG. 8 is a block diagram showing the main configuration of radio receiving apparatus 180 that receives a signal transmitted from radio transmitting apparatus 130.

この無線受信装置180は、アンテナ181、RF復調装置182、復号化装置170、D/A変換装置183、および出力装置184を有している。   The wireless reception device 180 includes an antenna 181, an RF demodulation device 182, a decoding device 170, a D / A conversion device 183, and an output device 184.

アンテナ181は、電波W12としてのディジタルの符号化音響信号を受けて電気信号のディジタルの受信符号化音響信号を生成してRF復調装置182に与える。RF復調装置182は、アンテナ181からの受信符号化音響信号を復調して復調符号化音響信号S11を生成して復号化装置170に与える。   The antenna 181 receives a digital encoded acoustic signal as the radio wave W12, generates a digital received encoded acoustic signal of an electrical signal, and provides the RF demodulator 182 with it. The RF demodulator 182 demodulates the received encoded acoustic signal from the antenna 181 to generate a demodulated encoded acoustic signal S11 and provides it to the decoding device 170.

復号化装置170は、RF復調装置182からのディジタルの復調符号化音響信号S11を受けて復号化処理を行ってディジタルの復号化音響信号S12を生成してD/A変換装置183に与える。D/A変換装置183は、復号化装置170からのディジタルの復号化音響信号S12を変換してアナログの復号化音声信号を生成して出力装置184に与える。出力装置184は、電気的信号であるアナログの復号化音声信号を空気の振動に変換して音波W13として人間の耳に聴こえるように出力する。   The decoding device 170 receives the digital demodulated encoded acoustic signal S11 from the RF demodulation device 182 and performs a decoding process to generate a digital decoded acoustic signal S12 and supplies it to the D / A conversion device 183. The D / A conversion device 183 converts the digital decoded acoustic signal S12 from the decoding device 170 to generate an analog decoded speech signal, and provides it to the output device 184. The output device 184 converts an analog decoded audio signal, which is an electrical signal, into air vibration and outputs the sound wave W13 so that it can be heard by the human ear.

図9は、上記の復号化装置170の内部構成を示すブロック図である。ここでも、階層符号化された信号を復号する場合を例にとって説明する。   FIG. 9 is a block diagram showing an internal configuration of the decoding apparatus 170 described above. Here, a case where a hierarchically encoded signal is decoded will be described as an example.

この復号化装置170は、入力端子171、分離部172、第1レイヤ復号化部173、スペクトル復号化部150、および出力端子176を有する。   The decoding apparatus 170 includes an input terminal 171, a separation unit 172, a first layer decoding unit 173, a spectrum decoding unit 150, and an output terminal 176.

入力端子171には、RF復調装置182から階層符号化されたコードS11が入力される。分離部172は、入力端子171を介し入力された復調符号化音響信号S11を分離し、第1レイヤ復号化部173用の符号化コードとスペクトル復号化部150用の符号化コードとを生成する。第1レイヤ復号化部173は、分離部172で得られた符号化コードを用いてサンプリングレートFxの復号信号を復号し、この復号信号S13をスペクトル復号化部150に与える。スペクトル復号化部150は、分離部172で分離された符号化コードS14と第1レイヤ復号化部173で生成されたサンプリングレートFxの信号S13に対し、後述するスペクトル復号化を行い、サンプリングレートFyの復号信号S12を生成し、出力端子176を介しこれを出力する。   The input terminal 171 receives the code S11 that is hierarchically encoded from the RF demodulator 182. Separating section 172 separates demodulated encoded acoustic signal S11 input via input terminal 171 and generates an encoded code for first layer decoding section 173 and an encoded code for spectrum decoding section 150. . First layer decoding section 173 decodes the decoded signal of sampling rate Fx using the encoded code obtained by separating section 172, and provides this decoded signal S13 to spectrum decoding section 150. The spectrum decoding unit 150 performs spectrum decoding, which will be described later, on the encoded code S14 separated by the separation unit 172 and the signal S13 of the sampling rate Fx generated by the first layer decoding unit 173, and performs the sampling rate Fy. The decoded signal S12 is generated and output through the output terminal 176.

図10は、上記のスペクトル復号化部150の内部構成を示すブロック図である。   FIG. 10 is a block diagram showing an internal configuration of the spectrum decoding unit 150 described above.

このスペクトル復号化部150は、入力端子152、153、周波数領域変換部154、帯域拡張部155、復号部156、結合部157、時間領域変換部158、および出力端子159を有する。   The spectrum decoding unit 150 includes input terminals 152 and 153, a frequency domain conversion unit 154, a band extension unit 155, a decoding unit 156, a combining unit 157, a time domain conversion unit 158, and an output terminal 159.

入力端子152には、サンプリングレートFxでサンプリングされた信号S13が入力される。また、入力端子153には、拡張スペクトルS1’(k)に関する符号化コードS14が入力される。   A signal S13 sampled at the sampling rate Fx is input to the input terminal 152. In addition, the input terminal 153 receives the encoded code S14 related to the extended spectrum S1 '(k).

周波数領域変換部154は、入力端子152から入力された時間領域信号S13に対し分析長2・Naで周波数分析を行い、第1スペクトルS1(k)を算出する。周波数分析法は、修正離散コサイン変換(MDCT)を用いる。MDCTは、前後の隣接フレームと分析フレームを半分ずつ重ね合わせて分析を行い、分析フレームの前半部は奇関数、後半部は偶関数となる直交基底を使うことにより、フレーム間の歪がキャンセルされるという特徴がある。このようにして求められた第1スペクトルS1(k)は、帯域拡張部155に与えられる。なお、周波数分析法としては、離散フーリエ変換(DFT)、離散コサイン変換(DCT)等を使用することも可能である。   The frequency domain transform unit 154 performs frequency analysis on the time domain signal S13 input from the input terminal 152 with the analysis length 2 · Na, and calculates the first spectrum S1 (k). The frequency analysis method uses a modified discrete cosine transform (MDCT). In MDCT, analysis is performed by superimposing adjacent frames in front and back and analysis frames, and the distortion between frames is canceled by using an orthogonal basis in which the first half of the analysis frame is an odd function and the second half is an even function. There is a feature that. The first spectrum S1 (k) obtained in this way is given to the band extending unit 155. As a frequency analysis method, it is possible to use discrete Fourier transform (DFT), discrete cosine transform (DCT), or the like.

帯域拡張部155は、入力された第1スペクトルS1(k)の周波数k=Na以降に新たにスペクトルを付与できるような領域を確保し、第1スペクトルS1(k)の帯域が0≦k<Nbとなるようにする。帯域が拡張された第1スペクトルS1(k)は、結合部157に出力される。   The band extending unit 155 secures a region where a spectrum can be newly added after the frequency k = Na of the input first spectrum S1 (k), and the band of the first spectrum S1 (k) is 0 ≦ k <. Nb is set. The first spectrum S1 (k) whose band is extended is output to the combining unit 157.

一方、復号部156は、入力端子153を介し入力された拡張スペクトルS1’(k)に関する符号化コードS14を復号して、拡張スペクトルS1’(k)を得て、結合部157に出力する。   On the other hand, the decoding unit 156 decodes the encoded code S14 related to the extended spectrum S1 ′ (k) input through the input terminal 153, obtains the extended spectrum S1 ′ (k), and outputs the extended spectrum S1 ′ (k) to the combining unit 157.

結合部157は、帯域拡張部155より与えられた第1スペクトルS1(k)と拡張スペクトルS1’(k)を結合させる。この結合は、第1スペクトルS1(k)の帯域Na≦k<Nbに拡張スペクトルS1’(k)を挿入することにより実現される。この処理により得られる第1スペクトルS1(k)は、時間領域変換部158に出力される。   The combining unit 157 combines the first spectrum S1 (k) and the extended spectrum S1 '(k) given from the band extending unit 155. This coupling is realized by inserting the extended spectrum S1 '(k) in the band Na ≦ k <Nb of the first spectrum S1 (k). The first spectrum S1 (k) obtained by this processing is output to the time domain conversion unit 158.

時間領域変換部158は、スペクトル符号化部100aで施された周波数領域変換の逆変換に相当する時間領域変換処理を施し、適切な窓関数の乗算および重ね合わせ加算を経て、時間領域の信号S12を生成する。このようにして生成された時間領域の信号S12は、復号信号として出力端子159を介して出力される。   The time domain transform unit 158 performs a time domain transform process corresponding to the inverse transform of the frequency domain transform performed by the spectrum encoding unit 100a, undergoes appropriate window function multiplication and superposition addition, and performs time domain signal S12. Is generated. The time-domain signal S12 generated in this way is output as a decoded signal via the output terminal 159.

次いで、帯域拡張部155で行われる処理について、図11を用いて説明する。   Next, processing performed by the bandwidth extension unit 155 will be described with reference to FIG.

図11(a)は、周波数領域変換部154より与えられる第1スペクトルS1(k)を表す。図11(b)は、帯域拡張部155の処理の結果得られるスペクトルを表し、周波数kがNa≦k<Nbの範囲で表される帯域に新規のスペクトル情報を格納できる領域が確保される。この新規領域の大きさはNb−Naで表される。Nbは、入力端子152から与えられる信号のサンプリングレートFxと、周波数領域変換部154の分析長2・Naと、スペクトル復号化部150にて復号される信号のサンプリングレートFyとの間の関係に依存し、次式

Figure 2010020333
に従い、Nbを設定することができる。また、Nbが決まっているときには、スペクトル復号化部150で復号される信号のサンプリングレートFyは、次式
Figure 2010020333
により決定される。例えば、入力信号のサンプリングレートがFx=16kHz、周波数領域変換部154の分析長がNa=128の条件のときに、スペクトル復号化部150でサンプリングレートがFy=32kHzの復号信号を生成する場合には、帯域拡張部155でNb=128・32/16=256とする必要がある。よって、この場合には、帯域拡張部155にて128≦k<256の領域を確保することになる。また、別の例として、入力信号のサンプリングレートがFx=8kHz、周波数領域変換部154の分析長がNa=128、帯域拡張部155の拡張量がNb=384のときに、スペクトル復号化部150で生成される復号信号のサンプリングレートはFy=8・384/128=24kHzとなる。 FIG. 11A shows the first spectrum S1 (k) given from the frequency domain transform unit 154. FIG. FIG. 11B shows a spectrum obtained as a result of the processing of the band extending unit 155, and an area where new spectrum information can be stored in a band where the frequency k is expressed in the range of Na ≦ k <Nb is secured. The size of this new area is represented by Nb-Na. Nb is a relationship between the sampling rate Fx of the signal given from the input terminal 152, the analysis length 2 · Na of the frequency domain transform unit 154, and the sampling rate Fy of the signal decoded by the spectrum decoding unit 150. Depending on
Figure 2010020333
Nb can be set according to When Nb is determined, the sampling rate Fy of the signal decoded by the spectrum decoding unit 150 is given by
Figure 2010020333
Determined by. For example, when the sampling rate of the input signal is Fx = 16 kHz and the analysis length of the frequency domain transform unit 154 is Na = 128, the spectrum decoding unit 150 generates a decoded signal with the sampling rate Fy = 32 kHz. Needs to be Nb = 128 · 32/16 = 256 in the bandwidth extension unit 155. Therefore, in this case, the bandwidth extension unit 155 secures an area of 128 ≦ k <256. As another example, when the sampling rate of the input signal is Fx = 8 kHz, the analysis length of the frequency domain transform unit 154 is Na = 128, and the extension amount of the band extension unit 155 is Nb = 384, the spectrum decoding unit 150 The sampling rate of the decoded signal generated in the above is Fy = 8 · 384/128 = 24 kHz.

図12は、スペクトルが結合部157および時間領域変換部158における処理を経てどのように復号信号が生成されるかを示した図である。   FIG. 12 is a diagram showing how a spectrum is subjected to processing in the combining unit 157 and the time domain conversion unit 158 to generate a decoded signal.

結合部157は、帯域が拡張された第1スペクトルS1(k)のNa≦k<Nbの帯域に拡張スペクトルS1’(k)(Na≦k<Nb)を挿入し、これにより得られる結合後の第1スペクトルS1(k)(0≦k<Nb)を時間領域変換部158に送る。時間領域変換部158は、時間領域の復号信号を生成し、これによりサンプリングレートFS(=Fx・Nb/Na)の復号信号を得ることができる。   The combining unit 157 inserts the extended spectrum S1 ′ (k) (Na ≦ k <Nb) into the band of Na ≦ k <Nb of the first spectrum S1 (k) whose band is extended, and the combined spectrum obtained thereby The first spectrum S1 (k) (0 ≦ k <Nb) is sent to the time domain transform unit 158. The time domain transform unit 158 generates a decoded signal in the time domain, and thereby can obtain a decoded signal having a sampling rate FS (= Fx · Nb / Na).

このように、本実施の形態の復号化装置によれば、本実施の形態に係る符号化装置によって符号化された信号を復号することができる。   Thus, according to the decoding apparatus of the present embodiment, it is possible to decode the signal encoded by the encoding apparatus according to the present embodiment.

なお、ここでは、本実施の形態に係る符号化装置または復号化装置が無線通信システムに適用される場合を例にとって説明したが、本実施の形態に係る符号化装置または復号化装置は、以下に示すように、有線通信システムにも適用することができる。   Here, the case where the encoding apparatus or decoding apparatus according to the present embodiment is applied to a wireless communication system has been described as an example, but the encoding apparatus or decoding apparatus according to the present embodiment is described below. As shown in FIG. 6, the present invention can also be applied to a wired communication system.

図13(a)は、本実施の形態に係る符号化装置が有線通信システムに適用された場合の送信側の主要な構成を示したブロック図である。なお、図4に示した構成要素と同一のものには同一の符号を付し、その説明を省略する。   FIG. 13A is a block diagram showing a main configuration on the transmission side when the coding apparatus according to the present embodiment is applied to a wired communication system. The same components as those shown in FIG. 4 are denoted by the same reference numerals, and the description thereof is omitted.

有線送信装置140は、符号化装置120、入力装置131、およびA/D変換装置132を有し、出力がネットワークN1に接続されている。   The wired transmission device 140 includes an encoding device 120, an input device 131, and an A / D conversion device 132, and an output is connected to the network N1.

A/D変換装置132の入力端子は、入力装置131の出力端子に接続されている。符号化装置120の入力端子は、A/D変換装置132の出力端子に接続されている。符号化装置120の出力端子はネットワークN1に接続されている。   The input terminal of the A / D conversion device 132 is connected to the output terminal of the input device 131. The input terminal of the encoding device 120 is connected to the output terminal of the A / D conversion device 132. The output terminal of the encoding device 120 is connected to the network N1.

入力装置131は、人間の耳に聞こえる音波W11を電気的信号であるアナログ信号に変換してA/D変換装置132に与える。A/D変換装置132は、アナログ信号をディジタル信号に変換して符号化装置120に与える。符号化装置120は、入力されてくるディジタル信号を符号化してコードを生成し、ネットワークN1に出力する。   The input device 131 converts the sound wave W11 that can be heard by the human ear into an analog signal, which is an electrical signal, and provides the analog signal to the A / D converter 132. The A / D conversion device 132 converts the analog signal into a digital signal and gives it to the encoding device 120. The encoding device 120 generates a code by encoding the input digital signal and outputs the code to the network N1.

図13(b)は、本実施の形態に係る復号化装置が有線通信システムに適用された場合の受信側の主要な構成を示したブロック図である。なお、図8に示した構成要素と同一のものには同一の符号を付し、その説明を省略する。   FIG. 13B is a block diagram showing a main configuration on the receiving side when the decoding apparatus according to the present embodiment is applied to a wired communication system. In addition, the same code | symbol is attached | subjected to the same thing as the component shown in FIG. 8, and the description is abbreviate | omitted.

有線受信装置190は、ネットークN1に接続されている受信装置191、復号化装置170、D/A変換装置183、および出力装置184を有している。   The wired receiving device 190 includes a receiving device 191 connected to the network N1, a decoding device 170, a D / A conversion device 183, and an output device 184.

受信装置191の入力端子は、ネットワークN1に接続されている。復号化装置170の入力端子は、受信装置191の出力端子に接続されている。D/A変換装置183の入力端子は、復号化装置170の出力端子に接続されている。出力装置184の入力端子は、D/A変換装置183の出力端子に接続されている。   The input terminal of the receiving device 191 is connected to the network N1. An input terminal of the decryption device 170 is connected to an output terminal of the reception device 191. The input terminal of the D / A conversion device 183 is connected to the output terminal of the decoding device 170. The input terminal of the output device 184 is connected to the output terminal of the D / A converter 183.

受信装置191は、ネットワークN1からのディジタルの符号化音響信号を受けてディジタルの受信音響信号を生成して復号化装置170に与える。復号化装置170は、受信装置191からの受信音響信号を受けてこの受信音響信号に復号化処理を行ってディジタルの復号化音響信号を生成してD/A変換装置183に与える。D/A変換装置183は、復号化装置170からのディジタルの復号音声信号を変換してアナログの復号音声信号を生成して出力装置184に与える。出力装置184は、電気的信号であるアナログの復号音響信号を空気の振動に変換して音波W13として人間の耳に聴こえるように出力する。   The receiving device 191 receives the digital encoded acoustic signal from the network N1, generates a digital received acoustic signal, and provides it to the decoding device 170. The decoding device 170 receives the received acoustic signal from the receiving device 191, performs a decoding process on the received acoustic signal, generates a digital decoded acoustic signal, and supplies the digital decoded acoustic signal to the D / A conversion device 183. The D / A conversion device 183 converts the digital decoded speech signal from the decoding device 170 to generate an analog decoded speech signal, and provides it to the output device 184. The output device 184 converts an analog decoded acoustic signal, which is an electrical signal, into vibration of the air and outputs the sound wave W13 so that it can be heard by the human ear.

このように、上記の構成によれば、上記の無線送受信装置と同様の作用効果を有する有線送受信装置を提供することができる。   Thus, according to said structure, the wired transmission / reception apparatus which has the same effect as said wireless transmission / reception apparatus can be provided.

(実施の形態2)
図14は、本発明の実施の形態2に係る復号化装置270の主要な構成を示すブロック図である。なお、この復号化装置270は、図9に示した復号化装置170と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
(Embodiment 2)
FIG. 14 is a block diagram showing the main configuration of decoding apparatus 270 according to Embodiment 2 of the present invention. Note that this decoding device 270 has the same basic configuration as that of the decoding device 170 shown in FIG. 9, and the same components are denoted by the same reference numerals and description thereof is omitted.

本実施の形態の特徴は、結合後の第1スペクトルS1(k)(0≦k<Nb)の最大周波数インデックスNbを所望の値Ncに修正することにより、所望のサンプリングレートにて復号信号を生成することである。   The feature of this embodiment is that the decoded signal is converted at a desired sampling rate by correcting the maximum frequency index Nb of the combined first spectrum S1 (k) (0 ≦ k <Nb) to a desired value Nc. Is to generate.

スペクトル復号化部250は、分離部172で分離された符号化コードS14、第1レイヤ復号化部173で生成されたサンプリングレートFxの信号S13、および入力端子271を介し入力された係数Nc(信号S21)を用いて、スペクトル復号化を行う。そして、得られたサンプリングレートFyの復号信号を出力端子176を介し出力する。スペクトル復号化部250における周波数領域変換の分析長が2・Naであるとき、復号信号のサンプリングレートFyはFy=Fx・Nc/Naで表される。   The spectrum decoding unit 250 includes the encoded code S14 separated by the separation unit 172, the signal S13 of the sampling rate Fx generated by the first layer decoding unit 173, and the coefficient Nc (signal received via the input terminal 271) Spectrum decoding is performed using S21). Then, the decoded signal of the obtained sampling rate Fy is output via the output terminal 176. When the analysis length of the frequency domain transform in the spectrum decoding unit 250 is 2 · Na, the sampling rate Fy of the decoded signal is represented by Fy = Fx · Nc / Na.

図15は、上記のスペクトル復号化部250の内部構成を示すブロック図である。   FIG. 15 is a block diagram showing the internal configuration of the spectrum decoding unit 250 described above.

入力端子271を介し入力された係数Ncは、修正部251および時間領域変換部158aに与えられる。   The coefficient Nc input via the input terminal 271 is given to the correction unit 251 and the time domain conversion unit 158a.

修正部251は、結合部157より与えられる第1スペクトルS1(k)(0≦k<Nb)の有効な帯域を、入力端子271を介し与えられた係数Nc(信号S21)に基づいて0≦k<Ncに修正する。そして、帯域修正後の第1スペクトルS1(k)(0≦k<Nc)を時間領域変換部158aに与える。   The correcting unit 251 determines the effective band of the first spectrum S1 (k) (0 ≦ k <Nb) given from the combining unit 157 based on the coefficient Nc (signal S21) given via the input terminal 271. Correct to k <Nc. Then, the first spectrum S1 (k) (0 ≦ k <Nc) after the band correction is given to the time domain conversion unit 158a.

時間領域変換部158aは、入力端子271を介し与えられた係数Ncに従い、分析長2・Ncの下で修正部251から与えられる第1スペクトルS1(k)(0≦k<Nc)に対し変換処理を施し、適切な窓関数の乗算および重ね合わせ加算を行い、時間領域の信号を生成して出力端子159を介して出力する。この復号信号のサンプリングレートは、FS=Fx・Nc/Naとなる。   The time domain conversion unit 158a converts the first spectrum S1 (k) (0 ≦ k <Nc) given from the correction unit 251 under the analysis length 2 · Nc according to the coefficient Nc given via the input terminal 271. Processing is performed, appropriate window function multiplication and overlay addition are performed, and a time domain signal is generated and output through the output terminal 159. The sampling rate of this decoded signal is FS = Fx · Nc / Na.

図16および図17は、修正部251の処理をより詳細に説明するための図である。   16 and 17 are diagrams for explaining the processing of the correction unit 251 in more detail.

図16は、Nc<Nbの場合における修正部251の処理を表している。結合部157から与えられる第1スペクトルS1(k)(信号S21)の帯域は、0≦k<Nbとなっている。そこで、修正部251は、この第1スペクトルS1(k)の帯域が0≦k<Ncとなるように、Nc≦k<Nbの範囲のスペクトルを削除する。この結果得られる第1スペクトルS1(k)(0≦k<Nc)(信号S22)を時間領域変換部158aに与え、時間領域の復号信号S23が生成される。この復号信号S23のサンプリングレートは、FS=Fx・Nc/Naとなる。   FIG. 16 shows the processing of the correction unit 251 when Nc <Nb. The band of the first spectrum S1 (k) (signal S21) given from the combining unit 157 is 0 ≦ k <Nb. Therefore, the correcting unit 251 deletes the spectrum in the range of Nc ≦ k <Nb so that the band of the first spectrum S1 (k) satisfies 0 ≦ k <Nc. The first spectrum S1 (k) (0 ≦ k <Nc) (signal S22) obtained as a result is given to the time domain converter 158a, and a decoded signal S23 in the time domain is generated. The sampling rate of the decoded signal S23 is FS = Fx · Nc / Na.

図17は、同様に修正部251の処理であるが、Nc>Nbの場合の処理を表している。結合部251から与えられる第1スペクトルS1(k)(信号S25)の帯域は、図16と同様に0≦k<Nbとなっている。修正部251は、この第1スペクトルS1(k)の帯域が0≦k<NcとなるようにNb≦k<Ncの帯域を拡張し、その領域に特定の値(例えば、ゼロ値)を付与する。この結果得られる第1スペクトルS1(k)(0≦k<Nc)(信号S26)を時間領域変換部158aに与え、時間領域の復号信号S27が生成される。この復号信号S27のサンプリングレートは、FS=Fx・Nc/Naとなる。   FIG. 17 similarly shows the processing of the correction unit 251, but shows processing when Nc> Nb. The band of the first spectrum S1 (k) (signal S25) given from the combining unit 251 is 0 ≦ k <Nb as in FIG. The correcting unit 251 expands the band of Nb ≦ k <Nc so that the band of the first spectrum S1 (k) becomes 0 ≦ k <Nc, and gives a specific value (for example, zero value) to the region. To do. The first spectrum S1 (k) (0 ≦ k <Nc) (signal S26) obtained as a result is given to the time domain conversion unit 158a, and a time domain decoded signal S27 is generated. The sampling rate of the decoded signal S27 is FS = Fx · Nc / Na.

図18および図19を用いて、スペクトル復号化部250の動作をさらに説明する。   The operation of the spectrum decoding unit 250 will be further described with reference to FIGS. 18 and 19.

まず、入力端子153を介し入力される符号化コードがフレーム毎に変動していることを想定する。すなわち、結合部157から出力される第1スペクトルS1(k)の帯域には、図18に示されるような0≦k<Na(帯域R1)、0≦k<Nb1(帯域R2)、0≦k<Nb2(帯域R3)の3通りの帯域が存在し(ただし、Na<Nb1<Nb2)、フレーム毎にこれらの帯域の内の一つが選択されているものとする。   First, it is assumed that the encoded code input via the input terminal 153 varies from frame to frame. That is, the band of the first spectrum S1 (k) output from the combining unit 157 includes 0 ≦ k <Na (band R1), 0 ≦ k <Nb1 (band R2), 0 ≦ as shown in FIG. Assume that there are three bands k <Nb2 (band R3) (where Na <Nb1 <Nb2), and one of these bands is selected for each frame.

図19(a)は、係数NcがNb2に等しい場合のスペクトル復号化部250の動作、図19(b)は、係数NcがNb1に等しい場合のスペクトル復号化部250の動作を説明するための図である。   FIG. 19A illustrates the operation of the spectrum decoding unit 250 when the coefficient Nc is equal to Nb2, and FIG. 19B illustrates the operation of the spectrum decoding unit 250 when the coefficient Nc is equal to Nb1. FIG.

これらの図では、第iフレームで得られるスペクトルの帯域が、R1、R2、R3のいずれかであることを表している。また、処理1はNb1≦k<Nb2の帯域にゼロ値を挿入する処理、処理2はNa≦k<Nb2の帯域にゼロ値を挿入する処理、処理3はNb1≦k<Nb2の帯域を削除する処理、処理4はNa≦k<Nb1の帯域にゼロ値を挿入する処理を表している。   In these figures, the spectrum band obtained in the i-th frame is any one of R1, R2, and R3. Process 1 is a process of inserting a zero value into a band of Nb1 ≦ k <Nb2, Process 2 is a process of inserting a zero value into a band of Na ≦ k <Nb2, and Process 3 is a process of deleting a band of Nb1 ≦ k <Nb2. Processing 4 and processing 4 represent processing for inserting a zero value in the band of Na ≦ k <Nb1.

まず、図19(a)の場合について説明する。   First, the case of FIG. 19A will be described.

この図において、第0フレーム〜第1フレームおよび第7フレーム〜第8フレームではスペクトルの帯域がR3、すなわち第1スペクトルS1(k)の帯域が0≦k<Nb2であるため、修正部251は何の処理も施さずに第1スペクトルS1(k)(0≦k<Nb2)を時間領域変換部158aに出力する。   In this figure, since the spectrum band is R3 in the 0th frame to the 1st frame and the 7th frame to the 8th frame, that is, the band of the first spectrum S1 (k) is 0 ≦ k <Nb2, the correction unit 251 The first spectrum S1 (k) (0 ≦ k <Nb2) is output to the time domain conversion unit 158a without performing any processing.

また、第2フレーム〜第4フレームおよび第9フレームではスペクトルの帯域がR2、すなわち第1スペクトルS1(k)の帯域が0≦k<Nb1であるため、修正部251は第1スペクトルS1(k)の帯域をNb2まで拡張し、かつNb1≦k<Nb2の帯域にゼロ値を挿入した後に、第1スペクトルS1(k)(0≦k<Nb2)を時間領域変換部158aに出力する。   Further, in the second to fourth frames and the ninth frame, the spectrum band is R2, that is, the band of the first spectrum S1 (k) is 0 ≦ k <Nb1, and therefore the correcting unit 251 has the first spectrum S1 (k ) Is extended to Nb2 and a zero value is inserted into the band of Nb1 ≦ k <Nb2, and then the first spectrum S1 (k) (0 ≦ k <Nb2) is output to the time domain transform unit 158a.

一方、第5フレーム〜第6フレームではスペクトルの帯域がR1、すなわち第1スペクトルS1(k)の帯域が0≦k<Naであるため、修正部251は第1スペクトルS1(k)の帯域をNb2まで拡張し、かつNa≦k<Nb2の範囲にゼロ値を挿入した後に、第1スペクトルS1(k)(0≦k<Nb2)を時間領域変換部158aに出力する。   On the other hand, in the fifth to sixth frames, the spectrum band is R1, that is, the band of the first spectrum S1 (k) is 0 ≦ k <Na. Therefore, the correction unit 251 sets the band of the first spectrum S1 (k). After extending to Nb2 and inserting a zero value in the range of Na ≦ k <Nb2, the first spectrum S1 (k) (0 ≦ k <Nb2) is output to the time domain conversion unit 158a.

次に、図19(b)の場合について説明する。   Next, the case of FIG. 19B will be described.

この図において、第2フレーム〜第4フレームおよび第9フレームではスペクトルの帯域がR2、すなわち第1スペクトルS1(k)の帯域が0≦k<Nb1であるため、修正部251は何の処理も施さずに第1スペクトルS1(k)(0≦k<Nb1)を時間領域変換部158aに出力する。   In this figure, in the second to fourth frames and the ninth frame, since the spectrum band is R2, that is, the band of the first spectrum S1 (k) is 0 ≦ k <Nb1, the correction unit 251 does not perform any processing. Without applying, the first spectrum S1 (k) (0 ≦ k <Nb1) is output to the time domain conversion unit 158a.

また、第0フレーム〜第1フレームおよび第7フレーム〜第8フレームではスペクトルの帯域がR3、すなわち第1スペクトルS1(k)の帯域が0≦k<Nb2であるため、修正部251はNb1≦k<Nb2の帯域を削除した後に、第1スペクトルS1(k)(0≦k<Nb1)を時間領域変換部158aに出力する。   Further, in the 0th frame to the 1st frame and the 7th frame to the 8th frame, the spectrum band is R3, that is, the band of the first spectrum S1 (k) is 0 ≦ k <Nb2, and therefore the correcting unit 251 has Nb1 ≦ After deleting the band of k <Nb2, the first spectrum S1 (k) (0 ≦ k <Nb1) is output to the time domain conversion unit 158a.

一方、第5フレーム〜第6フレームではスペクトルの帯域がR1、すなわち第1スペクトルS1(k)の帯域が0≦k<Naであるため、修正部251は第1スペクトルS1(k)の帯域をNb1まで拡張し、かつNa≦k<Nb1の帯域にゼロ値を挿入した後に、第1スペクトルS1(k)(0≦k<Nb1)を時間領域変換部158aに出力する。   On the other hand, in the fifth to sixth frames, the spectrum band is R1, that is, the band of the first spectrum S1 (k) is 0 ≦ k <Na. Therefore, the correction unit 251 sets the band of the first spectrum S1 (k). After extending to Nb1 and inserting a zero value in the band of Na ≦ k <Nb1, the first spectrum S1 (k) (0 ≦ k <Nb1) is output to the time domain transform unit 158a.

このように、本実施の形態によれば、受信される第1スペクトルS1(k)の有効な周波数帯域が時間的に変動する場合でも、適切な係数Ncを与えることにより、所望のサンプリングレートの復号信号を安定して得ることができる。   As described above, according to the present embodiment, even when the effective frequency band of the received first spectrum S1 (k) fluctuates with time, by giving an appropriate coefficient Nc, a desired sampling rate can be obtained. The decoded signal can be obtained stably.

(実施の形態3)
図20は、本発明の実施の形態3に係る通信システムの主要な構成を示す図である。
(Embodiment 3)
FIG. 20 is a diagram showing a main configuration of a communication system according to Embodiment 3 of the present invention.

本実施の形態の特徴は、通信ネットワークの状況(通信環境)によって受信側で受信される第1スペクトルS1(k)の有効周波数帯域が時間的に変動する場合に対処することである。   The feature of this embodiment is to cope with a case where the effective frequency band of the first spectrum S1 (k) received on the receiving side varies with time depending on the situation (communication environment) of the communication network.

階層符号化部301は、サンプリングレートFyの入力信号に対し、実施の形態1で示した階層符号化処理を施し、スケーラブルな符号化コードを生成する。ここでは、生成される符号化コードが、帯域0≦k<Neに関する情報(R31)、帯域Ne≦k<Nfに関する情報(R32)、および帯域Nf≦k<Ngに関する情報(R33)により構成されるものとする。階層符号化部301は、この符号化コードをネットワーク制御部302に与える。   Hierarchical encoding section 301 performs the hierarchical encoding processing shown in Embodiment 1 on the input signal of sampling rate Fy, and generates a scalable encoded code. Here, the generated encoded code is configured by information on band 0 ≦ k <Ne (R31), information on band Ne ≦ k <Nf (R32), and information on band Nf ≦ k <Ng (R33). Shall be. The hierarchical encoding unit 301 gives this encoded code to the network control unit 302.

ネットワーク制御部302は、階層符号化部301より与えられる符号化コードを階層復号化部303に転送する。ここで、ネットワーク制御部302は、ネットワークの状況に応じて階層復号化部303に転送する符号化コードの一部を廃棄する。そのため、階層復号化部303に入力される符号化コードは、廃棄される符号化コードが全くない場合は情報R31〜R33により構成された符号化コード、情報R33の符号化コードが廃棄される場合は情報R31およびR32により構成された符号化コード、情報R32およびR33の符号化コードが廃棄される場合は情報R31により構成された符号化コード、のいずれかとなる。   The network control unit 302 transfers the encoded code given from the hierarchical encoding unit 301 to the hierarchical decoding unit 303. Here, the network control unit 302 discards part of the encoded code to be transferred to the hierarchical decoding unit 303 according to the network status. Therefore, the encoded code input to the hierarchical decoding unit 303 is the case where the encoded code composed of the information R31 to R33 and the encoded code of the information R33 are discarded when no encoded code is discarded. Is either an encoded code configured by information R31 and R32, or an encoded code configured by information R31 when the encoded code of information R32 and R33 is discarded.

階層復号化部303は、与えられた符号化コードに対し、実施の形態1または実施の形態2に示した階層復号化方法を適用して復号信号を生成する。なお、階層復号化部303に実施の形態1を適用した場合には、出力される復号信号のサンプリングレートFzは、Fyとなる(Fz=Fy・Ng/Ngのため)。また、階層復号化部303に実施の形態2を適用した場合には、所望の係数Ncによって復号信号のサンプリングレートを設定することができ、その復号信号のサンプリングレートFzは、Fy・Nc/Ngとなる。   Hierarchical decoding section 303 applies the hierarchical decoding method shown in Embodiment 1 or Embodiment 2 to a given encoded code to generate a decoded signal. When Embodiment 1 is applied to hierarchical decoding section 303, sampling rate Fz of the output decoded signal is Fy (because Fz = Fy · Ng / Ng). When Embodiment 2 is applied to hierarchical decoding section 303, the sampling rate of the decoded signal can be set by a desired coefficient Nc, and the sampling rate Fz of the decoded signal is Fy · Nc / Ng. It becomes.

このように、本実施の形態によれば、通信ネットワークの状況によって受信側で受信される第1スペクトルS1(k)の有効周波数帯域が時間的に変動する場合でも、受信側は所望のサンプリングレートの復号信号を安定して求めることができる。   As described above, according to the present embodiment, even when the effective frequency band of the first spectrum S1 (k) received on the receiving side varies with time depending on the state of the communication network, the receiving side has a desired sampling rate. Can be obtained stably.

(実施の形態4)
図21は、本発明の実施の形態4に係る通信システムの主要な構成を示す図である。
(Embodiment 4)
FIG. 21 is a diagram showing a main configuration of a communication system according to Embodiment 4 of the present invention.

本実施の形態の特徴は、1つの階層符号部により生成された1つの符号化コードを、それぞれ復号可能なサンプリングレートの異なる(復号能力の異なる)複数の階層復号化部に対して同時に送信しても、受信側がこれに対応し、それぞれ異なるサンプリングレートの復号信号を得ることである。   A feature of this embodiment is that one encoded code generated by one hierarchical encoder is simultaneously transmitted to a plurality of hierarchical decoders having different decoding rates (different decoding capabilities). However, the receiving side responds to this and obtains decoded signals having different sampling rates.

階層符号化部401は、サンプリングレートFyの入力信号に対して実施の形態1に示した符号化処理を施し、スケーラブルな符号化コードを生成する。ここでは、生成される符号化コードは、帯域0≦k<Nhに関する情報(R41)、帯域Nh≦k<Niに関する情報(R42)、帯域Ni≦k<Njに関する情報(R43)により構成されるものとする。階層符号化部401は、この符号化コードを、第1階層復号化部402−1、第2階層復号化部402−2、第3階層復号化部402−3にそれぞれ与える。   Hierarchical encoding section 401 performs the encoding process shown in Embodiment 1 on the input signal of sampling rate Fy to generate a scalable encoded code. Here, the generated encoded code includes information on the band 0 ≦ k <Nh (R41), information on the band Nh ≦ k <Ni (R42), and information on the band Ni ≦ k <Nj (R43). Shall. Hierarchical encoding section 401 gives this encoded code to first hierarchical decoding section 402-1, second hierarchical decoding section 402-2, and third hierarchical decoding section 402-3, respectively.

第1階層復号化部402−1、第2階層復号化部402−2、および第3階層復号化部402−3は、与えられた符号化コードに対し、実施の形態1または実施の形態2に示した階層復号化法を適用して復号信号を生成する。第1階層復号化部402−1は係数Nc=Njとしたときの復号化処理、第2階層復号化部402−2は係数Nc=Niとしたときの復号化処理、第3階層復号化部402−3は係数Nc=Nhとしたときの復号化処理を行う。   First layer decoding section 402-1, second layer decoding section 402-2, and third layer decoding section 402-3 perform the first or second embodiment on the given encoded code. The decoded signal is generated by applying the hierarchical decoding method shown in FIG. First hierarchy decoding section 402-1 is a decoding process when coefficient Nc = Nj, second hierarchy decoding section 402-2 is a decoding process when coefficient Nc = Ni, and third hierarchy decoding section 402-3 performs a decoding process when the coefficient Nc = Nh.

第1階層復号化部402−1は、係数Nc=Njとしたときの復号化処理を行い、復号信号を生成する。この復号信号のサンプリングレートF1はFyとなる(F1=Fy・Nj/Njのため)。   First layer decoding section 402-1 performs a decoding process when coefficient Nc = Nj, and generates a decoded signal. The sampling rate F1 of this decoded signal is Fy (because F1 = Fy · Nj / Nj).

第2階層復号化部402−2は、係数Nc=Niとしたときの復号化処理を行い、復号信号を生成する。この復号信号のサンプリングレートF2はFy・Ni/Njとなる。   Second layer decoding section 402-2 performs a decoding process when coefficient Nc = Ni, and generates a decoded signal. The sampling rate F2 of this decoded signal is Fy · Ni / Nj.

第3階層復号化部402−3は、係数Nc=Nhとしたときの復号化処理を行い、復号信号を生成する。この復号信号のサンプリングレートF3はFy・Nh/Njとなる。   Third layer decoding section 402-3 performs a decoding process when coefficient Nc = Nh, and generates a decoded signal. The sampling rate F3 of this decoded signal is Fy · Nh / Nj.

このように、本実施の形態によれば、送信側は受信側の復号能力を考慮することなく符号化コードを送信することができるので、通信ネットワークの負荷を抑えることができる。また、これら複数種類のサンプリングレートの復号信号は、簡易な構成かつ少ない演算量で生成することができる。   As described above, according to the present embodiment, the transmitting side can transmit the encoded code without considering the decoding capability of the receiving side, so that the load on the communication network can be suppressed. Also, the decoded signals of these plural types of sampling rates can be generated with a simple configuration and a small amount of calculation.

本発明は、移動体通信システムにおける通信端末装置および基地局装置に適用することも可能であり、これにより上記と同様の作用効果を有する通信端末装置および基地局装置を提供することができる。   The present invention can also be applied to a communication terminal apparatus and a base station apparatus in a mobile communication system, thereby providing a communication terminal apparatus and a base station apparatus having the same effects as described above.

なお、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、ソフトウェアで実現することも可能である。   Here, the case where the present invention is configured by hardware has been described as an example, but it can also be realized by software.

本発明は、簡易な構成および少ない演算量でスケーラブル符号化を実現する効果を有し、IPネットワーク等の通信システムの用途に適用できる。   The present invention has the effect of realizing scalable coding with a simple configuration and a small amount of computation, and can be applied to the use of a communication system such as an IP network.

103、112、154 周波数領域変換部
104、155 帯域拡張部
105 拡張スペクトル付与部
106 スペクトル情報特定部
113 LPC分析部
156 復号部
157 結合部
158 時間領域変換部
251 修正部
103, 112, 154 Frequency domain conversion unit 104, 155 Band extension unit 105 Extended spectrum giving unit 106 Spectrum information specifying unit 113 LPC analysis unit 156 Decoding unit 157 Combining unit 158 Time domain conversion unit 251 Correction unit

Claims (4)

音声信号またはオーディオ信号の第1帯域を符号化する第1符号化手段と、
前記音声信号または前記オーディオ信号の第2帯域を符号化する第2符号化手段と、を具備し、
前記第2符号化手段は、
前記第1符号化手段で得られる第1サンプリングレートの時間領域信号から、周波数領域変換によってスペクトルを得る変換手段と、
前記第1サンプリングレート、および前記第2帯域に相当する第2サンプリングレートの比に対応する帯域幅の拡張スペクトルを前記スペクトルに基づいて生成する生成手段と、
前記スペクトルおよび前記拡張スペクトルを符号化する符号化手段と、を具備する、
スケーラブル符号化装置。
First encoding means for encoding a first band of an audio signal or an audio signal;
A second encoding means for encoding a second band of the audio signal or the audio signal,
The second encoding means includes
Conversion means for obtaining a spectrum by frequency domain conversion from a time domain signal at a first sampling rate obtained by the first encoding means;
Generating means for generating, based on the spectrum, an extended spectrum of a bandwidth corresponding to a ratio of the first sampling rate and a second sampling rate corresponding to the second band;
Encoding means for encoding the spectrum and the extended spectrum;
Scalable encoding device.
スケーラブル符号化装置で生成される符号化情報を復号して音声信号またはオーディオ信号の第1帯域に相当する第1サンプリングレートの時間領域信号を生成する第1復号化手段と、
前記符号化情報を復号して音声信号またはオーディオ信号の第2帯域に相当する第2サンプリングレートの時間領域信号を生成する第2復号化手段と、を具備し、
前記第2復号化手段は、
前記第1復号化手段で得られる第1サンプリングレートの時間領域信号から、周波数領域変換によってスペクトルを得る第1変換手段と、
スケーラブル符号化装置で生成される符号化情報を復号して、前記第1サンプリングレートおよび前記第2サンプリングレートの比に対応する帯域幅の拡張スペクトルを生成する生成手段と、
前記スペクトルおよび前記拡張スペクトルから、時間領域変換によって時間領域信号を得る第2変換手段と、を具備する、
スケーラブル復号化装置。
First decoding means for decoding encoded information generated by the scalable encoding device to generate a time-domain signal having a first sampling rate corresponding to the first band of the audio signal or audio signal;
Decoding the encoded information to generate a time domain signal having a second sampling rate corresponding to the second band of the audio signal or the audio signal; and
The second decoding means includes
First transforming means for obtaining a spectrum by frequency domain transform from a time domain signal at a first sampling rate obtained by the first decoding means;
Generating means for decoding encoded information generated by the scalable encoding device and generating an extended spectrum of a bandwidth corresponding to a ratio of the first sampling rate and the second sampling rate;
Second conversion means for obtaining a time domain signal by time domain conversion from the spectrum and the extended spectrum,
Scalable decoding device.
音声信号またはオーディオ信号の第1帯域を符号化する第1符号化ステップと、
前記音声信号または前記オーディオ信号の第2帯域を符号化する第2符号化ステップと、を具備し、
前記第2符号化ステップは、
前記第1符号化ステップで得られる第1サンプリングレートの時間領域信号から、周波数領域変換によってスペクトルを得る変換ステップと、
前記第1サンプリングレート、および前記第2帯域に相当する第2サンプリングレートの比に対応する帯域幅の拡張スペクトルを前記スペクトルに基づいて生成する生成ステップと、
前記スペクトルおよび前記拡張スペクトルを符号化する符号化ステップと、を具備する、
スケーラブル符号化方法。
A first encoding step of encoding a first band of the audio signal or audio signal;
A second encoding step for encoding a second band of the audio signal or the audio signal,
The second encoding step includes
A conversion step of obtaining a spectrum by frequency domain conversion from a time-domain signal at a first sampling rate obtained in the first encoding step;
Generating an extended spectrum of a bandwidth corresponding to a ratio of the first sampling rate and a second sampling rate corresponding to the second band based on the spectrum;
An encoding step for encoding the spectrum and the extended spectrum;
Scalable encoding method.
スケーラブル符号化装置で生成される符号化情報を復号して音声信号またはオーディオ信号の第1帯域に相当する第1サンプリングレートの時間領域信号を生成する第1復号化ステップと、
前記符号化情報を復号して音声信号またはオーディオ信号の第2帯域に相当する第2サンプリングレートの時間領域信号を生成する第2復号化ステップと、を具備し、
前記第2復号化ステップは、
前記第1復号化ステップで得られる第1サンプリングレートの時間領域信号から、周波数領域変換によってスペクトルを得る第1変換ステップと、
スケーラブル符号化装置で生成される符号化情報を復号して、前記第1サンプリングレートおよび前記第2サンプリングレートの比に対応する帯域幅の拡張スペクトルを生成する生成ステップと、
前記スペクトルおよび前記拡張スペクトルから、時間領域変換によって時間領域信号を得る第2変換ステップと、を具備する、
スケーラブル復号化方法。
A first decoding step of decoding time-domain signals having a first sampling rate corresponding to a first band of an audio signal or an audio signal by decoding encoded information generated by the scalable encoding device;
A second decoding step of decoding the encoded information to generate a time domain signal having a second sampling rate corresponding to the second band of the audio signal or the audio signal,
The second decoding step includes
A first transform step for obtaining a spectrum by frequency domain transform from a time domain signal at a first sampling rate obtained in the first decoding step;
A generation step of decoding encoded information generated by the scalable encoding device to generate an extended spectrum of a bandwidth corresponding to a ratio of the first sampling rate and the second sampling rate;
A second transforming step of obtaining a time domain signal from the spectrum and the extended spectrum by time domain transform,
Scalable decoding method.
JP2009204962A 2009-09-04 2009-09-04 Scalable decoding apparatus and scalable decoding method Expired - Lifetime JP5031006B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009204962A JP5031006B2 (en) 2009-09-04 2009-09-04 Scalable decoding apparatus and scalable decoding method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009204962A JP5031006B2 (en) 2009-09-04 2009-09-04 Scalable decoding apparatus and scalable decoding method

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2003341717A Division JP4679049B2 (en) 2003-09-30 2003-09-30 Scalable decoding device

Publications (2)

Publication Number Publication Date
JP2010020333A true JP2010020333A (en) 2010-01-28
JP5031006B2 JP5031006B2 (en) 2012-09-19

Family

ID=41705206

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009204962A Expired - Lifetime JP5031006B2 (en) 2009-09-04 2009-09-04 Scalable decoding apparatus and scalable decoding method

Country Status (1)

Country Link
JP (1) JP5031006B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011171968A (en) * 2010-02-18 2011-09-01 Jvc Kenwood Holdings Inc Apparatus and method for noise elimination
JP2014510299A (en) * 2011-02-07 2014-04-24 クゥアルコム・インコーポレイテッド Device for encoding and decoding watermarked signals
US9767823B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and detecting a watermarked signal
JP2019032543A (en) * 2016-01-22 2019-02-28 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン Apparatus and method for encoding or decoding multi-channel signal using spectral domain resampling

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08263096A (en) * 1995-03-24 1996-10-11 Nippon Telegr & Teleph Corp <Ntt> Acoustic signal encoding method and decoding method
JP2001521648A (en) * 1997-06-10 2001-11-06 コーディング テクノロジーズ スウェーデン アクチボラゲット Enhanced primitive coding using spectral band duplication
JP2001356788A (en) * 2000-06-14 2001-12-26 Kenwood Corp Device and method for frequency interpolation and recording medium
JP2003502704A (en) * 1999-06-21 2003-01-21 デジタル・シアター・システムズ・インコーポレーテッド Improve sound quality in established low bit rate audio coding systems without losing decoder compatibility
JP2003216199A (en) * 2001-11-15 2003-07-30 Matsushita Electric Ind Co Ltd Decoder, decoding method and program distribution medium therefor
JP2003216190A (en) * 2001-11-14 2003-07-30 Matsushita Electric Ind Co Ltd Encoding device and decoding device
JP2003241799A (en) * 2002-02-15 2003-08-29 Nippon Telegr & Teleph Corp <Ntt> Sound encoding method, decoding method, encoding device, decoding device, encoding program, and decoding program

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08263096A (en) * 1995-03-24 1996-10-11 Nippon Telegr & Teleph Corp <Ntt> Acoustic signal encoding method and decoding method
JP2001521648A (en) * 1997-06-10 2001-11-06 コーディング テクノロジーズ スウェーデン アクチボラゲット Enhanced primitive coding using spectral band duplication
JP2003502704A (en) * 1999-06-21 2003-01-21 デジタル・シアター・システムズ・インコーポレーテッド Improve sound quality in established low bit rate audio coding systems without losing decoder compatibility
JP2001356788A (en) * 2000-06-14 2001-12-26 Kenwood Corp Device and method for frequency interpolation and recording medium
JP2003216190A (en) * 2001-11-14 2003-07-30 Matsushita Electric Ind Co Ltd Encoding device and decoding device
JP2003216199A (en) * 2001-11-15 2003-07-30 Matsushita Electric Ind Co Ltd Decoder, decoding method and program distribution medium therefor
JP2003241799A (en) * 2002-02-15 2003-08-29 Nippon Telegr & Teleph Corp <Ntt> Sound encoding method, decoding method, encoding device, decoding device, encoding program, and decoding program

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011171968A (en) * 2010-02-18 2011-09-01 Jvc Kenwood Holdings Inc Apparatus and method for noise elimination
JP2014510299A (en) * 2011-02-07 2014-04-24 クゥアルコム・インコーポレイテッド Device for encoding and decoding watermarked signals
US9767822B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and decoding a watermarked signal
US9767823B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and detecting a watermarked signal
JP2019032543A (en) * 2016-01-22 2019-02-28 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン Apparatus and method for encoding or decoding multi-channel signal using spectral domain resampling
US10706861B2 (en) 2016-01-22 2020-07-07 Fraunhofer-Gesellschaft Zur Foerderung Der Andgewandten Forschung E.V. Apparatus and method for estimating an inter-channel time difference
US10854211B2 (en) 2016-01-22 2020-12-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatuses and methods for encoding or decoding a multi-channel signal using frame control synchronization
US10861468B2 (en) 2016-01-22 2020-12-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding a multi-channel signal using a broadband alignment parameter and a plurality of narrowband alignment parameters
JP2021101253A (en) * 2016-01-22 2021-07-08 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン Apparatus for and method of encoding or decoding multi-channel signal using spectral domain resampling
US11410664B2 (en) 2016-01-22 2022-08-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for estimating an inter-channel time difference
JP7258935B2 (en) 2016-01-22 2023-04-17 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン Apparatus and method for encoding or decoding multi-channel signals using spectral domain resampling
US11887609B2 (en) 2016-01-22 2024-01-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for estimating an inter-channel time difference

Also Published As

Publication number Publication date
JP5031006B2 (en) 2012-09-19

Similar Documents

Publication Publication Date Title
JP4679049B2 (en) Scalable decoding device
JP5013863B2 (en) Encoding apparatus, decoding apparatus, communication terminal apparatus, base station apparatus, encoding method, and decoding method
EP1798724B1 (en) Encoder, decoder, encoding method, and decoding method
US8793126B2 (en) Time/frequency two dimension post-processing
US8738372B2 (en) Spectrum coding apparatus and decoding apparatus that respectively encodes and decodes a spectrum including a first band and a second band
KR101835156B1 (en) Signal processing apparatus and method, and program
JP2015172706A (en) Sound decoding device and program
JPWO2006134992A1 (en) Post filter, decoding device, and post filter processing method
JP2000305599A (en) Speech synthesizing device and method, telephone device, and program providing media
WO2009131066A1 (en) System, device, method, and program for signal analysis control and signal control
WO2005027095A1 (en) Encoder apparatus and decoder apparatus
KR20000069494A (en) Method and devices for coding discrete signals or for decoding coded discrete signals
JP5031006B2 (en) Scalable decoding apparatus and scalable decoding method
JP5668923B2 (en) Signal analysis control system and method, signal control apparatus and method, and program
JP5425066B2 (en) Quantization apparatus, encoding apparatus, and methods thereof
JP2005114814A (en) Method, device, and program for speech encoding and decoding, and recording medium where same is recorded
KR20100024426A (en) Signal analysis device, signal control device, its system, method, and program
JP3594829B2 (en) MPEG audio decoding method
JP2005110018A (en) METHOD AND SYSTEM FOR VoIP VOICE COMMUNICATION, AND ITS TRANSMITTING TERMINAL, RECEIVING TERMINAL AND PROGRAM
JP4024784B2 (en) Audio decoding device
JPWO2009038158A1 (en) Speech decoding apparatus, speech decoding method, program, and portable terminal

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120403

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120509

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120605

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120626

R150 Certificate of patent or registration of utility model

Ref document number: 5031006

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150706

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term