JP5031006B2 - Scalable decoding apparatus and scalable decoding method - Google Patents
Scalable decoding apparatus and scalable decoding method Download PDFInfo
- Publication number
- JP5031006B2 JP5031006B2 JP2009204962A JP2009204962A JP5031006B2 JP 5031006 B2 JP5031006 B2 JP 5031006B2 JP 2009204962 A JP2009204962 A JP 2009204962A JP 2009204962 A JP2009204962 A JP 2009204962A JP 5031006 B2 JP5031006 B2 JP 5031006B2
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- band
- signal
- decoded
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 40
- 238000001228 spectrum Methods 0.000 claims abstract description 269
- 238000005070 sampling Methods 0.000 claims abstract description 107
- 238000006243 chemical reaction Methods 0.000 claims abstract description 54
- 230000005236 sound signal Effects 0.000 claims description 34
- 230000003362 replicative effect Effects 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 3
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims 1
- 238000004458 analytical method Methods 0.000 abstract description 35
- 238000012545 processing Methods 0.000 abstract description 25
- 238000010586 diagram Methods 0.000 description 31
- 238000004891 communication Methods 0.000 description 20
- 238000012937 correction Methods 0.000 description 14
- 230000005540 biological transmission Effects 0.000 description 10
- 230000000694 effects Effects 0.000 description 8
- 238000000926 separation method Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
本発明は、スケーラブル復号化装置及びスケーラブル復号化方法に関する。 The present invention relates to a scalable decoding device and a scalable decoding method .
今日、世の中には、コンパクトディスク用の44.1kHz、DAT(Digital Audio Tape)、ディジタルVTR、もしくは衛星テレビジョン用の32kHzもしくは48kHz、またはDVDオーディオ信号用の48kHzもしくは96kHzというように、多くの異なるサンプリングレートが存在する。従って、再生装置もしくは記録装置のデコーダの内部サンプリングレートが、これから復号化しようとするデータのサンプリングレートと異なる場合、サンプリングレートを変換する必要が生じる。このサンプリングレートの変換を行う従来装置としては、例えば、特許文献1に示すものがある。
Today there are many different things in the world, such as 44.1 kHz for compact discs, 32 kHz or 48 kHz for digital audio tape (DAT), digital VTR, or satellite television, or 48 kHz or 96 kHz for DVD audio signals. There is a sampling rate. Therefore, when the internal sampling rate of the decoder of the playback device or recording device is different from the sampling rate of the data to be decoded, it is necessary to convert the sampling rate. An example of a conventional apparatus that performs this sampling rate conversion is disclosed in
また近年、有線系でのADSL(Asymmetric Digital Subscriber Line)や光ファイバの普及、または無線系でのW−CDMA(Wideband - Code Division Multiple Access)や無線LANの実用化等により、ネットワークにおける伝送路容量が大きく改善され、それに伴い音声通信において信号帯域を広げることによる高臨場感化および高品質化が求められてきている。 Also, in recent years, transmission line capacity in networks has become widespread due to the widespread use of ADSL (Asymmetric Digital Subscriber Line) and optical fiber in wired systems, or practical application of W-CDMA (Wideband-Code Division Multiple Access) and wireless LANs in wireless systems. Accordingly, there has been a demand for higher realism and higher quality by expanding the signal band in voice communication.
現在、狭帯域信号を符号化する代表的な方式に、ITU(International Telecommunication Union)で規格化されているG.726、G.729等がある。また、広帯域信号を符号化する代表的な方法として、ITU−T(International Telecommunication Union Telecommunication Standardization Sector)のG722、G722.1や、3GPP(The 3rd Generation Partnership Project)のAMR−WB等がある。 Currently, G. standardized by ITU (International Telecommunication Union) is a typical method for encoding narrowband signals. 726, G.G. 729 etc. Moreover, as a typical method for encoding a wideband signal, there are G722 and G722.1 of ITU-T (International Telecommunication Union Telecommunication Standardization Sector), AMR-WB of 3GPP (The 3rd Generation Partnership Project), and the like.
さらに最近、IP(Internet Protocol)ネットワーク等の様々なネットワーク環境で使用されることを意図して、音声符号化方式にスケーラブル機能の実現が求められている。スケーラブル機能とは、符号化コードの一部からでも、音声信号を復号できる機能を表す。このスケーラブル機能を有することにより、条件の良い通信路では全ての符号化コードを用いて高品質な音声信号を復号し、条件の悪い通信路では符号化コードの一部のみ伝送することでパケットロスの発生の頻度を抑えることができる。また、多地点間での通信時におけるネットワーク資源の効率化等の効果が得られるようになる。 In recent years, there has been a demand for the implementation of a scalable function in a speech coding system intended to be used in various network environments such as an IP (Internet Protocol) network. The scalable function represents a function capable of decoding an audio signal even from a part of an encoded code. By having this scalable function, packet loss can be achieved by decoding high-quality audio signals using all coded codes in a good channel and transmitting only a part of the coded code in a bad channel. The frequency of occurrence can be suppressed. In addition, it is possible to obtain an effect such as efficiency of network resources at the time of communication between multiple points.
このスケーラブル機能を有する高品質な符号化方式の実現には、様々なサンプリングレートの信号を利用して符号化を行う必要性がある。例えば、サンプリングレートが8kHzの信号をITU−Tで規格化されているG.726、G.729等の方式を用いて符号化を行い、サンプリングレートが16kHzの領域でその誤差信号をさらに符号化することで、信号帯域の拡張による品質の改善およびスケーラブル性が実現できる。 In order to realize a high-quality encoding method having a scalable function, it is necessary to perform encoding using signals of various sampling rates. For example, a signal with a sampling rate of 8 kHz is standardized by ITU-T. 726, G.G. By performing encoding using a method such as 729 and further encoding the error signal in a region where the sampling rate is 16 kHz, quality improvement and scalability can be realized by extending the signal band.
図22は、スケーラブル符号化を行う従来の符号化装置の代表的な構成を示したブロック図である。この例では、レイヤ数N=3であり、レイヤnで取り扱う信号のサンプリングレートをFS(n)と表し、FS(1)=16[kHz]、FS(2)=24[kHz]、FS(3)=32[kHz]であるとする。 FIG. 22 is a block diagram showing a typical configuration of a conventional coding apparatus that performs scalable coding. In this example, the number of layers N = 3, the sampling rate of the signal handled in layer n is represented as FS (n), FS (1) = 16 [kHz], FS (2) = 24 [kHz], FS ( 3) Assume that 32 [kHz].
入力端子11を介してダウンサンプリング部12に入力された音響信号(音声信号、オーディオ信号等)は、サンプリング周波数が32kHzから16kHzへとダウンサンプリングされ、第1レイヤ符号化部13に与えられる。第1レイヤ符号化部13は、入力された音響信号と符号化後に生成される復号信号との間の聴感的な歪が最小となるように第1符号化コードを決定する。この第1符号化コードは多重化部26に送られるとともに第1レイヤ復号化部14に送られる。第1レイヤ復号化部14は、第1符号化コードを用いて第1レイヤ復号信号を生成する。アップサンプリング部15は、第1レイヤ復号信号のサンプリング周波数を16kHzから24kHzへアップサンプリングし、この信号を減算器18および加算器21に与える。
The acoustic signal (sound signal, audio signal, etc.) input to the
また、入力端子11を介してダウンサンプリング部16に入力された音響信号は、サンプリング周波数が32kHzから24kHzへとダウンサンプリングされ、遅延部17に与えられる。遅延部17は、ダウンサンプリング後の信号を所定の時間長だけ遅延させる。減算器18は、遅延部17の出力信号とアップサンプリング部15の出力信号との差を求め、第2レイヤ残差信号を生成し、第2レイヤ符号化部19に与えられる。第2レイヤ符号化部19は、第2レイヤ残差信号を聴感的に品質改善が成されるように符号化を行い、第2符号化コードを決定し、この第2符号化コードを多重化部26および第2レイヤ復号化部20に与える。第2レイヤ復号化部20は、第2符号化コードを用いて復号処理を行い、第2レイヤ復号残差信号を生成する。加算器21は、前述の第1レイヤ復号信号と第2レイヤ復号残差信号との和をとり、第2レイヤ復号信号を生成する。アップサンプリング部22は、第2レイヤ復号信号のサンプリング周波数を24kHzから32kHzへアップサンプリングし、この信号を減算器24に与える。
The acoustic signal input to the down-
さらに、入力端子11を介して遅延部23に入力された音響信号は、所定の時間長だけ遅延され、減算器24に与えられる。減算器24は、遅延部23の出力信号とアップサンプリング部22の出力信号との差をとり、第3レイヤ残差信号を生成する。この第3レイヤ残差信号が第3レイヤ符号化部25に与えられる。第3レイヤ符号化部25は、第3レイヤ残差信号を聴感的に品質改善が成されるように符号化を行い、第3符号化コードを決定し、多重化部26にその符号化コードを与える。多重化部26は、第1レイヤ符号化部13、第2レイヤ符号化部19、および第3レイヤ符号化部25から得られた符号化コードを多重化し、出力端子27を介し出力する。
Further, the acoustic signal input to the
しかしながら、上記のようにG.726やG.729、またはAMR−WBのような時間領域の符号化方式に基づいてスケーラブル機能を実現する従来の符号化装置においては、種々の信号のサンプリングレートを変換する必要があり(上記の例では、ダウンサンプリング部12、アップサンプリング部15、ダウンサンプリング部16、およびアップサンプリング部22が必要)、符号化装置の構成が複雑になり、符号化の処理演算量も増大するという問題がある。また、この符号化装置によって符号化された信号を復号する復号化装置の回路構成も複雑になり、復号化の処理演算量が増大する。
However, as described above, G.M. 726 and G.G. In the conventional coding apparatus that realizes the scalable function based on the time domain coding scheme such as 729 or AMR-WB, it is necessary to convert the sampling rate of various signals (in the above example, downsampling is performed). The
本発明は、かかる点に鑑みてなされたものであり、回路規模を縮小でき、処理演算量も削減できるスケーラブル復号化装置及びスケーラブル復号化方法を提供することを目的とする。 The present invention has been made in view of this point, and an object of the present invention is to provide a scalable decoding device and a scalable decoding method that can reduce the circuit scale and the amount of processing computation.
本発明のスケーラブル復号化装置は、音声信号またはオーディオ信号をスケーラブル符号化装置で符号化して生成された、前記音声信号または前記オーディオ信号の所定の周波数より低い帯域である第1帯域に関する第1符号化情報と、前記オーディオ信号の所定の周波数より高い帯域である第2帯域に関する第2符号化情報と、を含む情報を受信する受信手段と、前記第1符号化情報を復号して音声信号またはオーディオ信号の前記第1帯域に相当する第1サンプリングレートの時間領域信号を生成する第1復号化手段と、前記第2符号化情報を周波数領域で復号して前記第2帯域の復号スペクトルを生成し、前記第2帯域の復号スペクトルを用いて前記第1サンプリングレートよりも大きい所定の第2サンプリングレートをサンプリングレート変換した第3サンプリングレートの復号信号を生成する第2復号化手段と、を具備し、前記第2復号化手段は、前記第1復号化手段で得られる前記第1サンプリングレートの時間領域信号から、周波数領域変換によって前記第1帯域のスペクトルを得る第1変換手段と、前記第1帯域のスペクトルの特定の位置のスペクトルを複製する複製手段と、前記第2符号化情報と前記複製されたスペクトルとを用いて前記第1帯域の復号スペクトルの帯域幅を拡張する前記第2帯域の復号スペクトルを生成し、前記第2帯域の復号スペクトルを前記第1帯域の復号スペクトルに付加して拡張復号スペクトルを生成するスペクトル生成手段と、前記拡張復号スペクトルの最大周波数に隣接し且つ前記拡張復号スペクトルの外部に位置する前記拡張復号スペクトルの第1の高域部にゼロを挿入、または、前記最大周波数に隣接し且つ前記拡張復号スペクトルの内部に位置する前記拡張復号スペクトルの第2の高域部を削除して所定の帯域のスペクトルを得、前記所定の帯域のスペクトルから、時間領域変換によって前記第3サンプリングレートの時間領域信号を前記復号信号として生成する時間領域信号生成手段と、を具備する構成を採る。 The scalable decoding device according to the present invention includes a first code relating to a first band, which is a band lower than a predetermined frequency of the audio signal or the audio signal, generated by encoding the audio signal or the audio signal by the scalable encoding device. Receiving means for receiving information including encoded information and second encoded information relating to a second band which is a band higher than a predetermined frequency of the audio signal, and decoding the first encoded information into an audio signal or First decoding means for generating a time-domain signal having a first sampling rate corresponding to the first band of the audio signal, and generating a decoded spectrum of the second band by decoding the second encoded information in the frequency domain And sampling a predetermined second sampling rate larger than the first sampling rate using the decoded spectrum of the second band. Second decoding means for generating a decoded signal having a third sampling rate subjected to the rate conversion, wherein the second decoding means is a time domain of the first sampling rate obtained by the first decoding means. First transforming means for obtaining the spectrum of the first band from the signal by frequency domain transform, replicating means for replicating the spectrum at a specific position of the spectrum of the first band, and the second encoded information and the replica A decoded spectrum of the second band that extends a bandwidth of the decoded spectrum of the first band using the spectrum obtained by adding the decoded spectrum of the second band to the decoded spectrum of the first band. Spectrum generating means for generating a decoded spectrum; and the extension located adjacent to the maximum frequency of the extended decoded spectrum and located outside the extended decoded spectrum No. inserts zeros into the first high band portion of the spectrum, or the extended decoding second predetermined band by removing the high frequency part of the spectrum which is located inside the adjacent and the expansion decoded spectrum to the maximum frequency And a time domain signal generating means for generating a time domain signal of the third sampling rate as the decoded signal from the spectrum of the predetermined band by time domain conversion.
本発明のスケーラブル復号化方法は、音声信号またはオーディオ信号をスケーラブル符号化装置で符号化して生成された、前記音声信号または前記オーディオ信号の所定の周波数より低い帯域である第1帯域に関する第1符号化情報と、前記オーディオ信号の所定の周波数より高い帯域である第2帯域に関する第2符号化情報と、を含む情報を受信する受信ステップと、前記第1符号化情報を復号して音声信号またはオーディオ信号の前記第1帯域に相当する第1サンプリングレートの時間領域信号を生成する第1復号化ステップと、前記第2符号化情報を周波数領域で復号して前記第2帯域の復号スペクトルを生成し、前記第2帯域の復号スペクトルを用いて前記第1サンプリングレートよりも大きい所定の第2サンプリングレートをサンプリングレート変換した第3サンプリングレートの復号信号を生成する第2復号化ステップと、を具備し、前記第2復号化ステップは、前記第1復号化ステップで得られる前記第1サンプリングレートの時間領域信号から、周波数領域変換によって前記第1帯域のスペクトルを得る第1変換ステップと、前記第1帯域のスペクトルの特定の位置のスペクトルを複製する複製ステップと、前記第2符号化情報と前記複製されたスペクトルとを用いて前記第1帯域の復号スペクトルの帯域幅を拡張する前記第2帯域の復号スペクトルを生成し、前記第2帯域の復号スペクトルを前記第1帯域の復号スペクトルに付加して拡張復号スペクトルを生成するスペクトル生成ステップと、前記拡張復号スペクトルの最大周波数に隣接し且つ前記拡張復号スペクトルの外部に位置する前記拡張復号スペクトルの第1の高域部にゼロを挿入、または、前記最大周波数に隣接し且つ前記拡張復号スペクトルの内部に位置する前記拡張復号スペクトルの第2の高域部を削除して所定の帯域のスペクトルを得、前記所定の帯域のスペクトルから、時間領域変換によって前記第3サンプリングレートの時間領域信号を前記復号信号として生成する時間領域信号生成ステップと、を具備するようにした。 In the scalable decoding method of the present invention, a first code relating to a first band, which is a band lower than a predetermined frequency of the audio signal or the audio signal, generated by encoding the audio signal or the audio signal with a scalable encoding device. Reception step of receiving information including encoding information and second encoded information relating to a second band that is a band higher than a predetermined frequency of the audio signal, and decoding the first encoded information to generate an audio signal or A first decoding step of generating a time-domain signal having a first sampling rate corresponding to the first band of the audio signal; and generating a decoded spectrum of the second band by decoding the second encoded information in the frequency domain A predetermined second sampling rate higher than the first sampling rate is sampled using the decoded spectrum of the second band. A second decoding step for generating a decoded signal having a third sampling rate that has undergone ring rate conversion, wherein the second decoding step is a time domain of the first sampling rate obtained in the first decoding step. A first transforming step of obtaining a spectrum of the first band from a signal by frequency domain transform; a replicating step of replicating a spectrum at a specific position of the spectrum of the first band; and the second encoded information and the duplicated signal. A decoded spectrum of the second band that extends a bandwidth of the decoded spectrum of the first band using the spectrum obtained by adding the decoded spectrum of the second band to the decoded spectrum of the first band. A spectrum generating step for generating a decoded spectrum; and an extended decoding system adjacent to a maximum frequency of the extended decoded spectrum and The inserts zeros into the first high band portion of the expansion decoded spectrum located outside the vector, or the second high-band of the extended decoded spectrum located inside the adjacent and the expansion decoded spectrum to the maximum frequency A time domain signal generating step of obtaining a spectrum of a predetermined band by deleting a portion, and generating a time domain signal of the third sampling rate as the decoded signal from the spectrum of the predetermined band by time domain conversion. I tried to do it.
本発明によれば、回路規模を縮小でき、処理演算量も削減することができる。 According to the present invention, the circuit scale can be reduced and the amount of processing calculations can also be reduced.
本発明の骨子は、入力信号に対し、時間領域でサンプリング変換(特に、アップサンプリング)を行う代わりに、周波数領域でスペクトルの有効周波数帯域を拡張することにより、時間領域の信号においてアップサンプリングを行った場合と等価な信号を得ることである。 The essence of the present invention is to perform upsampling on a time domain signal by extending the effective frequency band of the spectrum in the frequency domain instead of performing sampling conversion (particularly upsampling) on the input signal. It is to obtain a signal equivalent to the case.
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.
(実施の形態1)
図1は、本発明の実施の形態1に係るスペクトル符号化装置100の主要な構成を示すブロック図である。
(Embodiment 1)
FIG. 1 is a block diagram showing the main configuration of spectrum coding apparatus 100 according to
本実施の形態に係るスペクトル符号化装置100は、サンプリングレート変換部101、入力端子102、スペクトル情報特定部106、および出力端子107を有する。また、サンプリングレート変換部101は、周波数領域変換部103、帯域拡張部104、および拡張スペクトル付与部105を有する。
Spectrum coding apparatus 100 according to the present embodiment has sampling rate conversion section 101,
スペクトル符号化装置100には、入力端子102を介し、サンプリングレートFxでサンプリングされた信号が入力される。
A signal sampled at the sampling rate Fx is input to the spectrum encoding device 100 via the
周波数領域変換部103は、この信号を分析長2・Naで周波数分析することにより時間領域の信号を周波数領域の信号に変換(周波数領域変換)し、第1スペクトルS1(k)(0≦k<Na)を算出する。そして、求められた第1スペクトルS1(k)を帯域拡張部104に与える。ここで、周波数分析は、修正離散コサイン変換(MDCT)を用いる。MDCTは、前後の隣接フレームと分析フレームを半分ずつ重ね合わせて分析を行い、分析フレームの前半部は奇関数、後半部は偶関数となる直交基底を使うことにより、フレーム間の歪がキャンセルされるという特徴がある。なお、周波数分析の方法として、離散フーリエ変換(DFT)、離散コサイン変換(DCT)等を使用することも可能である。
The frequency
帯域拡張部104は、入力された第1スペクトルS1(k)の周波数k=Na以降に新たなスペクトルを付与できるように新たな領域(周波数帯域)を確保し、第1スペクトルS1(k)の有効周波数帯域を0≦k<Nbに拡張する。この有効周波数帯域を拡張する処理については後ほど詳述する。
The
拡張スペクトル付与部105は、帯域拡張部104にて拡張された周波数帯域に外部から入力される拡張スペクトルS1’(k)(Na≦k<Nb)を付与し、スペクトル情報特定部106に出力する。
The extended
スペクトル情報特定部106は、拡張スペクトル付与部105から与えられたスペクトルのうち、拡張スペクトルS1’(k)を特定するために必要な情報を符号化コードとして出力端子107を介し出力する。この符号化コードは、拡張スペクトルS1’(k)のサブバンドエネルギーを表す情報や有効周波数帯域を表す情報等である。この詳細についても後述する。
The spectrum
次いで、上記の帯域拡張部104が第1スペクトルS1(k)の有効周波数帯域を拡張する処理の詳細について、図2を用いて説明する。
Next, details of the process in which the
図2(a)は、周波数領域変換部103より与えられる第1スペクトルS1(k)を表しており、図2(b)は、帯域拡張部104において有効周波数帯域を拡張された後のスペクトルS1(k)を表している。帯域拡張部104は、第1スペクトルS1(k)の周波数kがNa≦k<Nbの範囲で表される周波数帯域に新規のスペクトル情報を格納できる領域を確保する。この新規な領域の大きさはNb−Naで表される。
2A shows the first spectrum S1 (k) given from the frequency
ここでNbは、入力端子102を介し外部から与えられる信号のサンプリングレートFxと周波数領域変換部103の分析長2・Naと復号化部(図示せず)にて復号される信号のサンプリングレートFyとの関係から決まる。具体的には、次式
図3は、帯域拡張部104において行われたスペクトルの有効周波数帯域を拡張する処理の効果を原理的に説明するための図である。図3(a)は、サンプリングレートFxの信号を分析長2・Naで周波数分析した際に得られるスペクトルSa(k)を表している。横軸は周波数、縦軸はスペクトル強度を表す。
FIG. 3 is a diagram for explaining in principle the effect of the process of extending the effective frequency band of the spectrum performed in the
信号の有効周波数帯域は、ナイキスト定理から0〜Fx/2となる。このとき、分析長が2・Naであるので、周波数インデックスkの範囲は0≦k<Naとなり、スペクトルSa(k)の周波数解像度はFx/(2・Na)となる。他方、同一信号をサンプリングレートFyへとアップサンプリングした後に、分析長2・Nbで周波数分析して得られるスペクトルSb(k)を図3(b)に示すと、信号の有効周波数帯域は0〜Fy/2まで拡張されており、周波数インデックスkの範囲は0≦k<Nbとなる。ここで、Nbが(式1)を満足する場合、スペクトルSb(k)の周波数解像度Fy/(2・Nb)は、Fx/(2・Na)と等しくなる。すなわち、帯域0≦k<NaのスペクトルSa(k)とスペクトルSb(k)とは等しくなる。逆の見方をすると、スペクトルSa(k)(0≦k<Na)の帯域をNbまで広げたときのスペクトルSb(k)は、サンプリングFxの信号をサンプリングFyにアップサンプリングした後に、分析長2・Nbで周波数分析して得られるスペクトルと一致する、ことを意味する。この原理を利用することにより、時間領域においてアップサンプリングすることなく、アップサンプリングされた信号と等価のスペクトルを得ることができる。
The effective frequency band of the signal is 0 to Fx / 2 from the Nyquist theorem. At this time, since the analysis length is 2 · Na, the range of the frequency index k is 0 ≦ k <Na, and the frequency resolution of the spectrum Sa (k) is Fx / (2 · Na). On the other hand, when the spectrum Sb (k) obtained by frequency analysis with the
このように、サンプリングレート変換部101において、入力された時間領域の信号を周波数領域の信号に変換し、得られたスペクトルの有効周波数帯域を拡張することにより、時間領域においてアップサンプリングした信号を周波数変換して求められるスペクトルと等価なスペクトルを得ることができる。 In this way, the sampling rate conversion unit 101 converts the input time domain signal into a frequency domain signal and expands the effective frequency band of the obtained spectrum, thereby frequency-sampling the signal up-sampled in the time domain. A spectrum equivalent to the spectrum obtained by conversion can be obtained.
なお、サンプリングレート変換部101から出力される信号は周波数領域の信号であるため、時間領域の信号が必要とされる場合は、時間領域変換部を設けて時間領域への再変換を行えば良い。上記の例では、サンプリングレート変換部101はスペクトル符号化装置100内に設置されているので、時間領域の信号に戻すことなく周波数領域の信号のままスペクトル情報特定部106に入力され、符号化コードが生成される。
Since the signal output from the sampling rate conversion unit 101 is a frequency domain signal, if a time domain signal is required, a time domain conversion unit may be provided to perform reconversion to the time domain. . In the above example, since the sampling rate conversion unit 101 is installed in the spectrum encoding device 100, the signal is input to the spectrum
ここで、拡張スペクトル付与部105に入力される拡張スペクトルの選択と、スペクトル情報特定部106におけるスペクトル情報の特定の仕方とを調整することにより、スペクトル情報特定部106から出力される符号化コードの符号化率は異なってくる。すなわち、サンプリングレート変換部101内の一部の処理は符号化にも大きな影響を与えている。これは、スペクトル符号化装置100が、入力信号のサンプリングレートの変換と符号化とを同時に実現していることを意味している。
Here, by adjusting the selection of the extended spectrum input to the extended
また、ここでは説明を簡単にするために、拡張スペクトル付与部105において拡張スペクトルが元のスペクトルに付与される場合を例にとって説明したが、スペクトル情報特定部106で行われる処理は、拡張スペクトルを特定するために必要な情報を符号化コードとして出力することであるため、付与されるべき拡張スペクトルが特定されていれば充分であるので、必ずしも拡張スペクトルが実際に付与されなければならないわけではない。
In addition, here, in order to simplify the explanation, the case where the extended spectrum is added to the original spectrum in the extended
また、ここではサンプリングレート変換の一例としてアップサンプリングを例にとって説明したが、上記の原理はダウンサンプリングの場合にも適用できる。 In addition, although up sampling has been described as an example of sampling rate conversion here, the above principle can be applied to down sampling.
図4は、本実施の形態に係る符号化装置120が無線通信システムの送信側に搭載された場合の無線送信装置130の主要な構成を示すブロック図である。
FIG. 4 is a block diagram showing the main configuration of radio transmission apparatus 130 when encoding
この無線送信装置130は、符号化装置120、入力装置131、A/D変換装置132、RF変調装置133、およびアンテナ134を有する。
The wireless transmission device 130 includes an
入力装置131は、人間の耳に聞こえる音波W11を電気的信号であるアナログ信号に変換し、A/D変換装置132に出力する。A/D変換装置132は、このアナログ信号をディジタル信号に変換し、符号化装置120に出力する(信号S1)。符号化装置120は、入力されたディジタル信号S1を符号化して符号化信号を生成し、RF変調装置133に出力する(信号S2)。RF変調装置133は、符号化信号S2を変調して変調符号化信号を生成し、アンテナ134に出力する。アンテナ134は、変調符号化信号を電波W12として送信する。
The
図5は、上記の符号化装置120の内部構成を示すブロック図である。ここでは、階層符号化(スケーラブル符号化)を行う場合を例にとって説明する。
FIG. 5 is a block diagram showing an internal configuration of the
符号化装置120は、入力端子121、ダウンサンプリング部122、第1レイヤ符号化部123、第1レイヤ復号化部124、遅延部126、スペクトル符号化部100a、多重化部127、および出力端子128を有する。
The
入力端子121には、サンプリングレートFyの音響信号S1が入力される。ダウンサンプリング部122は、入力端子121を介し入力された信号S1にダウンサンプリングを施してサンプリングレートFxの信号を生成し、出力する。第1レイヤ符号化部123は、このダウンサンプリング後の信号を符号化し、得られた符号化コードを多重化部(マルチプレクサ)127に出力すると共に、第1レイヤ復号化部124にも出力する。第1レイヤ復号化部124は、この符号化コードを基に第1レイヤの復号信号を生成する。
An acoustic signal S1 having a sampling rate Fy is input to the
一方、遅延部126は、入力端子121を介し入力される信号S1に対し、所定の長さの遅延を与える。この遅延の大きさは、信号がダウンサンプリング部122、第1レイヤ符号化部123,および第1レイヤ復号化部124を介した際に生じる時間遅れと同値とする。スペクトル符号化部100aは、第1レイヤ復号化部124から出力されるサンプリングレートFxの信号S3と、遅延部126から出力されるサンプリングレートFyの信号S4とを用いてスペクトル符号化を行い、生成した符号化コードS5を多重化部127に出力する。多重化部127は、第1レイヤ符号化部123で求められる符号化コードとスペクトル符号化部100aで求められる符号化コードS5を多重化し、出力コードS2として出力端子128を介し出力する。この出力コードS2は、RF変調装置133に与えられる。
On the other hand, the
図6は、上記のスペクトル符号化部100aの内部構成を示すブロック図である。なお、このスペクトル符号化部100aは、図1に示したスペクトル符号化装置100と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
FIG. 6 is a block diagram showing an internal configuration of the
スペクトル符号化部100aの特徴は、サンプリングレートFyの入力信号S3のスペクトルを利用して、拡張スペクトルS1’(k)(Na≦k<Nb)を付与することである。これによれば、拡張スペクトルS1’(k)を決定するための目標信号が与えられるため、拡張スペクトルS1’(k)の精度が向上し、結果として品質向上につながるという効果が得られる。
A feature of the
周波数領域変換部112は、入力端子111を介し入力されたサンプリングレートFyの信号S4を分析長2・Nbにて周波数分析し、第2スペクトルS2(k)(0≦k<Nb)を求める。ここで、サンプリング周波数Fx、Fy、および分析長Na、Nbには(式1)で表される関係が成立しているものとする。
The
スペクトル情報特定部106は、拡張スペクトルS1’(k)を表す符号化コードを決定する。ここでは、拡張スペクトルS1’(k)を周波数領域変換部112にて求められた第2スペクトルS2(k)を利用して決定する。スペクトル情報特定部106は、拡張スペクトルS1’(k)の形状を決定するステップと拡張スペクトルS1’(k)のゲインを決定するステップとの2つのステップを経て符号化コードを決定する。
The spectrum
まず、拡張スペクトルS1’(k)の形状を決定するステップについて以下説明する。 First, the step of determining the shape of the extended spectrum S1 '(k) will be described below.
このステップでは、第1スペクトルS1(k)の帯域0≦k<Naを利用して、拡張スペクトルS1’(k)を決定する。その具体的な方法として、次式
また別の方法として、上記のように固定値Cではなく、ある定められた範囲TMIN〜TMAXの値をとる変数Tを用い、拡張スペクトルS1’(k)と第2スペクトルS2(k)の形状が最も類似するときの変数Tの値T’を符号化コードの一部として出力しても良い。このとき、拡張スペクトルS1’(k)は次式
次に、スペクトル情報特定部106にて行われる拡張スペクトルS1’(k)のゲインを決定するステップについて以下説明する。
Next, the step of determining the gain of the extended spectrum S1 ′ (k) performed by the spectrum
拡張スペクトルS1’(k)のゲインは、第2スペクトルS2(k)の帯域Na≦k<Nbのパワと一致するように決定される。具体的には、次式
また、拡張スペクトルS1’(k)を複数のサブバンドに分割し、それぞれのサブバンドについて独立に符号化コードを決定する態様でも良い。かかる場合、拡張スペクトルS1’(k)の形状を決定するステップにおいては、サブバンド毎に(式4)に表されるT’をそれぞれ決定して符号化コードとして出力しても良いし、共通のT’を一つだけ決定して符号化コードとして出力しても良い。そして、拡張スペクトルS1’(k)のゲインを決定するステップにおいては、サブバンド毎にパワの偏差V(j)を算出し、この値を量子化して得られるインデックスを符号化コードとして出力端子107を介して出力する。サブバンド毎のパワの変動量は、次式
なお、図6に示したような、第2スペクトルS2(k)を算出する態様とは別に、図7に示すように、サンプリングレートFyの信号をLPC分析する態様(スペクトル符号化部100b)でも良い。すなわち、サンプリングレートFyの信号をLPC分析してLPC係数を求め、このLPC係数を用いて拡張スペクトルS1’(k)を決定することもできる。この構成では、LPC係数をDFTしてスペクトル情報に変換し、このスペクトルを用いて拡張スペクトルS1’(k)を決定することができる。 In addition to the mode for calculating the second spectrum S2 (k) as shown in FIG. 6, as shown in FIG. 7, the mode (spectrum encoding unit 100b) for LPC analysis of the signal at the sampling rate Fy is also possible. good. That is, the LPC coefficient is obtained by LPC analysis of the signal of the sampling rate Fy, and the extended spectrum S1 '(k) can be determined using the LPC coefficient. In this configuration, the LPC coefficient is DFT converted into spectral information, and the extended spectrum S1 '(k) can be determined using this spectrum.
このように、本実施の形態の符号化装置によれば、符号化装置の回路規模を縮小でき、符号化の処理演算量も削減することができる。 Thus, according to the encoding apparatus of the present embodiment, the circuit scale of the encoding apparatus can be reduced, and the processing amount of encoding processing can also be reduced.
また、上記の効果の他に、スケーラブル符号化に本実施の形態の符号化装置を適用した場合には、次のようなさらなる効果が得られる。 In addition to the above effects, when the coding apparatus according to the present embodiment is applied to scalable coding, the following further effects can be obtained.
従来のように時間領域にてサンプリングレート変換を行う場合は、エイリアシングの発生を避けるために入力信号を低域通過フィルタ(以後LPFと呼ぶ)に通す必要がある。一般に、時間領域でフィルタリング処理を行うと、入力信号に対して出力信号に時間遅れ(遅延)が生じる。LPFにFIR型フィルタを適用する場合には、カットオフ特性を急峻にするためにフィルタ次数を大きくする必要があり、演算量の大幅な増加と共にフィルタ次数の半分のサンプル値に相当する時間遅れが生じてしまう。 When sampling rate conversion is performed in the time domain as in the prior art, it is necessary to pass the input signal through a low-pass filter (hereinafter referred to as LPF) in order to avoid aliasing. In general, when filtering processing is performed in the time domain, a time delay (delay) occurs in the output signal with respect to the input signal. When an FIR type filter is applied to an LPF, it is necessary to increase the filter order in order to make the cut-off characteristic steep, and a time delay corresponding to a sample value that is half the filter order increases with a large increase in the amount of calculation. It will occur.
例えば、サンプリング周波数Fs=24kHzの信号に対して256次のフィルタを適用した場合には、サンプリングレート変換だけで5ms以上の遅延が生じる。こういった遅延の発生は、双方向音声通話へ適用した場合、通話相手の反応が遅くなったように感じてしまい問題である。 For example, when a 256th-order filter is applied to a signal having a sampling frequency Fs = 24 kHz, a delay of 5 ms or more occurs only by sampling rate conversion. The occurrence of such a delay is a problem when it is applied to a two-way voice call and it feels that the reaction of the other party has been delayed.
また、LPFにIIR型フィルタを使用した場合には、比較的次数を少なくしてもカットオフ特性を急峻にすることができ、かつFIR型フィルタほど遅延が大きくなることはない。しかし、IIR型フィルタではFIR型フィルタのように全周波数で生じる遅延量が一定となるフィルタを設計することができない。これは、スケーラブル符号化において、入力信号からサンプリングレート変換後の信号を減算するときに、サンプリングレート変換後の信号の時間遅れに合わせて入力信号に一定の遅延量を与える必要があるが、IIR型のLPFを用いた場合には周波数に対する遅延量が一定でないため、その減算処理が的確に行えないという問題が生じる。 Further, when an IIR filter is used for the LPF, the cut-off characteristic can be made steep even if the order is relatively reduced, and the delay is not increased as much as the FIR filter. However, an IIR filter cannot design a filter in which the amount of delay generated at all frequencies is constant, unlike an FIR filter. In scalable coding, when subtracting the signal after sampling rate conversion from the input signal, it is necessary to give a certain delay amount to the input signal in accordance with the time delay of the signal after sampling rate conversion. When the type LPF is used, the amount of delay with respect to the frequency is not constant, so that there is a problem that the subtraction process cannot be performed accurately.
本実施の形態の符号化装置は、スケーラブル符号化において発生するこれらの問題点を解消することができる。 The encoding apparatus according to the present embodiment can solve these problems that occur in scalable encoding.
図8は、無線送信装置130から送信された信号を受信する無線受信装置180の主要な構成を示すブロック図である。 FIG. 8 is a block diagram showing the main configuration of radio receiving apparatus 180 that receives a signal transmitted from radio transmitting apparatus 130.
この無線受信装置180は、アンテナ181、RF復調装置182、復号化装置170、D/A変換装置183、および出力装置184を有している。
The wireless reception device 180 includes an
アンテナ181は、電波W12としてのディジタルの符号化音響信号を受けて電気信号のディジタルの受信符号化音響信号を生成してRF復調装置182に与える。RF復調装置182は、アンテナ181からの受信符号化音響信号を復調して復調符号化音響信号S11を生成して復号化装置170に与える。
The
復号化装置170は、RF復調装置182からのディジタルの復調符号化音響信号S11を受けて復号化処理を行ってディジタルの復号化音響信号S12を生成してD/A変換装置183に与える。D/A変換装置183は、復号化装置170からのディジタルの復号化音響信号S12を変換してアナログの復号化音声信号を生成して出力装置184に与える。出力装置184は、電気的信号であるアナログの復号化音声信号を空気の振動に変換して音波W13として人間の耳に聴こえるように出力する。
The
図9は、上記の復号化装置170の内部構成を示すブロック図である。ここでも、階層符号化された信号を復号する場合を例にとって説明する。
FIG. 9 is a block diagram showing an internal configuration of the
この復号化装置170は、入力端子171、分離部172、第1レイヤ復号化部173、スペクトル復号化部150、および出力端子176を有する。
The
入力端子171には、RF復調装置182から階層符号化されたコードS11が入力される。分離部172は、入力端子171を介し入力された復調符号化音響信号S11を分離し、第1レイヤ復号化部173用の符号化コードとスペクトル復号化部150用の符号化コードとを生成する。第1レイヤ復号化部173は、分離部172で得られた符号化コードを用いてサンプリングレートFxの復号信号を復号し、この復号信号S13をスペクトル復号化部150に与える。スペクトル復号化部150は、分離部172で分離された符号化コードS14と第1レイヤ復号化部173で生成されたサンプリングレートFxの信号S13に対し、後述するスペクトル復号化を行い、サンプリングレートFyの復号信号S12を生成し、出力端子176を介しこれを出力する。
The
図10は、上記のスペクトル復号化部150の内部構成を示すブロック図である。
FIG. 10 is a block diagram showing an internal configuration of the
このスペクトル復号化部150は、入力端子152、153、周波数領域変換部154、帯域拡張部155、復号部156、結合部157、時間領域変換部158、および出力端子159を有する。
The
入力端子152には、サンプリングレートFxでサンプリングされた信号S13が入力される。また、入力端子153には、拡張スペクトルS1’(k)に関する符号化コードS14が入力される。
A signal S13 sampled at the sampling rate Fx is input to the
周波数領域変換部154は、入力端子152から入力された時間領域信号S13に対し分析長2・Naで周波数分析を行い、第1スペクトルS1(k)を算出する。周波数分析法は、修正離散コサイン変換(MDCT)を用いる。MDCTは、前後の隣接フレームと分析フレームを半分ずつ重ね合わせて分析を行い、分析フレームの前半部は奇関数、後半部は偶関数となる直交基底を使うことにより、フレーム間の歪がキャンセルされるという特徴がある。このようにして求められた第1スペクトルS1(k)は、帯域拡張部155に与えられる。なお、周波数分析法としては、離散フーリエ変換(DFT)、離散コサイン変換(DCT)等を使用することも可能である。
The frequency
帯域拡張部155は、入力された第1スペクトルS1(k)の周波数k=Na以降に新たにスペクトルを付与できるような領域を確保し、第1スペクトルS1(k)の帯域が0≦k<Nbとなるようにする。帯域が拡張された第1スペクトルS1(k)は、結合部157に出力される。
The
一方、復号部156は、入力端子153を介し入力された拡張スペクトルS1’(k)に関する符号化コードS14を復号して、拡張スペクトルS1’(k)を得て、結合部157に出力する。
On the other hand, the
結合部157は、帯域拡張部155より与えられた第1スペクトルS1(k)と拡張スペクトルS1’(k)を結合させる。この結合は、第1スペクトルS1(k)の帯域Na≦k<Nbに拡張スペクトルS1’(k)を挿入することにより実現される。この処理により得られる第1スペクトルS1(k)は、時間領域変換部158に出力される。
The combining
時間領域変換部158は、スペクトル符号化部100aで施された周波数領域変換の逆変換に相当する時間領域変換処理を施し、適切な窓関数の乗算および重ね合わせ加算を経て、時間領域の信号S12を生成する。このようにして生成された時間領域の信号S12は、復号信号として出力端子159を介して出力される。
The time
次いで、帯域拡張部155で行われる処理について、図11を用いて説明する。
Next, processing performed by the
図11(a)は、周波数領域変換部154より与えられる第1スペクトルS1(k)を表す。図11(b)は、帯域拡張部155の処理の結果得られるスペクトルを表し、周波数kがNa≦k<Nbの範囲で表される帯域に新規のスペクトル情報を格納できる領域が確保される。この新規領域の大きさはNb−Naで表される。Nbは、入力端子152から与えられる信号のサンプリングレートFxと、周波数領域変換部154の分析長2・Naと、スペクトル復号化部150にて復号される信号のサンプリングレートFyとの間の関係に依存し、次式
図12は、スペクトルが結合部157および時間領域変換部158における処理を経てどのように復号信号が生成されるかを示した図である。
FIG. 12 is a diagram showing how a spectrum is subjected to processing in the combining
結合部157は、帯域が拡張された第1スペクトルS1(k)のNa≦k<Nbの帯域に拡張スペクトルS1’(k)(Na≦k<Nb)を挿入し、これにより得られる結合後の第1スペクトルS1(k)(0≦k<Nb)を時間領域変換部158に送る。時間領域変換部158は、時間領域の復号信号を生成し、これによりサンプリングレートFS(=Fx・Nb/Na)の復号信号を得ることができる。
The combining
このように、本実施の形態の復号化装置によれば、本実施の形態に係る符号化装置によって符号化された信号を復号することができる。 Thus, according to the decoding apparatus of the present embodiment, it is possible to decode the signal encoded by the encoding apparatus according to the present embodiment.
なお、ここでは、本実施の形態に係る符号化装置または復号化装置が無線通信システムに適用される場合を例にとって説明したが、本実施の形態に係る符号化装置または復号化装置は、以下に示すように、有線通信システムにも適用することができる。 Here, the case where the encoding apparatus or decoding apparatus according to the present embodiment is applied to a wireless communication system has been described as an example, but the encoding apparatus or decoding apparatus according to the present embodiment is described below. As shown in FIG. 6, the present invention can also be applied to a wired communication system.
図13(a)は、本実施の形態に係る符号化装置が有線通信システムに適用された場合の送信側の主要な構成を示したブロック図である。なお、図4に示した構成要素と同一のものには同一の符号を付し、その説明を省略する。 FIG. 13A is a block diagram showing a main configuration on the transmission side when the coding apparatus according to the present embodiment is applied to a wired communication system. The same components as those shown in FIG. 4 are denoted by the same reference numerals, and the description thereof is omitted.
有線送信装置140は、符号化装置120、入力装置131、およびA/D変換装置132を有し、出力がネットワークN1に接続されている。
The wired transmission device 140 includes an
A/D変換装置132の入力端子は、入力装置131の出力端子に接続されている。符号化装置120の入力端子は、A/D変換装置132の出力端子に接続されている。符号化装置120の出力端子はネットワークN1に接続されている。
The input terminal of the A /
入力装置131は、人間の耳に聞こえる音波W11を電気的信号であるアナログ信号に変換してA/D変換装置132に与える。A/D変換装置132は、アナログ信号をディジタル信号に変換して符号化装置120に与える。符号化装置120は、入力されてくるディジタル信号を符号化してコードを生成し、ネットワークN1に出力する。
The
図13(b)は、本実施の形態に係る復号化装置が有線通信システムに適用された場合の受信側の主要な構成を示したブロック図である。なお、図8に示した構成要素と同一のものには同一の符号を付し、その説明を省略する。 FIG. 13B is a block diagram showing a main configuration on the receiving side when the decoding apparatus according to the present embodiment is applied to a wired communication system. In addition, the same code | symbol is attached | subjected to the same thing as the component shown in FIG. 8, and the description is abbreviate | omitted.
有線受信装置190は、ネットークN1に接続されている受信装置191、復号化装置170、D/A変換装置183、および出力装置184を有している。
The wired receiving device 190 includes a receiving
受信装置191の入力端子は、ネットワークN1に接続されている。復号化装置170の入力端子は、受信装置191の出力端子に接続されている。D/A変換装置183の入力端子は、復号化装置170の出力端子に接続されている。出力装置184の入力端子は、D/A変換装置183の出力端子に接続されている。
The input terminal of the receiving
受信装置191は、ネットワークN1からのディジタルの符号化音響信号を受けてディジタルの受信音響信号を生成して復号化装置170に与える。復号化装置170は、受信装置191からの受信音響信号を受けてこの受信音響信号に復号化処理を行ってディジタルの復号化音響信号を生成してD/A変換装置183に与える。D/A変換装置183は、復号化装置170からのディジタルの復号音声信号を変換してアナログの復号音声信号を生成して出力装置184に与える。出力装置184は、電気的信号であるアナログの復号音響信号を空気の振動に変換して音波W13として人間の耳に聴こえるように出力する。
The receiving
このように、上記の構成によれば、上記の無線送受信装置と同様の作用効果を有する有線送受信装置を提供することができる。 Thus, according to said structure, the wired transmission / reception apparatus which has the same effect as said wireless transmission / reception apparatus can be provided.
(実施の形態2)
図14は、本発明の実施の形態2に係る復号化装置270の主要な構成を示すブロック図である。なお、この復号化装置270は、図9に示した復号化装置170と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
(Embodiment 2)
FIG. 14 is a block diagram showing the main configuration of
本実施の形態の特徴は、結合後の第1スペクトルS1(k)(0≦k<Nb)の最大周波数インデックスNbを所望の値Ncに修正することにより、所望のサンプリングレートにて復号信号を生成することである。 The feature of this embodiment is that the decoded signal is converted at a desired sampling rate by correcting the maximum frequency index Nb of the combined first spectrum S1 (k) (0 ≦ k <Nb) to a desired value Nc. Is to generate.
スペクトル復号化部250は、分離部172で分離された符号化コードS14、第1レイヤ復号化部173で生成されたサンプリングレートFxの信号S13、および入力端子271を介し入力された係数Nc(信号S21)を用いて、スペクトル復号化を行う。そして、得られたサンプリングレートFyの復号信号を出力端子176を介し出力する。スペクトル復号化部250における周波数領域変換の分析長が2・Naであるとき、復号信号のサンプリングレートFyはFy=Fx・Nc/Naで表される。
The
図15は、上記のスペクトル復号化部250の内部構成を示すブロック図である。
FIG. 15 is a block diagram showing the internal configuration of the
入力端子271を介し入力された係数Ncは、修正部251および時間領域変換部158aに与えられる。
The coefficient Nc input via the
修正部251は、結合部157より与えられる第1スペクトルS1(k)(0≦k<Nb)の有効な帯域を、入力端子271を介し与えられた係数Nc(信号S21)に基づいて0≦k<Ncに修正する。そして、帯域修正後の第1スペクトルS1(k)(0≦k<Nc)を時間領域変換部158aに与える。
The correcting
時間領域変換部158aは、入力端子271を介し与えられた係数Ncに従い、分析長2・Ncの下で修正部251から与えられる第1スペクトルS1(k)(0≦k<Nc)に対し変換処理を施し、適切な窓関数の乗算および重ね合わせ加算を行い、時間領域の信号を生成して出力端子159を介して出力する。この復号信号のサンプリングレートは、FS=Fx・Nc/Naとなる。
The time
図16および図17は、修正部251の処理をより詳細に説明するための図である。
16 and 17 are diagrams for explaining the processing of the
図16は、Nc<Nbの場合における修正部251の処理を表している。結合部157から与えられる第1スペクトルS1(k)(信号S21)の帯域は、0≦k<Nbとなっている。そこで、修正部251は、この第1スペクトルS1(k)の帯域が0≦k<Ncとなるように、Nc≦k<Nbの範囲のスペクトルを削除する。この結果得られる第1スペクトルS1(k)(0≦k<Nc)(信号S22)を時間領域変換部158aに与え、時間領域の復号信号S23が生成される。この復号信号S23のサンプリングレートは、FS=Fx・Nc/Naとなる。
FIG. 16 shows the processing of the
図17は、同様に修正部251の処理であるが、Nc>Nbの場合の処理を表している。結合部251から与えられる第1スペクトルS1(k)(信号S25)の帯域は、図16と同様に0≦k<Nbとなっている。修正部251は、この第1スペクトルS1(k)の帯域が0≦k<NcとなるようにNb≦k<Ncの帯域を拡張し、その領域に特定の値(例えば、ゼロ値)を付与する。この結果得られる第1スペクトルS1(k)(0≦k<Nc)(信号S26)を時間領域変換部158aに与え、時間領域の復号信号S27が生成される。この復号信号S27のサンプリングレートは、FS=Fx・Nc/Naとなる。
FIG. 17 similarly shows the processing of the
図18および図19を用いて、スペクトル復号化部250の動作をさらに説明する。
The operation of the
まず、入力端子153を介し入力される符号化コードがフレーム毎に変動していることを想定する。すなわち、結合部157から出力される第1スペクトルS1(k)の帯域には、図18に示されるような0≦k<Na(帯域R1)、0≦k<Nb1(帯域R2)、0≦k<Nb2(帯域R3)の3通りの帯域が存在し(ただし、Na<Nb1<Nb2)、フレーム毎にこれらの帯域の内の一つが選択されているものとする。
First, it is assumed that the encoded code input via the
図19(a)は、係数NcがNb2に等しい場合のスペクトル復号化部250の動作、図19(b)は、係数NcがNb1に等しい場合のスペクトル復号化部250の動作を説明するための図である。
FIG. 19A illustrates the operation of the
これらの図では、第iフレームで得られるスペクトルの帯域が、R1、R2、R3のいずれかであることを表している。また、処理1はNb1≦k<Nb2の帯域にゼロ値を挿入する処理、処理2はNa≦k<Nb2の帯域にゼロ値を挿入する処理、処理3はNb1≦k<Nb2の帯域を削除する処理、処理4はNa≦k<Nb1の帯域にゼロ値を挿入する処理を表している。
In these figures, the spectrum band obtained in the i-th frame is any one of R1, R2, and R3.
まず、図19(a)の場合について説明する。 First, the case of FIG. 19A will be described.
この図において、第0フレーム〜第1フレームおよび第7フレーム〜第8フレームではスペクトルの帯域がR3、すなわち第1スペクトルS1(k)の帯域が0≦k<Nb2であるため、修正部251は何の処理も施さずに第1スペクトルS1(k)(0≦k<Nb2)を時間領域変換部158aに出力する。
In this figure, since the spectrum band is R3 in the 0th frame to the 1st frame and the 7th frame to the 8th frame, that is, the band of the first spectrum S1 (k) is 0 ≦ k <Nb2, the
また、第2フレーム〜第4フレームおよび第9フレームではスペクトルの帯域がR2、すなわち第1スペクトルS1(k)の帯域が0≦k<Nb1であるため、修正部251は第1スペクトルS1(k)の帯域をNb2まで拡張し、かつNb1≦k<Nb2の帯域にゼロ値を挿入した後に、第1スペクトルS1(k)(0≦k<Nb2)を時間領域変換部158aに出力する。
Further, in the second to fourth frames and the ninth frame, the spectrum band is R2, that is, the band of the first spectrum S1 (k) is 0 ≦ k <Nb1, and therefore the correcting
一方、第5フレーム〜第6フレームではスペクトルの帯域がR1、すなわち第1スペクトルS1(k)の帯域が0≦k<Naであるため、修正部251は第1スペクトルS1(k)の帯域をNb2まで拡張し、かつNa≦k<Nb2の範囲にゼロ値を挿入した後に、第1スペクトルS1(k)(0≦k<Nb2)を時間領域変換部158aに出力する。
On the other hand, in the fifth to sixth frames, the spectrum band is R1, that is, the band of the first spectrum S1 (k) is 0 ≦ k <Na. Therefore, the
次に、図19(b)の場合について説明する。 Next, the case of FIG. 19B will be described.
この図において、第2フレーム〜第4フレームおよび第9フレームではスペクトルの帯域がR2、すなわち第1スペクトルS1(k)の帯域が0≦k<Nb1であるため、修正部251は何の処理も施さずに第1スペクトルS1(k)(0≦k<Nb1)を時間領域変換部158aに出力する。
In this figure, in the second to fourth frames and the ninth frame, since the spectrum band is R2, that is, the band of the first spectrum S1 (k) is 0 ≦ k <Nb1, the
また、第0フレーム〜第1フレームおよび第7フレーム〜第8フレームではスペクトルの帯域がR3、すなわち第1スペクトルS1(k)の帯域が0≦k<Nb2であるため、修正部251はNb1≦k<Nb2の帯域を削除した後に、第1スペクトルS1(k)(0≦k<Nb1)を時間領域変換部158aに出力する。
Also, in the 0th frame to the 1st frame and the 7th frame to the 8th frame, the spectrum band is R3, that is, the band of the first spectrum S1 (k) is 0 ≦ k <Nb2, so the
一方、第5フレーム〜第6フレームではスペクトルの帯域がR1、すなわち第1スペクトルS1(k)の帯域が0≦k<Naであるため、修正部251は第1スペクトルS1(k)の帯域をNb1まで拡張し、かつNa≦k<Nb1の帯域にゼロ値を挿入した後に、第1スペクトルS1(k)(0≦k<Nb1)を時間領域変換部158aに出力する。
On the other hand, in the fifth to sixth frames, the spectrum band is R1, that is, the band of the first spectrum S1 (k) is 0 ≦ k <Na. Therefore, the
このように、本実施の形態によれば、受信される第1スペクトルS1(k)の有効な周波数帯域が時間的に変動する場合でも、適切な係数Ncを与えることにより、所望のサンプリングレートの復号信号を安定して得ることができる。 As described above, according to the present embodiment, even when the effective frequency band of the received first spectrum S1 (k) fluctuates with time, by giving an appropriate coefficient Nc, a desired sampling rate can be obtained. The decoded signal can be obtained stably.
(実施の形態3)
図20は、本発明の実施の形態3に係る通信システムの主要な構成を示す図である。
(Embodiment 3)
FIG. 20 is a diagram showing a main configuration of a communication system according to
本実施の形態の特徴は、通信ネットワークの状況(通信環境)によって受信側で受信される第1スペクトルS1(k)の有効周波数帯域が時間的に変動する場合に対処することである。 The feature of this embodiment is to cope with a case where the effective frequency band of the first spectrum S1 (k) received on the receiving side varies with time depending on the situation (communication environment) of the communication network.
階層符号化部301は、サンプリングレートFyの入力信号に対し、実施の形態1で示した階層符号化処理を施し、スケーラブルな符号化コードを生成する。ここでは、生成される符号化コードが、帯域0≦k<Neに関する情報(R31)、帯域Ne≦k<Nfに関する情報(R32)、および帯域Nf≦k<Ngに関する情報(R33)により構成されるものとする。階層符号化部301は、この符号化コードをネットワーク制御部302に与える。
ネットワーク制御部302は、階層符号化部301より与えられる符号化コードを階層復号化部303に転送する。ここで、ネットワーク制御部302は、ネットワークの状況に応じて階層復号化部303に転送する符号化コードの一部を廃棄する。そのため、階層復号化部303に入力される符号化コードは、廃棄される符号化コードが全くない場合は情報R31〜R33により構成された符号化コード、情報R33の符号化コードが廃棄される場合は情報R31およびR32により構成された符号化コード、情報R32およびR33の符号化コードが廃棄される場合は情報R31により構成された符号化コード、のいずれかとなる。
The
階層復号化部303は、与えられた符号化コードに対し、実施の形態1または実施の形態2に示した階層復号化方法を適用して復号信号を生成する。なお、階層復号化部303に実施の形態1を適用した場合には、出力される復号信号のサンプリングレートFzは、Fyとなる(Fz=Fy・Ng/Ngのため)。また、階層復号化部303に実施の形態2を適用した場合には、所望の係数Ncによって復号信号のサンプリングレートを設定することができ、その復号信号のサンプリングレートFzは、Fy・Nc/Ngとなる。
このように、本実施の形態によれば、通信ネットワークの状況によって受信側で受信される第1スペクトルS1(k)の有効周波数帯域が時間的に変動する場合でも、受信側は所望のサンプリングレートの復号信号を安定して求めることができる。 As described above, according to the present embodiment, even when the effective frequency band of the first spectrum S1 (k) received on the receiving side varies with time depending on the state of the communication network, the receiving side has a desired sampling rate. Can be obtained stably.
(実施の形態4)
図21は、本発明の実施の形態4に係る通信システムの主要な構成を示す図である。
(Embodiment 4)
FIG. 21 is a diagram showing a main configuration of a communication system according to
本実施の形態の特徴は、1つの階層符号部により生成された1つの符号化コードを、それぞれ復号可能なサンプリングレートの異なる(復号能力の異なる)複数の階層復号化部に対して同時に送信しても、受信側がこれに対応し、それぞれ異なるサンプリングレートの復号信号を得ることである。 A feature of this embodiment is that one encoded code generated by one hierarchical encoder is simultaneously transmitted to a plurality of hierarchical decoders having different decoding rates (different decoding capabilities). However, the receiving side responds to this and obtains decoded signals having different sampling rates.
階層符号化部401は、サンプリングレートFyの入力信号に対して実施の形態1に示した符号化処理を施し、スケーラブルな符号化コードを生成する。ここでは、生成される符号化コードは、帯域0≦k<Nhに関する情報(R41)、帯域Nh≦k<Niに関する情報(R42)、帯域Ni≦k<Njに関する情報(R43)により構成されるものとする。階層符号化部401は、この符号化コードを、第1階層復号化部402−1、第2階層復号化部402−2、第3階層復号化部402−3にそれぞれ与える。
第1階層復号化部402−1、第2階層復号化部402−2、および第3階層復号化部402−3は、与えられた符号化コードに対し、実施の形態1または実施の形態2に示した階層復号化法を適用して復号信号を生成する。第1階層復号化部402−1は係数Nc=Njとしたときの復号化処理、第2階層復号化部402−2は係数Nc=Niとしたときの復号化処理、第3階層復号化部402−3は係数Nc=Nhとしたときの復号化処理を行う。 First layer decoding section 402-1, second layer decoding section 402-2, and third layer decoding section 402-3 perform the first or second embodiment on the given encoded code. The decoded signal is generated by applying the hierarchical decoding method shown in FIG. First hierarchy decoding section 402-1 is a decoding process when coefficient Nc = Nj, second hierarchy decoding section 402-2 is a decoding process when coefficient Nc = Ni, and third hierarchy decoding section 402-3 performs a decoding process when the coefficient Nc = Nh.
第1階層復号化部402−1は、係数Nc=Njとしたときの復号化処理を行い、復号信号を生成する。この復号信号のサンプリングレートF1はFyとなる(F1=Fy・Nj/Njのため)。 First layer decoding section 402-1 performs a decoding process when coefficient Nc = Nj, and generates a decoded signal. The sampling rate F1 of this decoded signal is Fy (because F1 = Fy · Nj / Nj).
第2階層復号化部402−2は、係数Nc=Niとしたときの復号化処理を行い、復号信号を生成する。この復号信号のサンプリングレートF2はFy・Ni/Njとなる。 Second layer decoding section 402-2 performs a decoding process when coefficient Nc = Ni, and generates a decoded signal. The sampling rate F2 of this decoded signal is Fy · Ni / Nj.
第3階層復号化部402−3は、係数Nc=Nhとしたときの復号化処理を行い、復号信号を生成する。この復号信号のサンプリングレートF3はFy・Nh/Njとなる。 Third layer decoding section 402-3 performs a decoding process when coefficient Nc = Nh, and generates a decoded signal. The sampling rate F3 of this decoded signal is Fy · Nh / Nj.
このように、本実施の形態によれば、送信側は受信側の復号能力を考慮することなく符号化コードを送信することができるので、通信ネットワークの負荷を抑えることができる。また、これら複数種類のサンプリングレートの復号信号は、簡易な構成かつ少ない演算量で生成することができる。 As described above, according to the present embodiment, the transmitting side can transmit the encoded code without considering the decoding capability of the receiving side, so that the load on the communication network can be suppressed. Also, the decoded signals of these plural types of sampling rates can be generated with a simple configuration and a small amount of calculation.
本発明は、移動体通信システムにおける通信端末装置および基地局装置に適用することも可能であり、これにより上記と同様の作用効果を有する通信端末装置および基地局装置を提供することができる。 The present invention can also be applied to a communication terminal apparatus and a base station apparatus in a mobile communication system, thereby providing a communication terminal apparatus and a base station apparatus having the same effects as described above.
なお、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、ソフトウェアで実現することも可能である。 Here, although the case where the present invention is configured by hardware has been described as an example, it can also be realized by software.
本発明は、簡易な構成および少ない演算量でスケーラブル符号化を実現する効果を有し、IPネットワーク等の通信システムの用途に適用できる。 The present invention has the effect of realizing scalable coding with a simple configuration and a small amount of computation, and can be applied to the use of a communication system such as an IP network.
103、112、154 周波数領域変換部
104、155 帯域拡張部
105 拡張スペクトル付与部
106 スペクトル情報特定部
113 LPC分析部
156 復号部
157 結合部
158 時間領域変換部
251 修正部
103, 112, 154 Frequency
Claims (2)
前記第1符号化情報を復号して音声信号またはオーディオ信号の前記第1帯域に相当する第1サンプリングレートの時間領域信号を生成する第1復号化手段と、
前記第2符号化情報を周波数領域で復号して前記第2帯域の復号スペクトルを生成し、前記第2帯域の復号スペクトルを用いて前記第1サンプリングレートよりも大きい所定の第2サンプリングレートをサンプリングレート変換した第3サンプリングレートの復号信号を生成する第2復号化手段と、を具備し、
前記第2復号化手段は、
前記第1復号化手段で得られる前記第1サンプリングレートの時間領域信号から、周波数領域変換によって前記第1帯域のスペクトルを得る第1変換手段と、
前記第1帯域のスペクトルの特定の位置のスペクトルを複製する複製手段と、
前記第2符号化情報と前記複製されたスペクトルとを用いて前記第1帯域の復号スペクトルの帯域幅を拡張する前記第2帯域の復号スペクトルを生成し、前記第2帯域の復号スペクトルを前記第1帯域の復号スペクトルに付加して拡張復号スペクトルを生成するスペクトル生成手段と、
前記拡張復号スペクトルの最大周波数に隣接し且つ前記拡張復号スペクトルの外部に位置する前記拡張復号スペクトルの第1の高域部にゼロを挿入、または、前記最大周波数に隣接し且つ前記拡張復号スペクトルの内部に位置する前記拡張復号スペクトルの第2の高域部を削除して所定の帯域のスペクトルを得、前記所定の帯域のスペクトルから、時間領域変換によって前記第3サンプリングレートの時間領域信号を前記復号信号として生成する時間領域信号生成手段と、
を具備するスケーラブル復号化装置。 First encoding information relating to a first band, which is a band lower than a predetermined frequency of the audio signal or the audio signal, generated by encoding the audio signal or the audio signal with a scalable encoding device, and a predetermined value of the audio signal Receiving means for receiving information including the second encoded information relating to the second band, which is a band higher than the frequency of
First decoding means for decoding the first encoded information to generate a time-domain signal having a first sampling rate corresponding to the first band of the audio signal or audio signal;
The second encoded information is decoded in a frequency domain to generate a decoded spectrum of the second band, and a predetermined second sampling rate higher than the first sampling rate is sampled using the decoded spectrum of the second band Second decoding means for generating a decoded signal of the third sampling rate subjected to rate conversion,
The second decoding means includes
First transform means for obtaining a spectrum of the first band by frequency domain transform from a time domain signal of the first sampling rate obtained by the first decoding means;
Replicating means for replicating a spectrum at a specific position of the spectrum of the first band;
The second encoded information and the duplicated spectrum are used to generate a decoded spectrum of the second band that expands a bandwidth of the decoded spectrum of the first band, and the decoded spectrum of the second band is Spectrum generating means for generating an extended decoded spectrum by adding to one band of decoded spectrum;
A zero is inserted in the first high band part of the extended decoded spectrum that is adjacent to the maximum frequency of the extended decoded spectrum and outside the extended decoded spectrum, or is adjacent to the maximum frequency and of the extended decoded spectrum . The second high-frequency part of the extended decoded spectrum located inside is deleted to obtain a spectrum of a predetermined band, and the time-domain signal of the third sampling rate is obtained from the spectrum of the predetermined band by time-domain transformation. Time domain signal generating means for generating a decoded signal;
A scalable decoding device comprising:
前記第1符号化情報を復号して音声信号またはオーディオ信号の前記第1帯域に相当する第1サンプリングレートの時間領域信号を生成する第1復号化ステップと、
前記第2符号化情報を周波数領域で復号して前記第2帯域の復号スペクトルを生成し、前記第2帯域の復号スペクトルを用いて前記第1サンプリングレートよりも大きい所定の第2サンプリングレートをサンプリングレート変換した第3サンプリングレートの復号信号を生成する第2復号化ステップと、を具備し、
前記第2復号化ステップは、
前記第1復号化ステップで得られる前記第1サンプリングレートの時間領域信号から、周波数領域変換によって前記第1帯域のスペクトルを得る第1変換ステップと、
前記第1帯域のスペクトルの特定の位置のスペクトルを複製する複製ステップと、
前記第2符号化情報と前記複製されたスペクトルとを用いて前記第1帯域の復号スペクトルの帯域幅を拡張する前記第2帯域の復号スペクトルを生成し、前記第2帯域の復号スペクトルを前記第1帯域の復号スペクトルに付加して拡張復号スペクトルを生成するスペクトル生成ステップと、
前記拡張復号スペクトルの最大周波数に隣接し且つ前記拡張復号スペクトルの外部に位置する前記拡張復号スペクトルの第1の高域部にゼロを挿入、または、前記最大周波数に隣接し且つ前記拡張復号スペクトルの内部に位置する前記拡張復号スペクトルの第2の高域部を削除して所定の帯域のスペクトルを得、前記所定の帯域のスペクトルから、時間領域変換によって前記第3サンプリングレートの時間領域信号を前記復号信号として生成する時間領域信号生成ステップと、
を具備するスケーラブル復号化方法。 First encoding information relating to a first band, which is a band lower than a predetermined frequency of the audio signal or the audio signal, generated by encoding the audio signal or the audio signal with a scalable encoding device, and a predetermined value of the audio signal A reception step of receiving information including second encoded information relating to a second band that is a band higher than the frequency of
A first decoding step of decoding the first encoded information to generate a time-domain signal having a first sampling rate corresponding to the first band of the audio signal or the audio signal;
The second encoded information is decoded in a frequency domain to generate a decoded spectrum of the second band, and a predetermined second sampling rate higher than the first sampling rate is sampled using the decoded spectrum of the second band A second decoding step for generating a rate-converted third sampling rate decoded signal,
The second decoding step includes
A first transforming step of obtaining a spectrum of the first band by a frequency domain transform from a time domain signal of the first sampling rate obtained in the first decoding step;
A duplication step of duplicating a spectrum at a specific position of the spectrum of the first band;
The second encoded information and the duplicated spectrum are used to generate a decoded spectrum of the second band that expands a bandwidth of the decoded spectrum of the first band, and the decoded spectrum of the second band is A spectrum generating step of generating an extended decoded spectrum by adding to the decoded spectrum of one band;
A zero is inserted in the first high band part of the extended decoded spectrum that is adjacent to the maximum frequency of the extended decoded spectrum and outside the extended decoded spectrum, or is adjacent to the maximum frequency and of the extended decoded spectrum . The second high-frequency part of the extended decoded spectrum located inside is deleted to obtain a spectrum of a predetermined band, and the time-domain signal of the third sampling rate is obtained from the spectrum of the predetermined band by time-domain transformation. A time domain signal generation step for generating as a decoded signal;
A scalable decoding method comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009204962A JP5031006B2 (en) | 2009-09-04 | 2009-09-04 | Scalable decoding apparatus and scalable decoding method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009204962A JP5031006B2 (en) | 2009-09-04 | 2009-09-04 | Scalable decoding apparatus and scalable decoding method |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003341717A Division JP4679049B2 (en) | 2003-09-30 | 2003-09-30 | Scalable decoding device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010020333A JP2010020333A (en) | 2010-01-28 |
JP5031006B2 true JP5031006B2 (en) | 2012-09-19 |
Family
ID=41705206
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009204962A Expired - Lifetime JP5031006B2 (en) | 2009-09-04 | 2009-09-04 | Scalable decoding apparatus and scalable decoding method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5031006B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5353748B2 (en) * | 2010-02-18 | 2013-11-27 | 株式会社Jvcケンウッド | Noise removing apparatus and noise removing method |
US9767823B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and detecting a watermarked signal |
US9767822B2 (en) * | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and decoding a watermarked signal |
KR102083200B1 (en) | 2016-01-22 | 2020-04-28 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | Apparatus and method for encoding or decoding multi-channel signals using spectrum-domain resampling |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3139602B2 (en) * | 1995-03-24 | 2001-03-05 | 日本電信電話株式会社 | Acoustic signal encoding method and decoding method |
SE512719C2 (en) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | A method and apparatus for reducing data flow based on harmonic bandwidth expansion |
US6226616B1 (en) * | 1999-06-21 | 2001-05-01 | Digital Theater Systems, Inc. | Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility |
JP3538122B2 (en) * | 2000-06-14 | 2004-06-14 | 株式会社ケンウッド | Frequency interpolation device, frequency interpolation method, and recording medium |
JP3926726B2 (en) * | 2001-11-14 | 2007-06-06 | 松下電器産業株式会社 | Encoding device and decoding device |
JP2003216199A (en) * | 2001-11-15 | 2003-07-30 | Matsushita Electric Ind Co Ltd | Decoder, decoding method and program distribution medium therefor |
JP2003241799A (en) * | 2002-02-15 | 2003-08-29 | Nippon Telegr & Teleph Corp <Ntt> | Sound encoding method, decoding method, encoding device, decoding device, encoding program, and decoding program |
-
2009
- 2009-09-04 JP JP2009204962A patent/JP5031006B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2010020333A (en) | 2010-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4679049B2 (en) | Scalable decoding device | |
KR102054606B1 (en) | Encoding Multiple Audio Signals | |
JP4954069B2 (en) | Post filter, decoding device, and post filter processing method | |
KR101835156B1 (en) | Signal processing apparatus and method, and program | |
KR20070012832A (en) | Encoding device, decoding device, and method thereof | |
JP2000305599A (en) | Speech synthesizing device and method, telephone device, and program providing media | |
WO2006049204A1 (en) | Encoder, decoder, encoding method, and decoding method | |
CN102576537B (en) | Method and apparatus for processing audio signals | |
KR20060135699A (en) | Signal decoding apparatus and signal decoding method | |
US20070213976A1 (en) | Method and apparatus for transmitting wideband speech signals | |
WO2005027095A1 (en) | Encoder apparatus and decoder apparatus | |
JP5031006B2 (en) | Scalable decoding apparatus and scalable decoding method | |
US20100324911A1 (en) | Cvsd decoder state update after packet loss | |
WO2008066071A1 (en) | Decoding apparatus and audio decoding method | |
WO2009113516A1 (en) | Signal analysis/control system and method, signal control device and method, and program | |
EP1136986B1 (en) | Audio datastream transcoding apparatus | |
JP2005114814A (en) | Method, device, and program for speech encoding and decoding, and recording medium where same is recorded | |
JP2007235502A (en) | Audio communication system | |
KR20100024426A (en) | Signal analysis device, signal control device, its system, method, and program | |
JP3594829B2 (en) | MPEG audio decoding method | |
JPWO2009038158A1 (en) | Speech decoding apparatus, speech decoding method, program, and portable terminal | |
JPWO2009038115A1 (en) | Speech coding apparatus, speech coding method, and program | |
JPWO2009038170A1 (en) | Voice processing apparatus, voice processing method, program, and music / melody distribution system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111115 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120403 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120509 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120605 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120626 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5031006 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150706 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |