JP2001184090A - Signal encoding device and signal decoding device, and computer-readable recording medium with recorded signal encoding program and computer-readable recording medium with recorded signal decoding program - Google Patents

Signal encoding device and signal decoding device, and computer-readable recording medium with recorded signal encoding program and computer-readable recording medium with recorded signal decoding program

Info

Publication number
JP2001184090A
JP2001184090A JP36957199A JP36957199A JP2001184090A JP 2001184090 A JP2001184090 A JP 2001184090A JP 36957199 A JP36957199 A JP 36957199A JP 36957199 A JP36957199 A JP 36957199A JP 2001184090 A JP2001184090 A JP 2001184090A
Authority
JP
Japan
Prior art keywords
signal
frequency spectrum
frequency
spectral envelope
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP36957199A
Other languages
Japanese (ja)
Inventor
Toshikazu Fujinaga
利和 藤長
Original Assignee
Fuji Techno Enterprise:Kk
有限会社フジテクノエンタープライズ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Techno Enterprise:Kk, 有限会社フジテクノエンタープライズ filed Critical Fuji Techno Enterprise:Kk
Priority to JP36957199A priority Critical patent/JP2001184090A/en
Publication of JP2001184090A publication Critical patent/JP2001184090A/en
Application status is Pending legal-status Critical

Links

Abstract

PROBLEM TO BE SOLVED: To solve the problem that it is difficult for a conventional encoding and decoding device for an acoustic signal, etc., to meet requirements of compressibility, quality, and an arithmetic quantity at high level. SOLUTION: High compressibility and high quality are secured with a high arithmetic quantity by determining the number of allocation bits allocated to each frequency component according to the spectrum envelope of the frequency spectrum of an object signal and encoding the frequency spectrum quantized corresponding to the number of allocation bits and the spectrum envelope.

Description

【発明の詳細な説明】 DETAILED DESCRIPTION OF THE INVENTION

【0001】 [0001]

【発明の属する技術分野】本発明は,例えば音声信号や楽音信号を含む音響信号,或いは映像信号など,時間的又は空間的に変化する対象信号の符号化,復号化を行うための装置,及び符号化,復号化を行うためのプログラムを記録したコンピュータ読み取り可能な記録媒体に関するものである。 BACKGROUND OF THE INVENTION The present invention is, for example, the acoustic signals comprising voice signals or musical signals, or such as video signals, the encoding of the temporal or spatially varying object signal, apparatus for decoding, and coding, and a computer-readable recording medium recording a program for decoding.

【0002】 [0002]

【従来の技術】近年のインターネットの急速な普及に伴って,一般消費者が利用可能な通信伝送路は多様化しつつあり,数Mbps程度の帯域幅を提供することが可能な通信サービスも幾つか現れはじめている。 BACKGROUND ART With the rapid spread of the Internet in recent years, consumers have available communications channel is getting diversified, some even communication services capable of providing bandwidth of several Mbps It is beginning to appear. しかしながら,比較的高速な通信サービスを利用する利用者は,現在のところ少数であり,多くの利用者が利用可能な帯域幅はたかだか128kbps程度である。 However, the user who uses relatively high speed communication service, a currently few, many users available bandwidth is approximately at most 128kbps. この帯域幅は,音楽や映像といった,いわゆるマルチメディア情報を伝送するのには十分なものとは言い難い。 This bandwidth, such as music or video, it is hard to say that sufficient is to transmit a so-called multimedia information. 前記マルチメディア情報をディジタル化する場合の最も基本的な符号化方式は,線形PCM(Pulse Code Modulation)方式である。 The most basic encoding method when digitizing the multimedia information is a linear PCM (Pulse Code Modulation) scheme. 前記線形PCM 方式は,時間的又は空間的に離散化された信号の大きさを等ステップで量子化することにより,対象となった信号を符号に置き換えるものである。 The linear PCM method, by quantizing in equal steps the magnitude of temporally or spatially discretized signal, which replaces the signal as an object the code.
前記線形PCM 方式により符号化された情報のビットレートは,サンプリング周波数×量子化ビット数×チャンネル数であり,例えばオーディオ用CD(サンプリングレート44.1kHz,量子化ビット数16,ステレオ) Bit rate of information encoded by the linear PCM method, the sampling frequency × quantization bits × number of channels, for example, audio CD (sampling rate 44.1 kHz, quantization bit number 16, stereo)
相当の情報のビットレートは,約1411kbpsとなる。 Bit rate of significant information is about 1411Kbps. 多くの利用者が利用可能な帯域幅は,このビットレートよりずっと小さく,上述した128kbps程度の帯域幅では,4分程度の楽音信号を得るのに少なくとも44分程度の時間が必要となる。 Many users available bandwidth is much smaller than the bit rate, the band width of about 128kbps described above, it is necessary to at least 44 minutes to time to obtain a tone signal of about 4 minutes. もちろん,この条件では前記楽音信号を実時間で再生することは望めない。 Of course, not be expected to reproduce the musical tone signal in real time in this condition. 但し,前記マルチメディア情報には,冗長な部分が比較的多く存在するため,可逆的,非可逆的に情報を高能率符号化(圧縮)することが可能である。 However, the multimedia information, due to the presence relatively often redundant part, reversible, it is possible to irreversibly information high-efficiency encoding (compression). 上述のような比較的低速な通信伝送路を用いる場合,対象となる信号について高能率符号化を行うことは,実用上欠かせない。 When using a relatively slow communications channel, such as described above, by performing the high-efficiency coding for the signal of interest is not practically essential. 例えば楽音信号について高能率符号化を行う方式の代表的なものには,国際標準規格MPEG-1(Moving Picture Expe For example a high-efficiency coding performed in typical ways for musical tone signal is international standard MPEG-1 (Moving Picture Expe
rts Group)に含まれるMPEG-1 audio layer3(いわゆるMP MPEG-1 audio layer3 contained rts Group) (so-called MP
3)に規定された復号化方式に対応したものや,NTTヒューマンインターフェース研究所が開発した,TwinVQ(T 3) so as to correspond to a defined decoding method and, NTT Human Interface Laboratories developed, TwinVQ (T
ransform-domain Weighted INterleave Vector Quantiz ransform-domain Weighted INterleave Vector Quantiz
ation)などがある。 ation), and the like. これらは,人間の聴覚特性を利用するなどして,音質の劣化を抑えながら,1/10〜1/ These are, by, for example, to use the human auditory characteristics, while suppressing the degradation of sound quality, 1 / 10-1 /
20程度まで楽音信号を圧縮する。 Compressing the tone signal to about 20. これらの楽音信号に対する高能率符号化方式は,インターネット等を利用した音楽配信サービスを普及させる主因となり,また半導体メモリを用いた携帯用再生端末の製品化も可能にした。 High-efficiency coding scheme for these musical tone signal becomes a main cause to disseminate music distribution service using the Internet, etc., also was possible commercialization of the portable playback device using a semiconductor memory. 前記MP3 や,TwinVQを採用した携帯用再生端末は, The MP3 and portable playback terminal adopting the TwinVQ is,
64Mバイト程度のメモリ容量があれば,CD相当の音質でも1時間強の録音が可能であり,十分実用的なものとなっている。 If there is a memory capacity of about 64M bytes, it is capable of also recording of over an hour in the CD equivalent of the sound quality, and has a sufficient practical things. また,高能率符号化を行うことは,限りある通信伝送路の資源を節約することにもなる。 Further, by performing the high-efficiency coding becomes also possible to save the resources of the communications channel of limited. 例えば携帯電話などに代表される移動体無線通信の分野では, For example, in the field of mobile radio communication typified by cellular phones,
無線帯域の制限を考慮して,ADPCM(Adaptive Different Taking into account the limitations of the radio band, ADPCM (Adaptive Different
ial Pulse Code Modulation)方式や,各種CELP(Code Ex ial Pulse Code Modulation) scheme and, various CELP (Code Ex
cited Linear Prediction)方式などに従って,音声信号の符号化が行われてきた。 According, such as Cited Linear Prediction) scheme, coding of speech signals has been carried out. 音声信号を前記線形PCM 方式により符号化する場合,少なくとも64kbpsの帯域幅が必要とされているが,前記ADPCM 方式により符号化された音声信号のビットレートは,32kbpsであり,前記各種CELP方式により符号化された音声信号のビットレートは,4kbps〜16kbps程度である。 When encoding by the linear PCM method and audio signals, but bandwidth of at least 64kbps is needed, the bit rate of the encoded audio signal by the ADPCM method is 32 kbps, by the various CELP method bit rate of the encoded audio signals is about 4Kbps~16kbps.
前記各種CELP方式により符号化した場合には,前記線形 When encoded by the various CELP scheme, the linear
PCM 方式により符号化した場合と較べると,かなり低ビット化され,必要な無線周波数帯域が節約されることになる。 Compared to the case of encoding by the PCM method, it is much lower bit reduction, so that the radio frequency band necessary savings. また,このような音声通信の符号化方式は,前記移動体無線通信の分野だけでなく,IP(Internet Protoc The encoding scheme of such voice communication, not only the field of the mobile radio communication, IP (Internet Protoc
l)ネットワークを用いて音声通信を行うVOIP(Voice Ove VOIP performing voice communication using l) network (Voice Ove
r IP) にも採用されており,インターネットを利用した長距離電話通信の低価格サービスの提供が期待されている。 r IP) to have been adopted, the provision of low-cost services of long-distance telephone communication using the Internet is expected.

【0003】 [0003]

【発明が解決しようとする課題】ところで,前記楽音信号や音声信号を含む音響信号に対する高能率符号化処理を行うにあたって,主要な評価基準となるものに,圧縮率,品質,演算量がある。 [SUMMARY OF THE INVENTION Incidentally, when performing the high-efficiency coding process on the acoustic signal including the music signal and audio signal, to what the main criterion, the compression ratio, the quality, there is a computation amount. 前記圧縮率は,もちろん,符号化前後でのビットレートの比であり,前記品質は,符号化された符号化信号を復号化して再生した場合の感覚的評価である。 The compression ratio, of course, is the ratio of the bit rate of the encoding before and after, the quality is sensory evaluation in the case of reproducing by decoding a coded signal. また,前記演算量は,信号の符号化や復号化を行う際に必要となる演算量であり,処理の複雑さに関係する。 Further, the amount of computation is a computation amount needed to perform the coding and decoding of signals, related to the complexity of the process. 上述したような各種の高能率符号化方式(及びそれらに対応した復号化方式)は,用途に応じた適当なバランスの元で前記基準を満足するが,ある程度の音質と高い圧縮率を得るために処理が複雑化し,前記演算量が増大する傾向にあり,前記3つの評価基準の全てを高い水準で満足することは難しい。 High-efficiency coding scheme for various as described above (and decoding scheme corresponding to them), although satisfying the criteria in the appropriate balance of the original according to the application, to obtain a certain degree of sound quality and high compression ratio process is complicated to tend to the operation amount increases, it is difficult to satisfy all of the three criteria at a high level. この問題は,前記音響信号のように時間的に変化する信号だけでなく, This problem is not only time-varying signal as the acoustic signal,
静止画或いは動画像に含まれる画像のように空間的に変化する信号について高能率符号化を行う場合でも,同様に発生する。 Even when the spatially varying signal as a still image or images contained in the moving image perform high efficiency coding, similarly it occurs. 本発明は,このような従来の技術における課題を解決するために,信号符号化装置,及び信号符号化プログラム,並びに信号復号化装置,及び信号復号化プログラムを改良し,品質を維持しながら少ない演算量で高い圧縮率を得ることのでる信号符号化装置,及び信号符号化プログラムを記録したコンピュータ読み取り可能な記録媒体,並びに前記信号符号化装置や前記信号符号化プログラムを用いて生成した符号化信号を少ない演算量で復号化し高い品質の再生を行うことが可能な信号復号化装置,及び信号復号化プログラムを記録したコンピュータ読み取り可能な記録媒体を提供することを目的とするものである。 The present invention, in order to solve the problems in the conventional art, the signal coding apparatus, and a signal encoding program, and signal decoding apparatus, and an improved signal decoding program, less while maintaining the quality signal encoding out of obtaining a high compression ratio operation quantity unit, and a computer-readable recording medium recording a signal encoding program, and generated encoded using the signal coding apparatus and the signal encoding program signal small amount of computation in decoding and high-quality signal decoding apparatus capable of reproducing, and it is an object to provide a computer readable recording medium recording a signal decoding program.

【0004】 [0004]

【課題を解決するための手段】前記目的を達成するために,請求項1に係る発明は,時間的又は空間的に変化する対象信号の周波数スペクトルを求める周波数スペクトル演算手段と,前記周波数スペクトル演算手段により演算された前記対象信号の周波数スペクトルからスペクトル包絡を抽出するスペクトル包絡抽出手段と,前記スペクトル包絡抽出手段により抽出された前記スペクトル包絡に応じて,前記対象信号の周波数スペクトルの各周波数成分に割り当てる割当ビット数を定める割当ビット数決定手段と,前記割当ビット数決定手段により定められた前記割当ビット数に基づいて,前記対象信号の周波数スペクトルを量子化する周波数スペクトル量子化手段と,前記周波数スペクトル量子化手段により量子化された前記対象信号の周 Means for Solving the Problems] To achieve the above object, the invention according to claim 1, the frequency spectrum calculating means for calculating a frequency spectrum of the time or spatially varying object signal, the frequency spectrum calculation spectrum envelope extracting means for extracting a spectrum envelope from the frequency spectrum of the computed the target signal by means in response to said spectral envelope extracted by the spectrum envelope extracting means, to each frequency component of the frequency spectrum of said target signal and allocated bit number determining means for determining the number of allocated bits allocated, based on the number of the allocated bits defined by the allocated bit number determining means, and the frequency spectrum quantizing means for quantizing the frequency spectrum of the object signal, the frequency periphery of the target signal quantized by the spectrum quantizing means 数スペクトルに関する周波数スペクトル情報と,前記スペクトル包絡に関するスペクトル包絡情報とを符号化した符号化信号を生成する符号化信号生成手段とを具備してなる信号符号化装置として構成されている。 And the frequency spectral information about the number spectrum, and is configured and spectrum envelope information about the spectral envelope as a signal encoding apparatus comprising; and a coded signal generating means for generating an encoded signal encoded. 前記請求項1に記載の信号符号化装置により生成される符号化信号には,時間的又は空間的に変化する対象信号の周波数スペクトルに関する周波数スペクトル情報と前記対象信号のスペクトル包絡に関するスペクトル包絡情報とが含まれる。 Wherein the encoded signal generated by the signal encoding apparatus according to claim 1, the spectral envelope information about the spectral envelope of the temporally or spatially varying the frequency spectrum information about the frequency spectrum of the target signal to be the target signal It is included. 前記周波数スペクトル情報は,前記スペクトル包絡に応じて割り当てられた割当ビット数に基づいて前記対象信号の周波数スペクトルが量子化されて符号化されたものであり,そのビットレートは,前記対象信号を線形PCM 方式により符号化した場合と較べてずっと少なく,スペクトル包絡を利用する前記MP3 やTwinVQなどの高能率符号化方式と同等かそれより少ない。 The frequency spectral data, the frequency spectrum of the target signal based on the number of allocated bits allocated according to the spectral envelope has been encoded are quantized, the bit rate is linear the target signal much less compared to the case of encoding by the PCM method, the MP3 and equal to or less than the high-efficiency encoding method such as TwinVQ utilizing spectral envelope. また,周波数スペクトルをほぼそのまま符号化するため,前記対象信号の品質の劣化を抑えることができる。 Further, in order to substantially coded as a frequency spectrum, it is possible to suppress deterioration of quality of the target signal. しかも,時間領域から周波数領域への変換演算は,符号化に当たって一度だけ行えばよく,演算量が少なくてすみ,短時間で符号化を行うことができる。 Moreover, the conversion operation from the time domain to the frequency domain may be performed only once when encoding, requires less amount of calculation can be performed in a short time coding.

【0005】また,請求項2に係る発明は,時間的又は空間的に変化する対象信号の周波数スペクトルに関する周波数スペクトル情報と前記対象信号のスペクトル包絡に関するスペクトル包絡情報とを符号化した符号化信号から前記スペクトル包絡情報を取得し,該取得した前記スペクトル包絡情報に基づいて前記対象信号の周波数スペクトルの各周波数成分に対する前記スペクトル包絡を復元するスペクトル包絡復元手段と,前記スペクトル包絡復元手段により復元された前記スペクトル包絡から, [0005] The invention according to claim 2, the encoded coded signal and spectrum envelope information about the spectral envelope of the temporally or spatially varying the frequency spectrum information about the frequency spectrum of the target signal to be the target signal acquiring the spectral envelope information, the spectral envelope restoring means for restoring the spectral envelope for each frequency component of the frequency spectrum of the target signal, restored by the spectral envelope restoring means on the basis of the acquired said spectrum envelope information from the spectral envelope,
前記対象信号の周波数スペクトルの各周波数成分に割り当てられた割当ビット数を取得する割当ビット数取得手段と,前記符号化信号から前記周波数スペクトル情報を取得し,前記割当ビット数取得手段により取得された前記割当ビット数に基づいて,前記取得した前記周波数スペクトル情報から前記対象信号の周波数スペクトルを復号化する周波数スペクトル復号化手段と,前記周波数スペトル復号化手段により復号化された前記対象信号の周波数スペクトルに基づいて,前記対象信号を復元する信号復元手段とを具備してなる信号復号化装置である。 And allocated bit number obtaining means for obtaining the number of allocated bits allocated to each frequency component of the frequency spectrum of the target signal to obtain the frequency spectrum information from the encoded signal, which is acquired by the allocated number of bits acquiring means based on the number of allocated bits, and the frequency spectrum decoding means for decoding the frequency spectrum of said target signal from said acquired the frequency spectrum information, the frequency spectrum of the decoded said target signal by the frequency Supetoru decoding means based on a signal decoding apparatus comprising; and a signal restoring means for restoring the target signal. 前記請求項2に記載の発明によれば,前記請求項1に記載の信号符号化装置により生成された符号化信号を復号化して,時間的又は空間的に変化する対象信号を復元するのに好適な信号復号化装置を提供することができる。 According to the invention described in claim 2, wherein by decoding the coded signal generated by the signal encoding apparatus according to claim 1, to restore the temporal or spatial target signal which changes it is possible to provide a suitable signal decoding apparatus. 前記請求項2に記載の信号復号化装置において,復号化のために行われる主な演算は,周波数領域から時間領域に変換する一度だけの逆変換の処理と割当ビット数の取得に必要な比較的単純な演算のみであるから,短時間で前記対象信号の復号化を行うことができ,また実時間再生を行うのも容易になる。 In the signal decoding apparatus according to claim 2, the main operations performed for decoding, compared required for processing a number of allocated bits acquisition of the inverse transform of once converting from the frequency domain to the time domain simple because calculation is only, the short time it is possible to perform the decoding of the target signal, and also becomes easy to reproduce real time.

【0006】また,請求項3に係る発明は,コンピュータに,空間的又は時間的に変化する対象信号の周波数スペクトルを求める手順,前記対象信号の周波数スペクトルからスペクトル包絡を抽出する手順,前記スペクトル包絡に応じて,前記対象信号の周波数スペクトルの各周波数成分に割り当てる割当ビット数を定める手順,前記割当ビット数に基づいて,前記対象信号の周波数スペクトルを量子化する手順,前記対象信号の周波数スペクトルに関する周波数スペクトル情報と,前記スペクトル包絡を定めるスペクトル包絡情報とを符号化した符号化信号を生成する手順を実行させるための信号符号化プログラムを記録したコンピュータ読み取り可能な記録媒体である。 [0006] The invention according to claim 3, the computer, the procedure for obtaining the frequency spectrum of the spatial or time-varying signal of interest, the procedure for extracting the spectral envelope from the frequency spectrum of the target signal, the spectral envelope depending on the procedure to determine the number of assigned bits assigned to each frequency component of the frequency spectrum of the target signal, based on the allocated number of bits, the procedure for quantizing the frequency spectrum of the target signal, to the frequency spectrum of said target signal the frequency spectrum information, a computer readable recording medium recording a signal encoding program for causing the spectral envelope information to execute a procedure for generating an encoded signal encoded to define the spectral envelope. 前記請求項3に記載のコンピュータ読み取り可能な記録媒体は,前記請求項1に記載の信号符号化装置をコンピュータにより実現するのに好適な信号符号化プログラムを提供する。 The computer-readable recording medium according to claim 3 provides a suitable signal encoding program for implementing by a computer the signal encoding apparatus according to claim 1. 前記請求項3に記載の信号符号化プログラムに従って,コンピュータにより生成させた符号化信号には,前記請求項1に記載の信号符号化装置と同様に,時間的又は空間的に変化する対象信号の周波数スペクトルに関する周波数スペクトル情報と前記対象信号のスペクトル包絡に関するスペクトル包絡情報とが含まれる。 In accordance with the signal encoding program according to claim 3, the coded signal is generated by a computer, as with the signal coding apparatus according to claim 1, the temporal or spatially varying signal of interest It includes the spectral envelope information about the spectral envelope of the frequency spectrum information about the frequency spectrum signal of interest. 前記周波数スペクトル情報は,前記スペクトル包絡に応じて割り当てられた割当ビット数に基づいて前記対象信号の周波数スペクトルが量子化されて符号化されたものであり,その伝送や記録に必要な情報量は,前記対象信号を線形PCM 方式により符号化した場合と較べてずっと少なく,スペクトル包絡を利用する前記MP3 やTw The frequency spectral data, the frequency spectrum of the target signal based on the number of allocated bits allocated according to the spectral envelope has been encoded are quantized, information amount required for the transmission or recording is , much less in comparison with the case of encoding by linear PCM method the target signal, the MP3 and Tw utilizing spectral envelope
inVQなどの高能率符号化方式と同等かそれよりも少ない。 Equal to or less than the high-efficiency coding scheme such as inVQ. また,周波数スペクトルをほぼそのまま符号化するため,前記対象信号の劣化を抑えることができる。 Further, in order to substantially coded as a frequency spectrum, it is possible to suppress deterioration of the target signal. しかも,スペクトル分析に伴うFFT などの演算は,符号化に当たって一度だけ行えばよく,コンピュータの演算量は少なくてすみ,短時間で符号化を行うことができる。 Moreover, operations such as FFT associated with spectral analysis, coding when may be performed only once, the computation amount computer fewer, can be performed in a short time coding.

【0007】また,請求項4に係る発明は,コンピュータに,時間的又は空間的に変化する対象信号の周波数スペクトルに関する周波数スペクトル情報と前記対象信号のスペクトル包絡に関するスペクトル包絡情報とを符号化した符号化信号から前記スペクトル包絡情報を取得し,前記スペクトル包絡情報に基づいて前記対象信号の周波数スペクトルの各周波数成分に対する前記スペクトル包絡を復元する手順,前記スペクトル包絡から,前記対象信号の周波数スペクトルの各周波数成分に割り当てられた割当ビット数を取得する手順,前記符号化信号から前記周波数スペクトル情報を取得し,前記割当ビット数に基づいて,前記周波数スペクトル情報から前記対象信号の周波数スペクトルを復号化する手順,前記対象信号の周波数スペクト Further, reference numeral invention according to claim 4, the computer, obtained by encoding the spectral envelope information about the spectral envelope of the temporally or spatially varying frequency spectral data and said target signal related to the frequency spectrum of the target signal to be acquiring the spectral envelope information from the signal, the procedure for restoring the spectral envelope for each frequency component of the frequency spectrum of the target signal based on the spectral envelope information, from said spectral envelope, each of the frequency spectrum of said target signal procedure for acquiring the number of allocated bits allocated to the frequency component, and obtains the frequency spectrum information from said encoded signal, based on the number of allocated bits, decodes the frequency spectrum of said target signal from said frequency spectrum information procedure, the frequency of the target signal spectrum に基づいて前記対象信号を復元する手順を実行させるための信号復号化プログラムを記録したコンピュータ読み取り可能な記録媒体である。 A computer-readable recording medium recording a signal decoding program for executing the steps to restore the target signal based on. 前記請求項4に記載のコンピュータ読み取り可能な記録媒体によれば,前記請求項1に記載の信号符号化装置によって生成された符号化信号を,又は前記請求項3に記載の信号符号化プログラムに従ってコンピュータにより生成された符号化信号を復号化して,時間的又は空間的に変化する対象信号を復元するのに好適な信号復号化プログラムを提供することができる。 According to the computer-readable recording medium according to claim 4, the encoded signal generated by the signal encoding apparatus according to claim 1, or according to signal encoding program according to claim 3 by decoding the coded signal generated by the computer, it is possible to provide a suitable signal decoding program to restore the temporal or spatial target signal changes. 前記請求項4に記載の信号復号化プログラムにおいても,周波数領域から時間領域に変換する逆変換の処理は,復号化を行うにあたって一度行うだけでよいから,コンピュータが行う全体の演算量は少なくてすみ,短時間で前記対象信号の復号化を行うことができ,また比較的低速なコンピュータを用いて実時間再生を行うことも可能となる。 Also in the signal decoding program according to claim 4, the processing of the inverse transform for converting from the frequency domain to the time domain, since it is only performed once in performing decoding, less the total amount of calculation performed by the computer corner, wherein it is possible to perform the decoding of the target signal, also it is possible to perform playback real time using a relatively slow computer in a short time.

【0008】 [0008]

【発明の実施の形態】以下,添付図面を参照して,本発明の実施の形態につき説明し,本発明の理解に供する。 BEST MODE FOR CARRYING OUT THE INVENTION Hereinafter, with reference to the accompanying drawings, described embodiments of the present invention will provide an understanding of the present invention.
尚,以下の実施の形態は,本発明の具体的な例であって,本発明の技術的範囲を限定する性格のものではない。 Note that the following embodiment is a specific example of the present invention, not intended to limit the technical scope of the present invention. 本発明の実施の形態に係る符号化装置1は,図1に示す如く,時間的に変化する音声信号,楽音信号,又はその両方を含む音響信号(対象信号の一例)の周波数スペクトルを求める周波数スペクトル演算部103と,前記周波数スペクトル演算部103により演算された前記音響信号の周波数スペクトルから,スペクトル包絡を抽出するスペクトル包絡抽出部104と,前記スペクトル包絡抽出部104により抽出された前記スペクトル包絡に応じて,前記音響信号の周波数スペクトルの各周波数成分に割り当てる割当ビット数を定める割当ビット数決定部105と,前記割当ビット数決定部105により定められた前記割当ビット数に基づいて,前記音響信号の周波数スペクトルを量子化する周波数スペクトル量子化部106と,前記周波 Encoding device 1 according to the embodiment of the present invention, as shown in FIG. 1, the time-varying speech signal, music signal, or frequency to determine the frequency spectrum of the acoustic signal (an example of a target signal) containing both a spectrum calculation section 103, from the frequency spectrum of the computed the acoustic signal by the frequency spectrum calculation unit 103, a spectrum envelope extracting unit 104 for extracting a spectrum envelope, the spectral envelope extracted by the spectrum envelope extracting unit 104 Correspondingly, the an allocated bit number determining section 105 for determining the number of assigned bits assigned to each frequency component of the frequency spectrum of the acoustic signal, on the basis of the number of allocated bits defined by the allocated bit number determining unit 105, the acoustic signal the frequency spectrum and the frequency spectrum quantization unit 106 for quantizing the frequency スペクトル量子化部106により量子化された前記音響信号の周波数スペクトルに関する周波数スペクトル情報と,前記スペクトル包絡に関するスペクトル情報とを符号化した符号化信号を生成する符号化信号生成部107とを具備する。 Comprising a frequency spectrum information about the frequency spectrum of the acoustic signal which has been quantized by spectrum quantization unit 106, and a coded signal generating unit 107 and spectral information to generate an encoded signal encoded for said spectral envelope. また,本発明の実施の形態に係る信号復号化装置2は,図2に示す如く,時間的に変化する前記音響信号の周波数スペクトルに関する周波数スペクトル情報と前記2響信号のスペクトル包絡に関するスペクトル包絡情報とを符号化した符号化信号から前記スペクトル包絡情報を取得し,該取得した前記スペクトル包絡情報に基づいて前記音響信号の周波数スペクトルの各周波数成分に対する前記スペクトル包絡を復元するスペクトル包絡復元部203と,前記スペクトル包絡復元部203により復元された前記スペクトル包絡から,前記音響信号の周波数スペクトルの各周波数成分に割り当てられた割当ビット数を取得する割当ビット数取得部204と,前記符号化信号から前記周波数スペクトル情報を取得し,前記割当ビット数取得部20 The signal decoding apparatus 2 according to the embodiment of the present invention, as shown in FIG. 2, the spectral envelope information about the spectral envelope of the time-varying frequency spectral data and the 2 sound signal relating to the frequency spectrum of the acoustic signal preparative obtains the spectral envelope information from the encoded coded signal, a spectral envelope restoring unit 203 based on the acquired said spectrum envelope information restoring the spectral envelope for each frequency component of the frequency spectrum of the acoustic signal , from the spectral envelope reconstructed by the spectrum envelope restoring unit 203, an allocated bit number obtaining unit 204 for obtaining the number of allocated bits allocated to each frequency component of the frequency spectrum of the acoustic signal, the from the encoded signal to obtain frequency spectrum information, the number of allocated bits acquiring unit 20 により取得された前記割当ビット数に基づいて, Based on the number of allocated bits obtained by,
前記取得した前記周波数スペクトル情報から前記音響信号の周波数スペクトルを復号化する周波数スペクトル復号化部205と,前記周波数スペクトル復号化部205 And the frequency spectrum decoding section 205 for decoding the frequency spectrum of the acoustic signal from the acquired the frequency spectrum information, the frequency spectrum decoding section 205
により復号化された前記音響信号の周波数スペクトルに基づいて前記音響信号を復元する信号復元部206とを具備する。 ; And a signal restoration unit 206 for restoring the acoustic signal based on the frequency spectrum of the decoded the audio signal by.

【0009】また,本発明の実施の形態に係る信号符号化プログラムは,コンピュータに,図3に示すような, [0009] The signal encoding program according to the embodiment of the present invention, the computer, as shown in FIG. 3,
前記音響信号の周波数スペクトルを求める手順S10 Step S10 for determining the frequency spectrum of the acoustic signal
1,前記音響信号の周波数スペクトルからスペクトル包絡を抽出する手順S102,前記スペクトル包絡に応じて,前記音響信号の周波数スペクトルの各周波数成分に割り当てる割当ビット数を定める手順S103,前記割当ビット数に基づいて,前記音響信号の周波数スペクトルを量子化する手順S104,前記音響信号の周波数スペクトルに関する周波数スペクトル情報と,前記スペクトル包絡を定めるスペクトル包絡情報とを符号化した符号化信号を生成する手順S104を実行させるためのものであって,この信号符号化プログラムを記録した例えばCD−ROMが,本発明の実施の形態に係る信号化符号化プログラムを記録したコンピュータ読み取り可能な記録媒体の具体例である。 1, Step S102 of extracting the spectrum envelope from the frequency spectrum of the acoustic signal, in response to said spectrum envelope, the steps S103 to determine the number of assigned bits assigned to each frequency component of the frequency spectrum of the acoustic signal, based on the allocated number of bits Te, steps S104 to generate the steps S104 to quantize the frequency spectrum of the acoustic signal, the frequency spectrum information about the frequency spectrum of the acoustic signal, the encoded signal obtained by encoding the spectral envelope information defining the spectral envelope be of order to it, the signal encoding program recorded, for example, a CD-ROM is an example of a computer-readable recording medium a signal of the encoding program according to an embodiment of the present invention. また,本発明の実施の形態に係る信号復号化プログラムは,コンピュータに,図4に示すような,時間的に変化する前記音響信号の周波数スペクトルに関する周波数スペクトル情報と前記音響信号のスペクトル包絡に関するスペクトル包絡情報とを符号化した符号化信号から前記スペクトル包絡情報を取得し,該取得した前記スペクトル包絡情報に基づいて前記音響信号の周波数スペクトルの各周波数成分に対する前記スペクトル包絡を復元する手順S201,前記スペクトル包絡から,前記音響信号の周波数スペクトルの各周波数成分に割り当てられた割当ビット数を取得する手順S202,前記符号化信号から前記周波数スペクトル情報を取得し,前記割当ビット数に基づいて,前記周波数スペクトル情報から前記音響信号の周波数スペ Moreover, signal decoding program according to the embodiment of the present invention, the spectrum to the computer, as shown in FIG. 4, relates to the spectral envelope of the frequency spectrum information about the frequency spectrum of the acoustic signal time-varying the acoustic signals and envelope information acquiring the spectral envelope information from the encoded coded signal, steps S201 to restore the spectral envelope for each frequency component of the frequency spectrum of the acoustic signal on the basis of the acquired said spectrum envelope information, the from the spectral envelope of the steps S202 to acquire the allocated number of bits assigned to each frequency component of the frequency spectrum of the acoustic signal, obtains the frequency spectrum information from said encoded signal, based on the allocated number of bits, the frequency frequency space of the acoustic signal from the spectral information トルを復号化する手順S203,前記音響信号の周波数スペクトルに基づいて前記音響信号を復元する手順S204を実行させるためのものであって,この信号復号化プログラムを記録した例えばCD−ROMが,本発明の実施の形態に係る信号復号化プログラムを記録したコンピュータ読み取り可能な記録媒体の具体例である。 Step S203 for decoding Torr, the be for based on the frequency spectrum of the acoustic signal to execute the steps S204 to restore the sound signal, the signal decoding program recorded for example, a CD-ROM, the the signal decoding program according to an embodiment of the invention is a specific example of a computer-readable recording medium.

【0010】そして,前記信号符号化装置1,及び前記信号復号化装置2は,例えば前記信号符号化プログラム,及び信号復号化プログラムを実行可能にしたコンピュータとしてそれぞれ具体化される。 [0010] Then, the signal encoding apparatus 1, and the signal decoding apparatus 2, for example, the signal encoding program, and embodied respectively a signal decoding program as an executable on a computer. 前記コンピュータは,図5に示す如く,キーボードやマウス等の入力装置501,ディスプレイなどの出力装置502,CD−R The computer, as shown in FIG. 5, an input device 501 such as a keyboard or a mouse, an output device 502 such as a display, CD-R
OMドライブ503,ハードディスクドライブ504, OM drive 503, hard disk drive 504,
RAM505,演算装置506,スピーカ5071及びマイク5072が接続された音響入出力用ボード50 RAM 505, operation unit 506, an acoustic input-output board 50 which speaker 5071 and microphone 5072 are connected
7,LANボードやモデム等の通信装置508などを有する標準的な構成を備えるものである。 7, LAN board or a modem or the like of the communication device 508 is intended with a standard configuration with a like. 前記コンピュータにおいて,前記信号符号化プログラム,及び信号復号化プログラムのいずれか一方又は両方が圧縮状態で記録されたCD−ROMが,前記CD−ROMドライブ50 In the computer, the signal encoding program, and either one or both of the signal decoding program is recorded CD-ROM in a compressed state, the CD-ROM drive 50
3に挿入され,使用者が入力装置501を用いて与えた指示に従って前記CD−ROM中のインストールプログラムが実行されると,前記CD−ROMから読み出された前記信号符号化プログラム,及び信号復号化プログラムのいずれか一方又は両方が,ハードディスクドライブ504などの記憶媒体上に実行可能な状態に展開される。 Is inserted into the 3, the installation program in the CD-ROM according to the instructions the user has provided using the input device 501 is executed, the signal encoding program read from the CD-ROM, and signal decoding either or both of the programs is deployed on the executable state on a storage medium such as a hard disk drive 504. 前記信号符号化プログラム,及び前記信号復号化プログラムのいずれか一方又は両方の実行指示が,入力装置501を介して使用者からあった場合には,前記ハードディスクドライブ504上などに展開された前記信号符号化プログラム,及び前記信号復号化プログラムのいずれか一方又は両方の,一部又は全部が前記RAM50 The signal encoding program, and either one or both of the execution instruction of the signal decoding program, when a from the user via the input device 501, the signal is expanded like on the hard disk drive 504 encoding program, and either or both of the signal decoding program, some or all of the RAM50
5や前記ハードディスクドライブ504などから読み出され,前記演算装置506により,前記信号符号化プログラム,及び前記信号復号化プログラムのいずれか一方又は両方が実行される。 Read from such 5 or the hard disk drive 504, by the computing device 506, the signal encoding program, and either one or both of the signal decoding program is executed.

【0011】以下,前記信号符号化装置1,及び前記信号復号化装置2が,同一のコンピュータによって実現された場合を例にして,前記信号符号化装置1,前記信号復号化装置2,前記信号符号化プログラム,及び前記信号復号化プログラムの詳細を説明する。 [0011] Hereinafter, the signal encoding apparatus 1, and the signal decoding apparatus 2, and a case where it is realized by the same computer as an example, the signal encoding apparatus 1, the signal decoding apparatus 2, the signal encoding program, and the details of the signal decoding program will be described. 前記信号符号化プログラムが実行され,前記コンピュータが前記信号符号化装置1として動作すると,はじめに例えば符号化対象となる前記音響信号の指定や,符号化後のビットレートの指定など各種設定が可能なダイアログが前記出力装置502に表示される。 The signal encoding program is executed and the computer is operated as the signal encoding apparatus 1, designated and the sound signal to be started, for example, encoded, which can be specified and various settings of the bit rate after coding dialog is displayed on the output device 502. 前記符号化後のビットレートの指定は,前記信号符号化装置1による符号化処理の際に利用可能なビット数の上限を定めるのに用いられる。 Specified bit rate after the encoding is used to define the number of bits of the upper limit that can be utilized in the encoding process by the signal encoding apparatus 1. また,符号化対象となる前記音響信号は,そのときにマイクから入力するものや,既に何らかの符号化形式によりディジタル化され,前記ハードディスクドライブ504 Also, the acoustic signal to be encoded, and which input from the microphone at that time, already digitized by any encoding format, the hard disk drive 504
上に格納されているものなどである。 And the like which are stored in the above. 前記音響信号をマイクから入力することが使用者により選択された場合には,前記出力装置502に,取り込み時の量子化ビット数や,サンプリングレート,ステレオ・モノラルの区別などの情報を使用者が指定するためのダイアログが表示される。 When entering the acoustic signal from the microphone is selected by the user, the output device 502, the number of quantization bits and during capture, sampling rate, using information such as stereo mono distinction's dialog to specify is displayed. 使用者が,前記入力装置501を用いて前記取り込み時に必要な情報を与え,更に取り込みの指示を与えると,マイクから入力される前記音響信号に対して, When the user gives the information necessary at the time of the capture using the input device 501, further provide an indication of capture, to the acoustic signal input from the microphone,
符号化処理が開始される。 Coding process is started. 前記信号符号化装置1において,マイクなどから入力端子101を介して入力された前記音響信号は,A/D変換器102を介して前記周波数スペクトル演算部103に供給される。 In the signal encoding apparatus 1, the sound signal input through the input terminal 101 from a microphone is supplied to the frequency spectrum calculation unit 103 via the A / D converter 102. 前記信号符号化装置1が前記コンピュータによって実現されるこの例では,前記入力端子101に接続されるマイクとして, In this example the signal encoding apparatus 1 is implemented by the computer, as a microphone to be connected to the input terminal 101,
例えば前記音響入出力用ボード507に接続されたマイク5072が,前記A/D変換器102には,前記音響入出力用ボード507に実装された図示しないA/D変換器が用いられる。 For example, the microphone 5072 that is connected to the acoustic input and output board 507, the A / D converter 102, the not shown, which is mounted to the acoustic input-output boards 507 A / D converter is used. 前記音響入出力用ボード507に実装されたA/D変換器から出力された信号は,実際には,前記ハードディスクドライブ504上などに一時的に格納される。 Signal output from the A / D converter that is mounted on the acoustic input board 507 is actually stored temporarily in such above the hard disk drive 504. 前記A/D変換器102から出力され前記ハードディスクドライブ504上などに一時的に格納されたディジタル化後の前記音響信号は,前記線形PCM The acoustic signal after digitization temporarily stored in such as on the hard disk drive 504 is output from the A / D converter 102, the linear PCM
方式により符号化したものに対応する。 Correspond to those encoded by scheme. CD相当の取り込み条件であれば,既述の通り,そのビットレートは, If the CD equivalent of the acquisition conditions, as described above, the bit rate is,
約1411bpsである。 It is about 1411bps. 前記ディジタル化後の前記音響信号は,前記RAM505などに格納された前記信号符号化プログラムに従って,前記周波数スペクトル演算部103として動作する前記演算装置506によって読み出される。 The acoustic signal after the digitization in accordance with the signal encoding program stored in the said RAM 505, are read by the computing device 506 that operates as the frequency spectrum calculation unit 103.

【0012】前記周波数スペクトル演算部103は,入力された前記音響信号についてFFT(Fast Fourier Tr [0012] The frequency spectrum calculation section 103, for the inputted audio signal FFT (Fast Fourier Tr
ansform)演算を行い,前記音響信号の周波数スペクトルを求める。 Ansform) performs operation to determine the frequency spectrum of the acoustic signal. 前記周波数スペクトル演算部103に供給される前記音響信号は,予め時系列に分割されたものである。 The acoustic signal supplied to the frequency spectrum calculation unit 103 is one which is previously divided into a time series. 分割の際には各フレーム間で一部が重複するように処理される。 During split part between each frame is processed so as to overlap. 時系列に分割された前記音響信号のフレームの幅は,20ms〜60ms程度のフレーム幅を採用することが多い他の符号化方式よりも長めの100ms Width of the frame of the divided time series the sound signals, longer 100ms than other coding schemes often employ frame width of about 20ms~60ms
程度が適当である。 The degree is appropriate. これは,本実施の形態に係る符号化方式が,周波数スペクトルから抽出したスペクトル包絡に基づいて各周波数成分の割当ビット数を定め,その割当ビット数に応じて各周波数成分を量子化することにより,低ビットレート化を行うため,前記スペクトル包絡を良好に抽出する必要があるということに起因する。 This is because the coding method according to the present embodiment, defines the number of allocated bits of each frequency component based on the spectral envelope extracted from the frequency spectrum, for quantizing each frequency component in accordance with the allocated number of bits to perform the bit-rate-reducing, due to the fact that the spectral envelope satisfactorily it is necessary to extract. 前記フレーム幅は各フレームに対して一定である必要はなく,また対象となるフレームの信号に応じて動的に変化させるようにしてもよい。 The frame width is not necessarily constant for each frame and may be changed dynamically in response to the signal of the frame of interest. 前記音響信号の各フレームには,必要に応じて前記FFT演算の前にハミング窓などの窓関数が掛けられる。 Each frame of the acoustic signal is multiplied by a window function such as a Hamming window prior to the FFT operation if necessary. 前記周波数スペクトル演算部1 The frequency spectrum calculation unit 1
03は,各フレームについて前記FFT演算を行い,周波数領域における前記音響信号のパワー成分と位相成分とを定める。 03 performs the FFT operation for each frame, determining a power component and a phase component of the acoustic signal in the frequency domain. 前記音響信号に対するサンプリングレートが44.1kHzである場合,前記FFT演算の際のサンプル点数は,4096が適当である。 If the sampling rate for the acoustic signal is 44.1 kHz, the number of sample points during the FFT operation, 4096 is appropriate. 前記フレーム幅に対する設定や,窓関数の有無,窓関数の種類などの情報は,前記出力装置502にダイアログを表示させるなどして,使用者が適宜変更し得るようにしてもよい。 Setting and for the frame width, the presence or absence of the window function, the information such as the type of window function, and the like to display a dialog to the output device 502, a user may be capable of appropriately changed.
尚,前記周波数スペクトル演算部103が行う上述の通りの処理が,前記信号符号化プログラムが前記コンピュータに実行させる手順S101に対応する処理である。 The processing of as described above wherein the frequency spectrum calculation unit 103 performs the said signal encoding program is a process corresponding to steps S101 to be executed by the computer.
前記周波数スペクトル演算部103により定められた前記音響信号の周波数スペクトルのパワー成分と位相成分は,前記RAM505や前記演算装置506などの一次キャッシュなどに一時的に保持される。 The power and phase components of the frequency spectrum of the acoustic signal defined by the frequency spectrum calculation section 103, is temporarily held, etc. in the primary cache, such as the RAM505 and the arithmetic unit 506. 前記演算装置5 The arithmetic unit 5
06は,前記信号符号化プログラムに従って,次にスペクトル包絡抽出部104として動作する。 06 in accordance with the signal encoding program, then operates as a spectral envelope extraction unit 104. 前記スペクトル包絡抽出部104は,前記音響信号の周波数スペクトルのパワー成分から,スペクトル包絡を抽出する。 The spectrum envelope extracting unit 104, the power component of the frequency spectrum of the acoustic signal to extract the spectral envelope. LP LP
C(Linear prediction code)などを用いることも可能であるが,本実施の形態に係る信号符号化装置(及び信号符号化プログラム)の場合,スペクトル包絡を定めるのに必要な情報量ができるだけ少なく,また周波数−強度の2次元空間で前記スペクトル包絡が占める面積ができるだけ小さくなることが重要である。 C (Linear prediction code) but can also be used, such as the case of the signal coding apparatus according to the present embodiment (and the signal encoding program), as low as possible amount of information required to determine the spectrum envelope, the frequency - the spectral envelope occupied area in a two-dimensional space of the strength it is important that as small as possible.

【0013】本実施の形態に係る信号符号化装置(及び信号符号化プログラム)に,より適したスペクトル包絡抽出の具体的な演算手順を図6に示す。 [0013] signal encoding apparatus according to the present embodiment (and the signal encoding program), shows a more suitable specific algorithm of spectrum envelope extracting in FIG. 図6に示す通り,まず,前記パワー成分の周波数領域を複数の周波数帯に分割し,各周波数帯における前記パワー成分の最大値を抽出する(S1001)。 As shown in FIG. 6, firstly, the frequency range of the power component is divided into a plurality of frequency bands, it extracts the maximum value of the power component in each frequency band (S1001). 前記パワー成分の周波数領域の分割数は,圧縮率に関係するので,予め使用者などにより指定されたビットレートに従って定められる。 The division number of the frequency region of the power components, it relates to the compression ratio is determined according to the bit rate specified in advance by the user.
次に,前記各周波数帯における前記パワー成分の最大値を結んだ仮のスペクトル包絡を設定する(S100 Next, to set the spectral envelope of the temporary connecting the maximum values ​​of the power components in the respective frequency band (S100
2)。 2). 次に,前記パワー成分のうち前記仮のスペクトル包絡よりも著しく大きい周波数成分があるか否かを,全周波数領域について探索する(S1003)。 Next, whether there is a significantly greater frequency components than the spectral envelope of the temporary out of the power component, searches for the entire frequency range (S1003). 前記仮のスペクトル包絡より当該周波数成分の大きさが著しく大きいか否かは,例えば予め設定したしきい値よりその差が大きいか否かに基づいて判別すればよい。 Whether the significantly greater size of the frequency components from the spectral envelope of the provisional may be determined based on whether or not for example the difference is greater than a threshold set in advance. 次に,前記仮のスペクトル包絡よりも著しく大きいと判断された周波数成分が存在する場合には,当該周波数成分と前記各周波数帯における前記パワー成分の最大値を,前記仮のスペクトル包絡よりも著しく大きいと判断された周波数成分が存在しない場合には,前記各周波数帯における前記パワー成分の最大値のみを,抽出しようとするスペクトル包絡のピーク点として設定する(S1004)。 Then, when the frequency component is determined to significantly greater than the spectral envelope of the provisional exists, the maximum value of the power component in the with the frequency components each frequency band, significantly than the spectral envelope of the temporary If the frequency components determined to be larger does not exist, the sets only the maximum value of the power component in each frequency band, as a peak point of the spectrum envelope to be extracted (S1004).
尚,スペクトル包絡を得るための各周波数帯の大きさは同じである必要はなく,周波数に応じて異ならせてもよい。 The size of each frequency band to obtain spectral envelope need not be the same, may be different depending on the frequency. 前記ピーク点の点数は,低中周波数領域に多い方が人間の聴覚特性上好ましい。 The score of the peak point, who often in low and middle frequency range on hearing characteristic of humans preferred. 高周波数領域の音はさほど精密に再現しなくても,聴感上問題は少ない。 Even if the sound of the high frequency range is not so much precisely reproduce, audibility problem is small. 前記スペクトル包絡のピーク点が設定されたら,次に,隣り合うピーク点を支点として糸を垂らす要領で,両ピーク点間にある周波数スペクトルの谷の部分を表現する。 Wherein if it is set peak point of the spectral envelope, then, in the manner dripping yarn peak points adjacent the fulcrum, representing a valley portion of the frequency spectrum lying between the two peak points. 谷の部分を表現するために使用する関数を,以下,谷関数という。 The function used to represent the portion of the valley, hereinafter referred valley function. 前記谷関数の具体例としては,正弦波関数L=A× Specific examples of the valley function, sinusoidal function L = A ×
sin(ω×n)や,正弦波の平方根関数L=A×√ sin (ω × n) and the square root function of the sine wave L = A × √
(sin(ω×n)),正弦波のべき乗関数L=A×s (Sin (ω × n)), the power function of the sine wave L = A × s
in c (ω×n),放物線関数L=A×n 2 +b,高次関数,懸垂曲線L=A×cosh(ω×n)などが挙げられる。 in c (ω × n), parabolic function L = A × n 2 + b , high-order function, catenary curve L = A × cosh (ω × n) , and the like. 但し,nは両ピーク点間にある(周波数軸上の)各サンプルを一方のピーク点から数え始めたときのサンプル数であり,Lは両ピーク点間にある各サンプルの大きさである。 Here, n is between both peak point (on the frequency axis) is the number of samples when the counting starts each sample from one peak point, L is the size of each sample in between the peak points. 例えば前記正弦波関数を前記谷関数として用いる場合,両ピーク点間のスペクトル包絡を,次式(1)に従って表す。 For example, when using the sinusoidal function as the valley function, the spectral envelope between the two peak points, expressed according to the following equation (1). L=a×n−A×sin(ω×n)+C (1) 図7に示す通り,上式(1)におけるNは一方のピーク点P1から数え始めたときの他方のピーク点P2までのサンプル数であって,0≦n≦N,ω=π/Nである。 L = As shown in a × n-A × sin (ω × n) + C (1) FIG. 7, N in the above formula (1) is up to the other peak point P2 when the counting starts from one of the peak point P1 a number of samples is 0 ≦ n ≦ n, ω = π / n.
また,aは両ピーク点P1,P2間の前記仮のスペクトル包絡L′の傾き,Cは一方のピーク点P1の大きさである。 Also, a is the slope of the spectral envelope L 'of the provisional between both peak point P1, P2, C is the magnitude of one of the peak point P1. 尚,前記ピーク点Pの大きさが,両ピーク点P間にあるサンプル数と較べてかなり大きい場合,即ち前記周波数スペクトルの谷部分が深くなる場合には,前記正弦波関数よりも,正弦波のべき乗関数を用いる方がよい。 The size of the peak point P is, when fairly large compared to the number of samples in between the peak point P, that is, the valley portions of the frequency spectrum becomes deeper, than the sinusoidal function, a sine wave it is better to use a power function of. 上式(1)に含まれる前記谷関数の係数Aを変化させ,両ピーク点P1,P2間のスペクトル包絡を定める。 The coefficient A of the valley functions included in the above equation (1) is changed, determining the spectral envelope between the two peak points P1, P2. 例えば両ピーク点P1,P2間にあるサンプルのうち,前記仮のスペクトル包絡L′よりも小さい,いずれかのサンプルE1の大きさと前記スペクトル包絡の値L For example both the peak point P1, among the samples in between P2, the smaller than the spectral envelope L 'provisional any size of sample E1 and the spectral envelope value L
とが一致したときの係数Aを用いた上式(1)によって表されるスペクトル包絡を,抽出しようとするスペクトル包絡の一部(両ピーク点間のスペクトル包絡)として定める(S1005)。 DOO defines the spectral envelope represented by the above formula (1) using the coefficient A when they match, as part of the spectral envelope to be extracted (the spectral envelope between the two peak points) (S1005). 前記手順S1005を,全てのピーク点間に対して繰り返すことによって(S100 The steps S1005, by repeating respect between all peak points (S100
6),例えば図8に示すような各周波数成分に対するスペクトル包絡が得られる。 6), the spectral envelope is obtained for each frequency component as shown in FIG. 8, for example. 図8に示す通り,上述の手順に従って抽出したスペクトル包絡は,各周波数成分の大きさよりも所定値以上小さくなることはなく,また周波数−強度2次元空間で前記スペクトル包絡が占める面積が小さい。 As shown in FIG. 8, spectrum envelope extracted according to the procedure described above is not be smaller than a predetermined value than the magnitude of each frequency component, also the frequency - intensity said spectral envelope is a small area occupied by the two-dimensional space.

【0014】ところで,上述の通りの好適なスペクトル包絡を得るためには,前記ピーク点間が広く,前記谷部分が深い方がよい。 By the way, in order to obtain a suitable spectrum envelope as described above has a wide between the peak point, the better the valleys deeper. 既述した100ms程度のフレーム幅が好適であるという理由は,この点に関係する。 Because the frame width of about above the 100ms is suitable is related to this point. 20 20
ms程度のフレーム幅を採用した場合でも,好適なスペクトル包絡を得るには,100ms程度の時と同等の情報量が必要となる。 Even when adopting the frame width of about ms, to obtain a suitable spectrum envelope, it is necessary to equivalent amount of information and the time of about 100 ms. しかしながら,フレーム毎に復号化のためのスペクトル包絡の情報が必要となるので,フレーム幅が小さくなればなるほど,スペクトル包絡の情報量が増加してしまう。 However, since the spectral envelope information for decoding for each frame is required, larger the frame width is small, the information amount of spectrum envelope is increased. 一方,フレーム幅を大きくしても,前記ピーク点の数はさほど増えず,前記谷部分の深さは大きくなる。 On the other hand, increasing the frame width, number of the peak point is much increased not, the depth of the valley increases. これは,例えば有声音声の場合,基本周波数及びその高調波がピークとして現れるが,フレーム幅を大きくすると,ピーク間の間隔が周波数でみたときには同じであっても,次数でみたときには広がるからである。 This is for example the case of voiced speech, but the fundamental frequency and its harmonics appear as a peak, a larger frame width may be the same when the distance between the peaks was seen in the frequency, because spread when viewed in order . また,楽音の場合も,ランダムに周波数成分が折り重なっている訳ではなく,12段階の音程により規則性があり,楽器の音も基本周波数及びその高調波で成り立っている場合が多く,ほぼ有声音声の場合と同様である。 Also, when the musical tone, randomly does not mean that the frequency component is folded, there is regularity by pitch of 12 stages, often sound from the instrument also consists in the fundamental frequency and its harmonics, almost voiced speech is the same as in the case of. また,100ms程度のフレーム幅では,信号の定常性が増すという理由もある。 Further, in 100ms about frame width, there is also a reason that stationarity of the signal increases. 尚,前記スペクトル包絡抽出部104が行う上述の通りの処理が,前記信号符号化プログラムが前記コンピュータに実行させる手順S The processing of as described above for the spectrum envelope extracting unit 104 performs the procedure the signal encoding program causes the computer to execute S
102に対応する処理である。 It is processing corresponding to 102.

【0015】前記スペクトル包絡抽出部104により抽出された前記スペクトル包絡は,前記RAM505や前記演算装置506の一次キャッシュなどに一時的に保持される。 [0015] The spectral envelope extracted by the spectrum envelope extracting unit 104 is temporarily held such the primary cache of the RAM505 and the arithmetic unit 506. 次に前記演算装置506は,前記信号符号化プログラムに従って,割当ビット数決定部105として動作する。 The computing device 506 then in accordance with the signal encoding program, operates as an assignment bits determination section 105. 前記割当ビット数決定部105は,前記スペクトル包絡の各値に応じたビット数を各周波数成分に割り当てる。 The allocation bit number determining unit 105 allocates the number of bits corresponding to each value of the spectral envelope in each frequency component. 基本的には,前記スペクトル包絡の各値が大きい周波数成分ほど,多くのビットを割り当てる。 Basically, as the frequency component values ​​is greater of the spectral envelope, allocating more bits. 例えば,前記スペクトル包絡の各値を対数化する。 For example, the logarithm of each value of the spectral envelope. 対数化は必須ではないが,ビットの持つ特性上最も好ましい。 Logarithmic is not essential, the characteristics of the bit most preferred. 次に,予め設けておいた下限値が0になるように,前記スペクトル包絡を正規化する。 Next, as the lower limit value that has been previously provided is zero, normalizing the spectral envelope. 次に,対数化した前記スペクトル包絡の各値の総和を,複数に分割した各周波数帯毎に求める。 Then, obtaining the sum of each value of the spectral envelope obtained by logarithm, for each frequency band divided into a plurality. 次に,各周波数帯における前記スペクトル包絡の各値の和が,当該周波数帯の総ビット数と等しくなるような係数(=総ビット数/スペクトル包絡の各値の和)を,当該周波数帯における前記スペクトル包絡の各値に乗じ,その値に応じて各周波数成分に割り当てるビット数を算出する。 Then, the sum of each value of the spectral envelope in each frequency band, the total number of bits becomes equal such coefficient of the frequency band (= sum of the value of the total number of bits / spectral envelope) in the frequency band It multiplied to each value of the spectral envelope, and calculates the number of bits assigned to each frequency component in accordance with the value. 予め定められた全周波数領域における全総ビット数を,複数の周波数帯毎に配分するのは,ある周波数領域に大きな成分が集中した場合に,他の周波数領域に割り当てるビット数が極端に少なくなることを防止するためである。 The total number of the total bits in the predetermined entire frequency range is, is to allocate to each of a plurality of frequency bands, when concentrated large component in a certain frequency region, the number of bits is extremely small to be assigned to another frequency range it is to prevent. 大きな成分が集中する周波数領域の近くの領域にある成分は,マスク効果によって人間が知覚し難いが,離れた領域にある成分は,比較的知覚し易いからである。 Components near the region of the frequency domain a large component is concentrated, hardly human perceptible by the mask effect, but component in the remote area, because relatively easy to perceive. ビット数配分の割合は予め定めておいてもよいし,符号化の対象となった前記音響信号の周波数スペクトルに応じて定めるようにしてもよい。 Ratio of the number of bits allocation may be determined in advance, it may be determined in accordance with the frequency spectrum of the acoustic signal as an object of coding.
基本的には,低中領域における周波数帯に,より多くのビットを配分した方が,人間の聴覚特性に合致する。 Basically, the frequency band in the low and middle regions, better to allocate more bits, matching the human auditory characteristics. 前記スペクトル包絡の各値からビット数を定める際,少数点以下は切り捨てるか,若しくは四捨五入等の丸めを行う。 When determining the number of bits from each value of the spectral envelope, or the decimal point is rounded down, or to round the rounding or the like. また少ないビット数には丸め,多いビット数には切り捨てを適用するなど,ビット数に応じて異ならせてもよい。 The rounding the small number of bits, such as to apply truncation to number of bits may be different according to the number of bits. また,必要以上に多くのビットを割り当てても, Also, it is assigned more bits than necessary,
音質が向上することはないので,ビットの浪費を防止するため,例えば各周波数帯毎に割り当てるビット数の上限値を定めておき,前記スペクトル包絡の各値に応じたビット数が前記上限値を越える場合には,当該周波数成分に応じたビット数の代わりに前記上限値を割り当てる。 Since the sound quality will not be improved, in order to prevent the waste of bits, for example, is determined in advance the maximum number of bits to be allocated for each frequency band, the number of bits corresponding to each value of the spectral envelope is the upper limit value when exceeding assigns the upper limit value in place of the number of bits corresponding to the frequency components. 更に,必要に応じて,切り捨て丸め等により余ったビット数に対して,その周波数帯に配分した総ビット数と実際に配分したビット数の合計が等しくなるか,予め設けた範囲内に入るまで,上述した正規化の手順から繰り返すか,前記係数を調整する。 Further, if necessary, with respect to the number of bits remaining by such rounding truncation, until the or the total number of bits allocated to the frequency band actually total number of bits allocated is equal, falls within the ranges previously provided , either repeat from step normalization described above, adjusting the coefficients. 尚,前記割当ビット数決定部105が行う上述の通りの処理が,前記信号符号化プログラムが前記コンピュータに実行させる手順S1 The processing of as described above to the allocation bit number determining unit 105 performs the procedure the signal encoding program causes the computer to execute S1
03に対応する処理である。 Is a process which corresponds to the 03.

【0016】前記割当ビット数決定部105により定められた割当ビット数は,前記RAM505や前記演算装置506の一次キャッシュなどに一時的に保持される。 The allocated number of bits defined by the allocated bit number determining unit 105 is temporarily held such the primary cache of the RAM505 and the arithmetic unit 506.
次に前記演算装置506は,前記信号符号化プログラムに従って,周波数スペクトル量子化部106として動作する。 Then the arithmetic unit 506 in accordance with the signal encoding program, operates as a frequency spectrum quantization unit 106. 前記周波数スペクトル量子化部106は,前記周波数スペクトルのパワー成分を量子化するパワー成分量子化部1061,位相成分を量子化する位相成分量子化部1062,及び前記パワー成分が0となる周波数成分を位相成分から排除するための0成分排除部1063からなる。 The frequency spectrum quantization unit 106, the power component quantization unit 1061 quantizes the power component of the frequency spectrum, the phase component quantization unit 1062 quantizes the phase component, and a frequency component in which the power component is 0 of zero component elimination section 1063 for eliminating the phase component. 前記パワー成分量子化部1061には,前記周波数スペクトル演算部103から前記パワー成分が供給されており,前記割当ビット数決定部105から供給された割当ビット数に従って,前記パワー成分の各周波数成分が線形的又は非線形的に量子化される。 The power component quantization unit 1061, the has a frequency spectrum calculation unit 103 is supplied with the power component, in accordance with the number of allocated bits supplied from the allocation bit number decision unit 105, the frequency components of the power component It is linear or non-linear quantizing. 線形的に量子化を行う場合には,各周波数成分の量子化後の大きさは,当該周波数成分の大きさと当該周波数スペクトル成分のスペクトル包絡との比に前記割当ビット数で表現できる最大値を乗じた値によって表される。 When the linearly quantizes the magnitude of the post-quantization of each frequency component, the maximum value that can be said expressed by the number of assigned bits to the ratio of the spectral envelope of the magnitude and the frequency spectrum components of the frequency components represented by multiplying the value. 量子化演算の際に発生した小数点については,四捨五入等の丸めを行う。 The point that occurred during the quantization operation, to round rounding or the like. 但し,前記割当ビット数が少ない場合には,量子化ひずみが大きくなる可能性がある。 However, wherein when the number of allocated bits is small, there is a possibility that quantization distortion increases. このため,例えば前記割当ビット数が1ビットの場合と,2ビット以上の場合とで,次式(2a),(2b)の通り丸め方を異ならせるなどして,量子化ひずみを低減するようにした方が好ましい。 Thus, for example, the in the case allocated number of bits is 1 bit, and if two or more bits, the following equation (2a), and including differentiating the rounding as (2b), to reduce the quantization distortion If it is preferred. R=I nt (Sp/En+0.3) (2a) R=I nt (Sp×(2 Ba −1)/En+0.5) (2b) ここで,Rは量子化後の当該周波数成分の大きさ,Sp R = I nt (Sp / En + 0.3) (2a) R = I nt (Sp × (2 Ba -1) /En+0.5) (2b) where, R represents the size of the frequency components after quantization , Sp
は当該周波数成分の大きさ,Enは当該周波数成分のスペクトル包絡,Baは当該周波数成分の割当ビット数, The size of the frequency component, En is the spectral envelope of the frequency components, Ba is the number of allocated bits of the frequency components,
ntは整数化関数である。 I nt is an integer function. また,前記位相成分量子化部1062には,前記周波数スペクトル演算部103から前記位相成分が供給されており,例えば前記パワー成分量子化部1061と同じく前記割当ビット数決定部10 Further, the in phase component quantization unit 1062, the has a frequency spectrum calculation unit 103 is supplied with the phase component, for example the power component quantization section 1061 Like the allocated number of bits determining section 10
5から供給された割当ビット数に従って,前記位相成分の各周波数成分が量子化される。 According to the number of allocated bits supplied from the 5, each of the frequency components of the phase component is quantized. 但し,前記パワー成分が0となる周波数成分は復元されないので,前記パワー成分量子化部1061から出力されたパワー成分に従って,予め0成分排除部1063により,前記位相成分量子化部1062が量子化する対象から,当該周波数成分が除外される。 However, the frequency components in which the power component is 0 since it is not restored, according to the power component output from the power component quantization unit 1061, a pre-0 component elimination section 1063, the phase component quantization unit 1062 quantizes from the target, the frequency component is excluded. 前記位相成分は,復元した楽音(特に打撃音等)の明瞭さに大きな影響を与えるため,1ビットや2ビットなどの少ないビット数しか割り当てられなかった周波数成分に対して,余計に1ビット〜数ビットのビットを付加して,前記位相成分の再現性を向上させるようにしてもよい。 The phase component, because it affects the clarity of the recovered tone (in particular the impact noise or the like), relative to 1-bit or only unassigned frequency components smaller number of bits such as 2 bits, extra 1 bit - by adding a bit of several bits, it may be to improve the reproducibility of the phase component. また,前記位相成分では,極近辺の成分の位相差が特に重要となるため,絶対的な値を量子化するより,隣のサンプルとの差分を量子化するようにする方が好ましい。 Further, in the phase component, it becomes particularly important phase components around poles, the absolute value than quantization, the difference between adjacent samples is better to be quantized preferred. 但し,隣のサンプルとの差分を量子化する場合には,演算誤差等により絶対的な値からずれが生じる恐れがある。 However, in the case of quantizing the difference between adjacent samples, there is a possibility that deviation occurs from the absolute value by calculation errors or the like. このため,隣のサンプルとの差分を量子化する場合には,差分の対象を,隣のサンプルの絶対的な値ではなく,量子化した値の累積値とした方がよい。 Therefore, in the case of quantizing the difference between adjacent samples, the difference between the target, rather than the absolute value of the next sample, it is better to the cumulative value of the quantized values. 尚,前記周波数スペクトル量子化部106が行う上述の通りの処理が,前記信号符号化プログラムが前記コンピュータに実行させる手順S104に対応する処理である。 The processing of as described above wherein the frequency spectrum quantization unit 106 performs the said signal encoding program is a process corresponding to steps S104 to be executed by the computer.

【0017】上述の通り量子化された前記パワー成分と前記位相成分は,量子化ビット数こそ各周波数成分で異なるものの,ほぼ前記周波数スペクトルそのものである。 [0017] The a street quantized the power components of the above phase component, although what the number of quantization bits differs in each frequency component, is substantially the frequency spectrum itself. また,量子化ビット数は前記スペクトル包絡に応じて変化するが,各周波数成分よりも所定値以上小さくなることがないように抽出した前記スペクトル包絡は,マスク効果など人間の聴覚特性に結果的に合致しており, Further, the number of quantization bits is changed in accordance with the spectrum envelope, the spectral envelope extracted so as not to become smaller than a predetermined value than each frequency component, resulting in hearing characteristics of the human, such as a mask effect It is consistent,
品質上量子化前後で失われる情報は極僅かである。 Information lost in quality on quantization longitudinal is negligible. 前記周波数スペクトル量子化部106により量子化された前記パワー成分と前記位相成分は,前記RAM505や前記演算装置506の一次キャッシュなどに一時的に保持される。 Wherein said phase component and quantized the power component by a frequency spectrum quantization unit 106, are temporarily held, etc. in the primary cache of the RAM505 and the arithmetic unit 506. 次に前記演算装置506は,前記信号符号化プログラムに従って,符号化信号生成部107として動作する。 Then the arithmetic unit 506 in accordance with the signal encoding program, operates as an encoded signal generator 107. 前記符号化信号生成部107では,前記スペクトル包絡抽出部104により抽出されたスペクトル包絡, In the coded signal generating unit 107, the spectrum envelope extracted by the spectrum envelope extracting unit 104,
前記パワー成分量子化部1061により量子化されたパワー成分,及び前記位相成分量子化部1062により量子化された位相成分を基に,前記スペクトル包絡に関するスペクトル包絡情報,前記パワー成分に関するパワー成分情報,前記位相成分に関する位相成分情報を符号化した符号化信号が生成される。 The power component quantized by the power component quantization unit 1061, and based on the quantized phase component by the phase component quantization unit 1062, the spectral envelope information on the spectral envelope, power component information relating to the power component, encoded signal encoded phase component information on the phase component is generated. 前記スペクトル包絡情報は,前記スペクトル包絡を定めるのに必要な情報である。 The spectral envelope information is information required to determine the spectral envelope. 前記スペクトル包絡を上述の好適な手順で抽出した場合には,前記スペクトル包絡情報は,前記ピーク点の大きさ,前記ピーク点の周波数,前記谷関数の種類,前記谷関数のパラメータを含む。 When extracting the spectral envelope with a preferred procedure described above, the spectral envelope information includes the size of the peak point, the frequency of the peak point, the kind of the valley function, the parameters of the valley function. 上述の4つのパラメータは,ほぼ前記ピーク点の点数に比例する数だけ必要となる。 Four parameters mentioned above, it is necessary for the number proportional to the number of approximately the peak point. 即ち,前記ピーク点の点数を変更することによって,圧縮率を変化させることができる。 That is, by changing the number of the peak point, it is possible to change the compression ratio. 各ピーク点の大きさは,前記パワー成分の量子化とは別途に量子化される。 The size of each peak point is separately quantized and the quantization of the power component. 各ピーク点の大きさを量子化する際の量子化ビット数は,例えば予め定められたものを用いればよい。 Quantization bit number at the time of quantizing the magnitude of each peak point, for example, may be used as predetermined. この各ピーク点に対する量子化ビット数も,複数の周波数帯毎に定めるようにしてもよい。 The number of quantization bits for the respective peak points also may be determined for each of a plurality of frequency bands. 複数の周波数帯毎に前記ピーク点の大きさを量子化する場合,前記パワー成分の量子化と同様,低中周波数領域に配分するビット数を多くした方がよい。 When quantizing the magnitude of the peak point for each of a plurality of frequency bands, similar to the quantization of the power component, it is better to increase the number of bits allocated to the low and middle frequency range. また,前記ピーク点の周波数は,絶対周波数よりも隣のピーク点との差分周波数で表現した方が,必要なビット数を低減させることができる。 The frequency of the peak point can be better than absolute frequency expressed by the difference frequency between the peak point of the neighboring reduces the required number of bits. 前記谷関数の種類は,複数の谷関数を使用する場合にのみ必要で,予め谷関数を定める場合には,省略可能である。 Type of the valley function is only necessary when using multiple valleys functions, when determining the pre-valley function, it can be omitted. また,前記谷関数のパラメータは,前記谷関数の種類により,一つの場合もあるし,複数の場合もある。 The parameter of the valley function, the type of the trough function, to some cases of single, sometimes multiple. 前記正弦波関数やその平方根関数を用いる場合には,前記パラメータは,振幅Aの一つのみでよい。 When using the sinusoidal function and their square root function, the parameters may only one amplitude A. この振幅は,2〜4 This amplitude, 2-4
ビットの量子化ビット数で表現するのが適当である。 It is appropriate to express the quantization bit number of the bit. 前記パワー成分情報は,基本的に,上述のようにして量子化されたパワー成分そのものである。 The power component information is basically the power component itself quantized as described above. 但し,前記ピーク点の大きさや,前記ピーク点の周波数は,前記スペクトル包絡情報に含まれるので,前記パワー成分から取り除くことが可能である。 However, the size and the peak point, the frequency of the peak point, so are included in the spectrum envelope information can be removed from the power component. また,前記位相成分情報も,基本的には,上述のようにして量子化された位相成分そのものである。 Further, the phase component information is also basically the phase component itself quantized as described above. もちろん,上述のように量子化された前記パワー成分や前記位相成分に何らかの符号化処理を施したものを前記パワー成分情報や前記位相成分情報とするようにしてもよい。 Of course, it may be those subjected to some coding to the power component and the phase component that is quantized as described above such that said power component information and said phase component information. 例えば前記位相成分について絶対値ではなく差分値に対して量子化を行った場合,小さな値が出現する頻度が高くなるため,必要に応じて,ハフマン符号化を施すと,符号化信号のデータ量をより小さくすることができる。 For example, the case of performing the quantization on the differential values ​​rather than absolute values ​​for the phase component, since the frequency of small value appears becomes higher, if necessary, when subjected to Huffman coding, data amount of the encoded signal it can be further reduced. 尚,前記符号化信号生成部107が行う上述の通りの処理が,前記信号符号化プログラムが前記コンピュータに実行させる手順S105に対応する処理である。 The processing of as described above wherein said coded signal generating unit 107 is performed by the signal encoding program is a process corresponding to steps S105 to be executed by the computer. 前記符号化信号生成部107から出力された符号化信号は,出力端子108を介して,例えば前記コンピュータのハードディスクドライブ504上などに保存される。 Coded signal outputted from the coded signal generating unit 107, via the output terminal 108, for example, are stored like on a hard disk drive 504 of the computer. このようにして,前記信号符号化装置により符号化された符号化信号を保存するのに必要な記憶容量は,線形PCM 方式により前記音響信号を符号化した場合よりずっと少なく,前記MP3 やTwinVQと同等かそれより少ない。 In this way, the storage capacity required to store the encoded signal encoded by the signal encoding apparatus is much less than when coding the audio signal by a linear PCM method, and the MP3 and TwinVQ equal to or less than that. また,周波数スペクトルをほぼそのまま符号化するため,音質の劣化は少ない。 Further, in order to substantially coded as a frequency spectrum, deterioration in sound quality is small. しかも,前記周波数スペクトル包絡情報を定める際には一度だけFFT 変換を行えばよく, スペクトル包絡情報を用いる前記MP3 やTwin Moreover, the frequency spectrum in determining the envelope information may be performed FFT transformation only once, the MP3 or Twin using spectral envelope information
VQと較べて演算量を大幅に低減することができる。 It is possible to greatly reduce the calculation amount compared to the VQ.

【0018】前記信号符号化装置1により生成された符号化信号を復号化するのに好適な装置が,前記信号復号化装置2である。 [0018] The signal encoding device suitable device to decrypt the generated coded signal by 1, which is the signal decoding apparatus 2. 前記信号復号化プログラムが実行され,前記コンピュータが前記信号復号化装置2として動作すると,はじめに例えば復号化対象となる前記符号化信号の指定等を行うためのダイアログが前記出力装置5 The signal decoding program is executed and the computer is operated as the signal decoding apparatus 2, dialog said output device for designating like of the coded signal to be started, for example, decoded 5
02に表示される。 02 to be displayed. 使用者により,復号化対象となる前記符号化信号が指定されると,当該符号化信号に対して復号化処理が開始される。 By the user, when the coded signal to be decoded is designated, the decoding process on the coded signal is started. 前記信号復号化装置2において,入力端子201を介して入力された前記符号化信号は,バッファ202に一時的に格納される。 In the signal decoding apparatus 2, the coded signal inputted through the input terminal 201 is temporarily stored in the buffer 202. 前記信号復号化装置2が前記コンピュータによって実現されるこの例では,前記バッファ202には,前記ハードディスクドライブ504や前記RAM505などが利用される。 In this example the signal decoding apparatus 2 is implemented by the computer, to the buffer 202, such as the hard disk drive 504 and the RAM505 is utilized.
前記バッファ202として利用される前記ハードディスクドライブ504上などに格納された前記符号化信号は,スペクトル包絡復元部203,周波数スペクトル復号化部205として動作する前記演算装置506によって読み出されることになる。 The coded signal stored like on the hard disk drive 504 is used as the buffer 202 will be read by the computing device 506 that operates as a spectral envelope restoring unit 203, the frequency spectrum decoding section 205. 前記スペクトル包絡復元部203は,前記符号化信号から前記スペクトル包絡情報を取得し,該取得した前記スペクトル包絡情報に基づいて前記音響信号の周波数スペクトルの各周波数成分に対する前記スペクトル包絡を復元する。 The spectral envelope restoring unit 203, the obtains the spectral envelope information from the encoded signal, reconstructing the spectrum envelope with respect to each frequency component of the frequency spectrum of the acoustic signal on the basis of the acquired said spectrum envelope information. 前記スペクトル包絡情報が,例えばピーク点の大きさ,ピーク点の周波数,谷関数の種類,谷関数のパラメータを含むのは既述の通りである。 The spectral envelope information, for example, the size of the peak point, the frequency of the peak point, the kind of trough function, contain the parameters of the valley function is as described above. 前記ピーク点の大きさを表現するのに用いた量子化ビット数が,前記スペクトル包絡情報に含まれている場合には,当該量子化ビット数を用いて前記ピーク点の大きさを復元するが,前記スペクトル包絡情報に必要なデータ量をできるだけ低減するために,前記量子化ビット数は,前記信号符号化装置1と前記信号復号化装置2とで予め共通化しておくのが望ましい。 Number of quantization bits used to represent the magnitude of the peak point, if included in the spectral envelope information is to restore the size of the peak point by using the number of the quantization bits , in order to reduce as much as possible the amount of data necessary for the spectrum envelope information, the number of quantization bits, it is desirable advance common to the said signal coding apparatus 1 and the signal decoding apparatus 2. 前記ピーク点の大きさとその周波数が定まると,前記谷関数の種類及び前記谷関数のパラメータ(例えば係数A)を前記スペクトル包絡情報から取得すれば,前記スペクトル包絡が復元される。 The size of the peak point and the its frequency is determined, if the acquisition parameters of the type and the valleys function of the valley function (e.g., Factor A) from said spectral envelope information, the spectral envelope is restored. 尚,前記スペクトル包絡復元部20 Incidentally, the spectral envelope restoring unit 20
3が行う上述の通りの処理が,前記信号復号化プログラムが前記コンピュータに実行させる手順S201に対応する処理である。 Process as described above which 3 performed by the signal decoding program is processing corresponding to step S201 to be executed by the computer. 前記スペクトル包絡復元部203により復元された前記スペクトル包絡は,割当ビット数取得部204に供給される。 The spectral envelope reconstructed by the spectrum envelope restoring unit 203 are supplied to allocated number of bits acquisition unit 204. 前記割当ビット数取得部204 The allocated number of bits acquiring unit 204
は,前記スペクトル包絡から,前記音響信号の周波数スペクトルの各周波数成分に割り当てられた割当ビット数を取得する。 From the spectral envelope to obtain the number of assigned bits assigned to each frequency component of the frequency spectrum of the acoustic signal. 前記スペクトル包絡から前記割当ビット数を取得する処理は,前記信号符号化装置1の前記割当ビット数決定部105が行う処理と同様である。 The process of obtaining the spectral envelope of the number of allocated bits is the same as the processing by the signal the allocated bit number determining section 105 of the encoding apparatus 1 performs. 尚,前記割当ビット数取得部204が行う上述の通りの処理が, Incidentally, the processing as described above for the allocated bit number obtaining unit 204 is performed,
前記信号復号化プログラムが前記コンピュータに実行させる手順S202に対応する処理である。 Is a process wherein the signal decoding program corresponding to the steps S202 to be executed by the computer. 前記割当ビット数取得部204により取得された各周波数成分に対する割当ビット数は,周波数スペクトル復号化部205に供給される。 Allocated number of bits for each frequency component obtained by the allocated bit number obtaining unit 204 is supplied to the frequency spectrum decoding section 205.

【0019】前記周波数スペクトル復号化部205は, [0019] The frequency spectrum decoding section 205,
前記パワー成分を復号化するパワー成分復号化部205 Power component decoder 205 for decoding the power component
1,前記位相成分を復号化する位相成分復号化部205 1, the phase component decoder 205 for decoding the phase component
2,0成分を排除するための0成分排除部2053を具備する。 Comprising a 0 component elimination unit 2053 for excluding the 2,0 component. 前記パワー成分復号化部2051は,前記バッファ202に格納された前記符号化信号から前記周波数スペクトル情報のうちのパワー成分情報を取得し,前記割当ビット数取得部204により取得された各周波数成分に対する割当ビット数に応じて,前記パワー成分を復号化する。 The power component decoder 2051, for each frequency component to acquire the power component information, acquired by the allocated bit number obtaining unit 204 of the frequency spectrum information from the coded signal stored in the buffer 202 depending on the number of allocated bits, decoding the power component. 前記パワー成分情報がビットストリーム化されていれば,各周波数成分に対する前記割当ビット数づつ順次取り出せば,前記パワー成分が復号化される。 If the power component information is a bit stream, if sequentially taken out one by said number of allocated bits for each frequency component, the power component is decoded. また,前記位相成分復号化部2052は,前記バッファ2 Further, the phase component decoder 2052, the buffer 2
02に格納された前記符号化信号から前記周波数スペクトル情報のうちの位相成分情報を取得し,前記割当ビット数取得部204により取得された各周波数成分に対する割当ビット数に応じて,前記位相成分を復号化する。 Stored in 02 is obtained the phase component information of said frequency spectrum information from said encoded signal, according to the number of allocated bits for each frequency component obtained by the allocated bit number obtaining unit 204, the phase component to decrypt.
但し,前記パワー成分の大きさが0の周波数成分は復元されないので,前記パワー成分復号化部2051により復号化された前記パワー成分に基づき,前記位相成分復号化部2052が復号化を行う対象から,前記0成分排除部2053により前記パワー成分が0の周波数成分が除外される。 However, since the frequency components of the magnitude of the power component is 0 is not restored, on the basis of the power components decoded by the power component decoder 2051, from a subject said phase component decoder 2052 performs decoding , the frequency components of the power component is 0 is excluded by the 0 component eliminating unit 2053. 前記パワー成分や位相成分の量子化する際に,上式(2a)や(2b)を用い,割当ビット数に応じて丸め処理を異ならせた場合には,次式(3a), In quantizing the power component and the phase component, using the above equation (2a) or (2b), when having different rounding according to the number of allocated bits, the following equation (3a),
(3b)に従って,復号化処理を行う。 According (3b), perform the decoding process. Sp=0.85×R×Ep (3a) Sp=R×Ep/(2 Ba −1) (3b) 尚,前記周波数スペクトル復号化部205が行う上述の通りの処理が,前記信号復号化プログラムが前記コンピュータに実行させる手順S203に対応する処理である。 Sp = 0.85 × R × Ep ( 3a) Sp = R × Ep / (2 Ba -1) (3b) The processing in as described above, wherein the frequency spectrum decoding section 205 performed by the signal decoding program There is a process corresponding to steps S203 to be executed by the computer. 前記パワー成分復号化部2051,及び前記位相成分復号化部2052により前記パワー成分,及び前記位相成分が復号化されると,次に前記演算装置506は, The power component decoder 2051, and the power component by the phase component decoder 2052, and when the phase component is decoded, then the arithmetic unit 506
信号復元部206として動作する。 It operates as a signal restoration unit 206. 前記信号復元部20 The signal restorer 20
6では,前記パワー成分復号化部2051により復号化された前記パワー成分と,前記位相成分復号化部205 In 6, a decoded the power component by the power component decoder 2051, the phase component decoder 205
2により復号化された前記位相成分とから,実数成分と虚数成分とを導出して,IFFT(Inverse FFT) 演算を行い,時間領域の信号に変換し,前記音響信号を復元する。 And a decoded the phase component by 2, to derive the real and imaginary components, performs IFFT (Inverse FFT) calculation, converted into a signal in the time domain, for restoring the acoustic signal. 前記信号符号化装置1において,各フレームに窓関数が施されている場合には,前記IFFT演算後の値に,対応する窓関数の逆関数を乗じ復元する必要がある。 In the signal encoding apparatus 1, if you have a window function is applied to each frame, the value after the IFFT operation, it is necessary to restore multiplied by the inverse function of the corresponding window function. 前記窓関数に関する情報は,前記信号符号化装置1と前記信号復号化装置2とで共通化しておくか,前記符号化信号に含ませる。 Information on the window function, either leave in common between the signal encoding apparatus 1 and the signal decoding apparatus 2, included in the encoded signal. 各フレームの結合部については,窓関数を施した部分を,オーバーラップさせることにより,結合部の不連続性に伴うノイズを除去することができる。 The coupling portion of each frame, a portion subjected to the window function, by overlapping, it is possible to remove the noise associated with discontinuities in the bond portion. また,窓関数を施した部分の近傍の部分を除外して,残った部分の両端に窓関数を乗じて結合部を再生することも有効である。 Further, by excluding the portion in the vicinity of the portion subjected to the window function, it is effective to reproduce the coupling portion is multiplied by a window function on both ends of the remaining portion. その場合には,フレーム分割の際に除外する部分を予め余計に確保しておく必要がある。 In that case, it is necessary to previously extra secure excluded portion during frame division. 尚,前記信号復元部205が行う上述の通りの処理が,前記信号復号化プログラムが前記コンピュータに実行させる手順S204に対応する処理である。 The processing of as described above which is the signal restoration unit 205 performs the said signal decoding program is processing corresponding to step S204 to be executed by the computer.

【0020】そして,前記信号復元部206により復元された前記音響信号について,再生実行の指示が与えられると,前記音響信号は,D/A変換器207によりアナログ化されてから,出力端子208を介してスピーカなどから出力される。 [0020] Then, the the signal restoration unit the acoustic signal restored by 206, when the instruction for the reproduction execution is given, the acoustic signal from an analog by D / A converter 207, an output terminal 208 output from the speaker through. このように,本発明の実施の形態に係る信号復号化装置は,前記信号符号化装置により生成された符号化信号を復号化して,時間的に変化する対象信号を復元するのに好適である。 Thus, the signal decoding apparatus according to an embodiment of the present invention decodes the encoded signal generated by the signal encoding apparatus, it is preferable to restore the time-varying signal of interest . 前記信号復号化装置においても,周波数領域から時間領域に変換する逆変換の処理は,復号化を行うにあたって一度行うだけでよいから,全体の演算量は少なくてすみ,短時間で前記対象信号の復号化を行うことができ,また実時間再生を行うのも容易になる。 Also in the signal decoding apparatus, the processing of the inverse transform for converting from the frequency domain to the time domain, since it is only performed once in performing decoding, fewer overall calculation amount, in a short time the target signal You can perform the decoding, and it becomes easy to reproduce real time. また,前記信号復号化装置(及び信号復号化プログラム)の処理のほとんどは,前記信号符号化装置(及び信号符号化プログラム)の処理と共通の, Also, most of the processing of the signal decoding apparatus (and signal decoding program), the signal encoding apparatus processes the common (and signal encoding program),
又は対照的な処理であり,一台の装置及び一つのプログラムによって両者を構成することが比較的容易である。 Or a contrasting process, it is relatively easy to configure both the single apparatus and a program.
ここで,図9に源信号と,前記MP3 により符号化・復号化した後の信号と,本実施の形態に係る方式により符号化・復号化した後の信号と,のパワー成分を比較して示す。 Here, compared with the original signal in Figure 9, the signal after coding and decoding by the MP3, and the signal after coding and decoding the method according to the present embodiment, the power components of show. 尚,前記MP3 と本実施の形態に係る方式のビットレートは両方とも128kbpsである。 The bit rate of the system according to the present embodiment and the MP3 are both a 128kbps. 図9に示す通り,本実施の形態に係る方式の周波数スペクトルは,低周波領域から高周波領域に渡ってよく一致しているが, As shown in FIG. 9, the frequency spectrum of the system according to the present embodiment is in good agreement over from the low frequency region to high frequency region,
前記MP3 によるものは,特に低周波領域と高周波領域で源信号のものと大きく異なっている。 By the MP3 differs particularly significantly from those of the low-frequency region and high frequency region in the source signal. 即ち,本実施の形態に係る符号化・復号化方式では,同じ圧縮率ながら高い品質を確保することができる。 That is, the encoding and decoding method according to the present embodiment, it is possible to secure high quality while the same compression ratio. また,その際の演算量も少ない。 Further, the calculation amount at that time is small.

【0021】 [0021]

【実施例】前記実施の形態では,前記信号符号化装置1,及び前記信号復号化装置2を一台のコンピュータにより実現する例を説明したが,これに限られるものでなく,例えば前記信号符号化装置1と前記信号復号化装置2とを別個のコンピュータにより実現するようにしてもよい。 EXAMPLES In the above embodiment, the signal encoding apparatus 1, and an example has been described to achieve by the signal decoding apparatus 2 to a single computer, not limited to this, for example, the signal codes it may be implemented by apparatus 1 and the signal decoding apparatus 2 and a separate computer. 前記信号符号化装置1を実現するコンピュータによって生成された符号化信号は,各コンピュータに備えられている前記通信装置を用い,インターネットなどを介して,前記信号復号化装置2を実現するコンピュータに伝送するようにすればよい。 Encoded signal generated by the computer to realize the signal encoding apparatus 1, using the communication device included in each computer, via the Internet, transmitted to the computer to realize the signal decoding apparatus 2 it suffices to be. 前記信号符号化装置1を実現するコンピュータは,例えば前記符号化信号を,当該通信に対応したプロトコロルに応じたパケットに格納し,前記信号符号化装置2は該パケットをデパケットした後,復号化処理を行う。 Computer, for example, the coded signal, and stores the packet corresponding to Purotokororu corresponding to the communication, after the signal encoding apparatus 2 was depacketed the packet, the decoding process for implementing the signal encoding apparatus 1 I do. 伝送時間が保証されないネットワークを介して実時間再生を行う場合,前記符号化信号に含まれる前記スペクトル包絡情報,及び前記周波数スペクトル情報(前記パワー成分情報,前記位相成分情報)は,同じパケットに格納されることが好ましい。 Case of reproducing real time via a network transmission time is not guaranteed, the spectral envelope information contained in the encoded signal, and the frequency spectral data (the power component information, the phase component information) is stored in the same packet it is preferred that the. 但し,各々の情報を別々のパケットに格納した場合でも, However, even when storing respective information on separate packets,
例えば前記スペクトル包絡情報と前記パワー成分情報のみ,前記スペクトル包絡情報と前記位相成分情報のみ, For example, the spectral envelope information only the power component information, and the spectral envelope information only the phase component information,
又は前記周波数スペクトル情報のみを格納したパケットが到着していれば,音質は劣化するものの受信側で再生を行うことは可能である。 Or if only packets containing arrived the frequency spectrum information, the sound quality is possible to reproduce on the receiving side of which deteriorated. また,前記信号符号化装置1,及び前記信号復号化装置2は,汎用のコンピュータによって実現するのではなく,DSPなどを備えた専用のハードウェアにより実現するようにしてもよい。 Further, the signal encoding apparatus 1, and the signal decoding apparatus 2, instead of implementing the general-purpose computer may be implemented by dedicated hardware with such DSP. この場合にも,同一の装置に前記信号符号化装置1及び前記信号復号化装置2を備えさせてもよいし,別個の装置に前記信号復号化装置1及び前記信号復号化装置2をそれぞれ備えさせてもよい。 In this case also, the signal encoding apparatus 1 and may be allowed provided the signal decoding apparatus 2 in the same device, each comprise the signal decoding apparatus 1 and the signal decoding apparatus 2 to separate devices it may be. また,前記実施の形態では,前記音響信号を符号化,復号化する例を説明したが,これに限られるものではなく,静止画像や,動画像など時間的,又は空間的に変化する他の対象信号についても本発明を適用することは可能である。 Further, in the above embodiment, the encoded audio signal, an example has been described for decoding, this is not limited, a still image and a moving image such as temporal or spatially varying other it is possible to apply the present invention also target signal. 例えば前記対象信号が空間的に変化する静止画像の場合,FFT などの変換を2 For example, in the case of still images the target signal changes spatially, a transformation such as FFT 2
次元的に行うと,空間周波数領域のスペクトル分布が得られる。 When dimensionally performed, the spectral distribution of the spatial frequency domain is obtained. 各空間周波数成分のスペクトル強度に応じて, Depending on the spectral intensity of each spatial frequency component,
当該空間周波数成分に割り当てる割当ビット数を変化させる。 Changing the number of assigned bits assigned to the spatial frequency components. また,既述の通り前記フレーム幅は圧縮率に影響を与えるため,前記フレーム幅を前記対象信号に対して動的に最適化する処理を加えてもよい。 Moreover, since as said frame width above the affecting compressibility, the frame width may be added a process of dynamically optimized for the target signal. 最適化の手法としては,例えば次の(1)〜(4)がある。 The optimization method, for example, there are the following (1) to (4). (1) フレーム幅を変化させて,最もスペクトル包絡の面積が小さくなるフレーム幅を採用する。 (1) by changing the frame width, adopting the frame width area of ​​most spectral envelope decreases. (2) フレーム幅を変化させて,同程度の圧縮率でそれぞれ圧縮し,圧縮したスペクトルと非圧縮のスペクトルの差が,最も小さくなるフレーム幅を採用する。 (2) by changing the frame width, and compressed respectively at comparable compression ratios, the difference in the spectrum of the compressed spectrum and uncompressed, to adopt the smallest frame width. (3) フレーム幅を変化させて,同程度のスペクトル精度が得られる圧縮率でそれぞれ圧縮して,圧縮率が最も小さくなるフレーム幅を採用する。 (3) by changing the frame width and compressed respectively at a compression rate of spectral accuracy comparable to obtain the compression ratio to adopt smallest frame width. (4) 上述の(1),(2),(3)のいずれか,又はこれらの組み合わせて,圧縮率或いはスペクトル精度が最も良いフレーム幅を,予め統計的手法で決定して, (4) above (1), (2), (3) either, or a combination thereof, the compression ratio or spectral accuracy is best frame width, as determined by pre-statistical method,
そのフレーム幅を使用する。 To use the frame width. このとき音声(男女別), At this time, the voice (by gender),
楽音の種類(ポップス,ロック,演歌等)別に,フレーム幅を算出することも有効である。 Type of tone (pop, rock, Enka, etc.) separately, it is also effective to calculate the frame width. また,前記実施の形態では,周波数スペクトルに関連してFFT やIFFTを用いたが, これに限られるものではなく,MDCT(Modified De Further, in the embodiment, using FFT and IFFT with respect to the frequency spectrum is not limited to this, MDCT (Modified De
screte Cosine Transform)などの他の変換処理,逆変換処理を用いるようにしてもよい。 screte Cosine Transform) other conversion processes, such as may be used an inverse transform process.

【0022】 [0022]

【発明の効果】以上説明した通り,前記請求項1に記載の信号符号化装置によれば,少ない演算量で高い圧縮率と品質とを確保することのできる。 As described in the foregoing, according to the signal encoding apparatus according to claim 1, capable of ensuring a small amount of calculation at a high compression rate and the quality. また,前記請求項2 Further, it claims 2
に記載の発明によれば,前記請求項1に記載の信号符号化装置により生成された符号化信号を復号化して,時間的又は空間的に変化する対象信号を復元するのに好適であって復号化に伴う演算量も少ない信号復号化装置を提供することができる。 According to the invention described in the in claim 1 decodes the encoded signal generated by the signal encoding apparatus according to, a suitable for restoring the temporal or spatially varying signal of interest it is possible to provide even a small signal decoding apparatus computation amount due to decoding. また,前記請求項3に記載のコンピュータ読み取り可能な記録媒体によれば,前記請求項1に記載の信号符号化装置をコンピュータにより実現するのに好適な信号符号化プログラムを提供することができる。 Also, the according to the computer-readable recording medium according to claim 3, it is possible to provide a suitable signal encoding program for implementing by a computer the signal encoding apparatus according to claim 1. また,前記請求項4に記載のコンピュータ読み取り可能な記録媒体によれば,前記請求項1に記載の信号符号化装置によって生成された符号化信号を,又は前記請求項3に記載の信号符号化プログラムに従ってコンピュータにより生成された符号化信号を復号化して,時間的又は空間的に変化する対象信号を復元するのに好適な信号復号化プログラムを提供することができる。 Further, according to the computer-readable recording medium according to claim 4, the encoded signal generated by the signal encoding apparatus according to claim 1, or signal coding according to claim 3 by decoding the coded signal generated by the computer according to a program, it is possible to provide a suitable signal decoding program to restore the temporal or spatial target signal changes.

【図面の簡単な説明】 BRIEF DESCRIPTION OF THE DRAWINGS

【図1】 本発明の実施の形態に係る信号符号化装置の概略構成を示す図。 Diagram showing a schematic configuration of a signal encoding apparatus according to an embodiment of the present invention; FIG.

【図2】 本発明の実施の形態に係る信号復号化装置の概略構成を示す図。 2 is a diagram showing a schematic configuration of a signal decoding apparatus according to an embodiment of the present invention.

【図3】 本発明の実施の形態に係る信号符号化プログラムを説明するためのフローチャート。 Figure 3 is a flowchart for explaining a signal encoding program according to an embodiment of the present invention.

【図4】 本発明の実施の形態に係る信号復号化プログラムを説明するためのフローチャート。 FIG. 4 is a flowchart for explaining the signal decoding program according to an embodiment of the present invention.

【図5】 前記信号符号化装置,前記信号復号化装置を実現するコンピュータの構成例を示す図。 5 is a diagram showing a configuration example of the signal encoding apparatus, a computer for implementing the signal decoding apparatus.

【図6】 スペクトル包絡抽出処理を説明するためのフローチャート。 FIG. 6 is a flowchart for explaining a spectrum envelope extracting process.

【図7】 スペクトル包絡抽出処理における谷関数の決定手法を説明するための図。 7 is a diagram for explaining a method of determining the valleys function in the spectrum envelope extracting process.

【図8】 抽出したスペクトル包絡の例を示す図。 8 is a diagram showing an example of the extracted spectral envelope.

【図9】 源信号,本方式,その他の符号化方式を周波数スペクトルを比較して示す図。 [9] source signals, this method, shows to other coding scheme by comparing the frequency spectrum.

【符号の説明】 DESCRIPTION OF SYMBOLS

103…周波数スペクトル演算部 104…スペクトル包絡抽出部 105…割当ビット数決定部 106…周波数スペクトル量子化部 107…符号化信号生成部 203…スペクトル包絡復元部 204…割当ビット数取得部 205…周波数スペクトル復号化部 206…信号復元部 103 ... frequency spectrum calculation unit 104 ... spectrum envelope extracting unit 105 ... allocated bit number determining section 106 ... frequency spectrum quantization unit 107 ... encoded signal generator 203 ... spectral envelope restoring unit 204 ... allocated number of bits acquiring unit 205 ... frequency spectrum decoding unit 206 ... signal restorer

───────────────────────────────────────────────────── フロントページの続き (54)【発明の名称】 信号符号化装置,及び信号復号化装置,並びに信号符号化プログラムを記録したコンピュータ読 み取り可能な記録媒体,及び信号復号化プログラムを記録したコンピュータ読み取り可能な記録 媒体 ────────────────────────────────────────────────── ─── front page of continued (54) [Title of invention] signal coding apparatus, and a signal decoding apparatus, as well as signal encoding program recorded computer read-capable recording medium, and recording a signal decoding program a computer-readable recording medium

Claims (4)

    【特許請求の範囲】 [The claims]
  1. 【請求項1】 時間的又は空間的に変化する対象信号の周波数スペクトルを求める周波数スペクトル演算手段と,前記周波数スペクトル演算手段により演算された前記対象信号の周波数スペクトルからスペクトル包絡を抽出するスペクトル包絡抽出手段と,前記スペクトル包絡抽出手段により抽出された前記スペクトル包絡に応じて,前記対象信号の周波数スペクトルの各周波数成分に割り当てる割当ビット数を定める割当ビット数決定手段と,前記割当ビット数決定手段により定められた前記割当ビット数に基づいて,前記対象信号の周波数スペクトルを量子化する周波数スペクトル量子化手段と,前記周波数スペクトル量子化手段により量子化された前記対象信号の周波数スペクトルに関する周波数スペクトル情報と,前記スペクトル包絡 1. A frequency spectrum calculating means for calculating a frequency spectrum of the time or spatially varying object signal, the spectrum envelope extracting for extracting spectrum envelope from the frequency spectrum of the computed the target signal by the frequency spectrum calculation means and means, in response to said spectral envelope extracted by the spectrum envelope extracting means, and allocation bit number decision means for determining the number of assigned bits assigned to each frequency component of the frequency spectrum of the target signal, by the allocated bit number determining means based on the number of allocated bits determined, a frequency spectrum quantizing means for quantizing the frequency spectrum of the target signal, by the frequency spectrum quantizing means and the frequency spectral information about the frequency spectrum of the target signal quantized , the spectral envelope に関するスペクトル包絡情報とを符号化した符号化信号を生成する符号化信号生成手段とを具備してなる信号符号化装置。 Signal encoding apparatus comprising; and a coded signal generating means and the spectral envelope information to generate an encoded signal encoded about.
  2. 【請求項2】 時間的又は空間的に変化する対象信号の周波数スペクトルに関する周波数スペクトル情報と前記対象信号のスペクトル包絡に関するスペクトル包絡情報とを符号化した符号化信号から前記スペクトル包絡情報を取得し,該取得した前記スペクトル包絡情報に基づいて前記対象信号の周波数スペクトルの各周波数成分に対する前記スペクトル包絡を復元するスペクトル包絡復元手段と,前記スペクトル包絡復元手段により復元された前記スペクトル包絡から,前記対象信号の周波数スペクトルの各周波数成分に割り当てられた割当ビット数を取得する割当ビット数取得手段と,前記符号化信号から前記周波数スペクトル情報を取得し,前記割当ビット数取得手段により取得された前記割当ビット数に基づいて, Wherein acquiring the spectral envelope information and spectrum envelope information from the encoded coded signal related to the spectral envelope of the frequency spectrum information about the frequency spectrum of the time or spatially varying target signal and the target signal, a spectral envelope restoring means for restoring the spectral envelope for each frequency component of the frequency spectrum of the acquired said spectrum envelope information the target signal based on, from said spectral envelope reconstructed by the spectrum envelope restoring unit, wherein the target signal the allocation of bits to get the allocation bit number obtaining means for obtaining the number of allocated bits allocated to each frequency component of the frequency spectrum, the frequency spectrum information from the encoded signal, which is acquired by the allocated number of bits acquiring means based on the number,
    前記取得した前記周波数スペクトル情報から前記対象信号の周波数スペクトルを復号化する周波数スペクトル復号化手段と,前記周波数スペトル復号化手段により復号化された前記対象信号の周波数スペクトルに基づいて, And the frequency spectrum decoding means for decoding the frequency spectrum of said target signal from said acquired the frequency spectrum information, based on the frequency spectrum of the decoded said target signal by the frequency Supetoru decoding means,
    前記対象信号を復元する信号復元手段とを具備してなる信号復号化装置。 Signal decoding apparatus comprising; and a signal restoring means for restoring the target signal.
  3. 【請求項3】 コンピュータに,空間的又は時間的に変化する対象信号の周波数スペクトルを求める手順,前記対象信号の周波数スペクトルからスペクトル包絡を抽出する手順,前記スペクトル包絡に応じて,前記対象信号の周波数スペクトルの各周波数成分に割り当てる割当ビット数を定める手順,前記割当ビット数に基づいて,前記対象信号の周波数スペクトルを量子化する手順,前記対象信号の周波数スペクトルに関する周波数スペクトル情報と,前記スペクトル包絡を定めるスペクトル包絡情報とを符号化した符号化信号を生成する手順を実行させるための信号符号化プログラムを記録したコンピュータ読み取り可能な記録媒体。 To 3. A computer procedure for extracting procedure for determining the frequency spectrum of the target signal that varies spatially or temporally, the spectral envelope from the frequency spectrum of the object signal in response to the spectral envelope of the target signal procedure for determining the number of assigned bits assigned to each frequency component of the frequency spectrum, based on the allocated number of bits, the procedure for quantizing the frequency spectrum of the target signal, the frequency spectrum information about the frequency spectrum of the object signal, the spectral envelope spectral envelope information and the encoded coded signal computer-readable recording medium recording a signal encoding program for executing the steps of generating a defining a.
  4. 【請求項4】 コンピュータに,時間的又は空間的に変化する対象信号の周波数スペクトルに関する周波数スペクトル情報と前記対象信号のスペクトル包絡に関するスペクトル包絡情報とを符号化した符号化信号から前記スペクトル包絡情報を取得し,前記スペクトル包絡情報に基づいて前記対象信号の周波数スペクトルの各周波数成分に対する前記スペクトル包絡を復元する手順,前記スペクトル包絡から,前記対象信号の周波数スペクトルの各周波数成分に割り当てられた割当ビット数を取得する手順,前記符号化信号から前記周波数スペクトル情報を取得し,前記割当ビット数に基づいて,前記周波数スペクトル情報から前記対象信号の周波数スペクトルを復号化する手順,前記対象信号の周波数スペクトルに基づいて前記対象信号を復 4. A computer, the spectral envelope information from the encoded signal obtained by encoding the spectral envelope information about the spectral envelope of the temporally or spatially varying the frequency spectrum information about the frequency spectrum of the target signal to be the target signal acquired, the procedure for restoring the spectral envelope for each frequency component of the frequency spectrum of the target signal based on the spectral envelope information, from said spectral envelope, assigned bits assigned to each frequency component of the frequency spectrum of said target signal procedure for acquiring the number, obtains the frequency spectrum information from said encoded signal, based on the allocated number of bits, the procedure for decoding a frequency spectrum of said target signal from said frequency spectrum information, the frequency spectrum of said target signal restore the target signal based on 元する手順を実行させるための信号復号化プログラムを記録したコンピュータ読み取り可能な記録媒体。 Computer readable recording medium recording a signal decoding program for executing the original procedures.
JP36957199A 1999-12-27 1999-12-27 Signal encoding device and signal decoding device, and computer-readable recording medium with recorded signal encoding program and computer-readable recording medium with recorded signal decoding program Pending JP2001184090A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP36957199A JP2001184090A (en) 1999-12-27 1999-12-27 Signal encoding device and signal decoding device, and computer-readable recording medium with recorded signal encoding program and computer-readable recording medium with recorded signal decoding program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP36957199A JP2001184090A (en) 1999-12-27 1999-12-27 Signal encoding device and signal decoding device, and computer-readable recording medium with recorded signal encoding program and computer-readable recording medium with recorded signal decoding program

Publications (1)

Publication Number Publication Date
JP2001184090A true JP2001184090A (en) 2001-07-06

Family

ID=18494773

Family Applications (1)

Application Number Title Priority Date Filing Date
JP36957199A Pending JP2001184090A (en) 1999-12-27 1999-12-27 Signal encoding device and signal decoding device, and computer-readable recording medium with recorded signal encoding program and computer-readable recording medium with recorded signal decoding program

Country Status (1)

Country Link
JP (1) JP2001184090A (en)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006085183A (en) * 2001-07-10 2006-03-30 Coding Technologies Ab Efficient and scalable parametric stereo coding for low bitrate audio coding application
US7725324B2 (en) 2003-12-19 2010-05-25 Telefonaktiebolaget Lm Ericsson (Publ) Constrained filter encoding of polyphonic signals
US7809579B2 (en) 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding
US7822617B2 (en) 2005-02-23 2010-10-26 Telefonaktiebolaget Lm Ericsson (Publ) Optimized fidelity and reduced signaling in multi-channel audio encoding
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US9431020B2 (en) 2001-11-29 2016-08-30 Dolby International Ab Methods for improving high frequency reconstruction
US9542950B2 (en) 2002-09-18 2017-01-10 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US9626973B2 (en) 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
US10540982B2 (en) 2001-07-10 2020-01-21 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications

Cited By (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006085183A (en) * 2001-07-10 2006-03-30 Coding Technologies Ab Efficient and scalable parametric stereo coding for low bitrate audio coding application
US10297261B2 (en) 2001-07-10 2019-05-21 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US9865271B2 (en) 2001-07-10 2018-01-09 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate applications
US9799341B2 (en) 2001-07-10 2017-10-24 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate applications
US9799340B2 (en) 2001-07-10 2017-10-24 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US8014534B2 (en) 2001-07-10 2011-09-06 Coding Technologies Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US8059826B2 (en) 2001-07-10 2011-11-15 Coding Technologies Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US8073144B2 (en) 2001-07-10 2011-12-06 Coding Technologies Ab Stereo balance interpolation
US8081763B2 (en) 2001-07-10 2011-12-20 Coding Technologies Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US8116460B2 (en) 2001-07-10 2012-02-14 Coding Technologies Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US8243936B2 (en) 2001-07-10 2012-08-14 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US9218818B2 (en) 2001-07-10 2015-12-22 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US9792919B2 (en) 2001-07-10 2017-10-17 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate applications
US10540982B2 (en) 2001-07-10 2020-01-21 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US9812142B2 (en) 2001-11-29 2017-11-07 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US9761237B2 (en) 2001-11-29 2017-09-12 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US9761234B2 (en) 2001-11-29 2017-09-12 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US10403295B2 (en) 2001-11-29 2019-09-03 Dolby International Ab Methods for improving high frequency reconstruction
US9779746B2 (en) 2001-11-29 2017-10-03 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US9431020B2 (en) 2001-11-29 2016-08-30 Dolby International Ab Methods for improving high frequency reconstruction
US9792923B2 (en) 2001-11-29 2017-10-17 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US9818418B2 (en) 2001-11-29 2017-11-14 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US9761236B2 (en) 2001-11-29 2017-09-12 Dolby International Ab High frequency regeneration of an audio signal with synthetic sinusoid addition
US10115405B2 (en) 2002-09-18 2018-10-30 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US10157623B2 (en) 2002-09-18 2018-12-18 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US9842600B2 (en) 2002-09-18 2017-12-12 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US9542950B2 (en) 2002-09-18 2017-01-10 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US9990929B2 (en) 2002-09-18 2018-06-05 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US10013991B2 (en) 2002-09-18 2018-07-03 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US10418040B2 (en) 2002-09-18 2019-09-17 Dolby International Ab Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks
US7725324B2 (en) 2003-12-19 2010-05-25 Telefonaktiebolaget Lm Ericsson (Publ) Constrained filter encoding of polyphonic signals
US7809579B2 (en) 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding
US7822617B2 (en) 2005-02-23 2010-10-26 Telefonaktiebolaget Lm Ericsson (Publ) Optimized fidelity and reduced signaling in multi-channel audio encoding
US7945055B2 (en) 2005-02-23 2011-05-17 Telefonaktiebolaget Lm Ericcson (Publ) Filter smoothing in multi-channel audio encoding and/or decoding
US9626973B2 (en) 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding

Similar Documents

Publication Publication Date Title
DE60208426T2 (en) Device for signal coding, signal decoding and system for distributing audio data
CA2562916C (en) Coding of audio signals
US6351730B2 (en) Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
AU2002318813B2 (en) Audio signal decoding device and audio signal encoding device
Johnston Transform coding of audio signals using perceptual noise criteria
JP3017715B2 (en) Sound reproducing apparatus
JP2908270B2 (en) Adaptive coding system
RU2555221C2 (en) Complex transformation channel coding with broadband frequency coding
US8407043B2 (en) Computationally efficient audio coder
JP3354864B2 (en) Adjustable audio encoding / decoding method and apparatus of the bit rate
JP3802219B2 (en) Speech encoding device
JP5164834B2 (en) Scaled compressed audio bitstream and codec using hierarchical filter bank and multi-channel joint coding
JP3134455B2 (en) High-efficiency encoding apparatus and method
US7996233B2 (en) Acoustic coding of an enhancement frame having a shorter time length than a base frame
US20060031075A1 (en) Method and apparatus to recover a high frequency component of audio data
CN103258541B (en) Adaptive time/frequency-based audio encoding and decoding apparatuses and methods
JP4212591B2 (en) Audio encoding device
KR20080103113A (en) Signal encoding
ES2205238T3 (en) Procedures for coding and decoding of audio signals, and coding and decoding of audio signals.
KR100574031B1 (en) Speech synthesis method and apparatus and an audio bandwidth extension method and apparatus
US5886276A (en) System and method for multiresolution scalable audio signal encoding
US8615391B2 (en) Method and apparatus to extract important spectral component from audio signal and low bit-rate audio signal coding and/or decoding method and apparatus using the same
JP2906646B2 (en) Audio sub-band coding apparatus
KR100634506B1 (en) Low bitrate decoding/encoding method and apparatus
JP3352406B2 (en) Encoding and decoding method and apparatus an audio signal