JPH06209297A - Transmitting method for audio signal - Google Patents

Transmitting method for audio signal

Info

Publication number
JPH06209297A
JPH06209297A JP1936793A JP1936793A JPH06209297A JP H06209297 A JPH06209297 A JP H06209297A JP 1936793 A JP1936793 A JP 1936793A JP 1936793 A JP1936793 A JP 1936793A JP H06209297 A JPH06209297 A JP H06209297A
Authority
JP
Japan
Prior art keywords
amplitude
fourier transform
representative value
phase
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1936793A
Other languages
Japanese (ja)
Other versions
JP3099569B2 (en
Inventor
Osamu Yoshino
治 吉野
Kazuo Hikawa
和生 飛河
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP05019367A priority Critical patent/JP3099569B2/en
Publication of JPH06209297A publication Critical patent/JPH06209297A/en
Application granted granted Critical
Publication of JP3099569B2 publication Critical patent/JP3099569B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PURPOSE:To make it possible to excellently perform the transmission/ recording/ reproduction of an audio signal with data amount by fixing the amplitude components and the phase components in every successive discrete frequency in each Fourier transform frame of an audio signal and transmitting the representative value. CONSTITUTION:By performing the calculation of the amplitude in the amplitude counting part 5A in an orthogonal coordinate spherical coordinate transform part 5 and the calculation of phases in a phase calculation part 5P, an amplitude spectrum and a phase spectrum are determined in every discrete frequency for the Fourier transform frame at every successive frame. The amplitude specturm is imparted to a band division part 6 and the phase spectrum is imparted to a band division part 7. In the band division parts 6, 7, the division of plural blocks is performed on each frequency axis. Next, in central value calculation parts 8, 9, the representative value of the amplitude components and the representative value of the phase components are calculated, they are outputted to a multiplexer 10 and they are transmitted to an output terminal 11.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は音響信号の情報量を圧縮
して伝送する音響信号の伝送方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an acoustic signal transmitting method for compressing and transmitting an information amount of an acoustic signal.

【0002】[0002]

【従来の技術】近年、アナログ信号をデジタル信号、例
えばPCM(パルスコードモジュレーション)信号とし
て伝送(あるいは記録再生)することが多くなったが、
前記のPCM信号は情報量が多いために、PCM信号の
伝送(あるいは記録再生)のためには広い伝送帯域が必
要とされる。それで、デジタル信号の信号処理を行う伝
送機器(記録再生機器)、その他の各種の機器において
は、従来からデジタル信号を少ない情報量で効率的に処
理することが行なわれているが、信号をより一層少ない
情報量で効率的に符号化できるようにした高能率符号化
方式としては、信号の予測を行なって予測値からのずれ
の成分(残差成分)だけを記録,伝送するようにした各
種の高能率符号化方式や、信号に対してある種の変換
(一般には直交変換)を施して信号の特徴を抽出し、そ
の信号の特徴部分、あるいは人間の視覚や聴覚が信号の
変化の少ない部分での変化に対しては敏感であるが信号
の変化の激しい部分においてはある程度の誤差があって
も検知し難いという性質を利用するなどして各サンプル
あたりの情報量(ビット数)を少なくするようにした各種
の高能率符号化方式等が従来から提案されて来ているこ
とは周知のとおりである。
2. Description of the Related Art In recent years, an analog signal is often transmitted (or recorded / reproduced) as a digital signal, for example, a PCM (pulse code modulation) signal.
Since the PCM signal has a large amount of information, a wide transmission band is required for transmitting (or recording / reproducing) the PCM signal. Therefore, transmission devices (recording / reproducing devices) that perform signal processing of digital signals, and various other devices have conventionally been able to efficiently process digital signals with a small amount of information. As a high-efficiency coding method that enables efficient coding with a smaller amount of information, various types are used in which the signal is predicted and only the component (residual component) from the predicted value is recorded and transmitted. The high-efficiency coding method or the signal is extracted by performing some kind of transformation (generally orthogonal transformation) on the signal, and the characteristic part of the signal or the human visual or auditory sense has little change in the signal. The amount of information (the number of bits) for each sample is reduced by using the property that it is sensitive to changes in the part, but difficult to detect even if there is some error in the part where the signal changes drastically. You It is well known that various high-efficiency coding methods and the like have been conventionally proposed.

【0003】[0003]

【発明が解決しようとする課題】しかし、従来の高能率
符号化方式では、楽音信号のデータを高品質の状態で再
現できるように高い圧縮率で圧縮することができなかっ
た。そこで、本出願人会社では、先に、音響信号を振幅
成分と位相成分という形で、周波数軸上で表現されるパ
ラメータを用いたデータの高能率符号化法によってデー
タ量を圧縮して伝送,記録再生する諸方式についての提
案を行なって来ている(例えば特願平4ー322769
号明細書、他)が、既提案の諸方式よりも、より一層、
少ないデータ量で音響信号の伝送,記録再生が可能な音
響信号の伝送方法の出現が求められた。
However, in the conventional high-efficiency coding system, it has not been possible to compress the tone signal data at a high compression rate so that it can be reproduced in a high quality state. Therefore, the applicant company first compressed and transmitted the acoustic signal in the form of an amplitude component and a phase component by a high-efficiency encoding method of data using parameters expressed on the frequency axis, Various proposals have been made for various recording / reproducing systems (for example, Japanese Patent Application No. 4-322769).
No. specification, etc.),
The advent of an acoustic signal transmission method capable of transmitting and recording acoustic signals with a small amount of data was required.

【0004】[0004]

【課題を解決するための手段】本発明は、予め定められ
た一定の時間長を有するように音響信号から切出された
順次の各フーリエ変換フレームの信号に同じ窓関数を用
いて離散的にフーリエ変換し、前記した各フーリエ変換
フレーム毎のフーリエ変換の結果として求められた同一
な所定数の離散周波数毎のデータを用いて、前記した各
フーリエ変換フレームにおける順次の離散周波数毎の振
幅成分と位相成分とを得て、各フーリエ変換フレームに
ついての順次の離散周波数毎の振幅成分と位相成分とを
周波数軸上で複数個のブロックに分割し、前記した各ブ
ロック毎にそれぞれ予め定められた本数の振幅スペクト
ルをまとめて振幅成分の代表値を得るとともに、前記し
た各ブロック毎にそれぞれ予め定められた本数の位相ス
ペクトルについて位相成分の代表値を定めて、前記の振
幅成分の代表値と、位相成分の代表値とを伝送するよう
にした音響信号の伝送方法、及び予め定められた一定の
時間長を有するように音響信号から切出された順次の各
フーリエ変換フレームの信号に同じ窓関数を用いて離散
的にフーリエ変換し、前記した各フーリエ変換フレーム
毎のフーリエ変換の結果として求められた同一な所定数
の離散周波数毎のデータを用いて、前記した各フーリエ
変換フレームにおける順次の離散周波数毎の振幅成分と
位相成分とを得て、各フーリエ変換フレームについての
順次の離散周波数毎の振幅成分と位相成分とを周波数軸
上で複数個のブロックに分割し、前記した各ブロック毎
にそれぞれ予め定められた本数の振幅スペクトルずつの
算術平均値を求めて、それを振幅成分の代表値とすると
ともに、前記した各ブロック毎にそれぞれ予め定められ
た本数の位相スペクトルについて、その中の1つを位相
成分の代表値として、前記の振幅成分の代表値と、位相
成分の代表値とを伝送するようにした音響信号の伝送方
法を提供する。
DISCLOSURE OF THE INVENTION The present invention discretely uses the same window function for a signal of each successive Fourier transform frame cut out from an acoustic signal so as to have a predetermined constant time length. Fourier transform, using the data for each of the same predetermined number of discrete frequencies obtained as a result of the Fourier transform for each Fourier transform frame described above, with the amplitude component for each successive discrete frequency in each Fourier transform frame described above. The phase component is obtained, and the amplitude component and the phase component for each discrete frequency of each Fourier transform frame are divided into a plurality of blocks on the frequency axis, and the number of lines is predetermined for each block. In addition to collecting the amplitude spectra of the above, a representative value of the amplitude component is obtained, and a predetermined number of phase spectra for each block described above are obtained. A representative value of the phase component is determined, and the representative value of the amplitude component and the representative value of the phase component are transmitted, and the acoustic signal is transmitted so as to have a predetermined constant time length. The signal of each successive Fourier transform frame cut out from the signal is subjected to discrete Fourier transform using the same window function, and the same predetermined number of discrete values obtained as a result of the Fourier transform for each Fourier transform frame described above. By using the data for each frequency, an amplitude component and a phase component for each discrete frequency in each Fourier transform frame described above are obtained, and an amplitude component and a phase component for each discrete frequency for each Fourier transform frame are obtained. Divide into a plurality of blocks on the frequency axis, find the arithmetic mean value of each of the above-mentioned predetermined number of amplitude spectra for each block, and then calculate the amplitude average value. And the representative value of the amplitude component and the representative value of the phase component, with one of them being the representative value of the phase component, for each of the predetermined number of phase spectra for each block described above. And a method of transmitting an acoustic signal adapted to transmit a value and a value.

【0005】[0005]

【作用】予め定められた一定の時間長を有するように音
響信号から切出された順次の各フーリエ変換フレームの
信号に、同じ窓関数を用いて離散的にフーリエ変換を施
し、前記した各フーリエ変換フレーム毎のフーリエ変換
の結果として求められた同一な所定数の離散周波数毎の
データを用いて、前記した各フーリエ変換フレームにお
ける順次の離散周波数毎の振幅成分と位相成分とを得
る。前記した各フーリエ変換フレームについての順次の
離散周波数毎の振幅成分と位相成分とを周波数軸上で複
数個のブロックに分割し、前記した各ブロック毎にそれ
ぞれ予め定められた本数の振幅スペクトルずつの算術平
均値を求めて、それを振幅成分の代表値とし、また、前
記した各ブロック毎にそれぞれ予め定められた本数の位
相スペクトルについて、その中の1つを位相成分の代表
値として、前記の振幅成分の代表値と、位相成分の代表
値とを伝送する。
The signal of each successive Fourier transform frame cut out from the acoustic signal so as to have a predetermined constant time length is subjected to discrete Fourier transform using the same window function, and each Fourier transform described above is performed. By using the same predetermined number of data for each discrete frequency obtained as a result of the Fourier transform for each transform frame, the amplitude component and the phase component for each discrete frequency in each Fourier transform frame described above are obtained. The amplitude component and the phase component for each discrete frequency for each of the Fourier transform frames described above are divided into a plurality of blocks on the frequency axis, and a predetermined number of amplitude spectra are divided for each of the blocks. The arithmetic mean value is obtained and used as the representative value of the amplitude component. Further, for the predetermined number of phase spectra for each block, one of them is used as the representative value of the phase component. The representative value of the amplitude component and the representative value of the phase component are transmitted.

【0006】[0006]

【実施例】以下、添付図面を参照して本発明の音響信号
の伝送方法の具体的な内容を詳細に説明する。図1は本
発明の音響信号の伝送方法を実施する際に使用されるエ
ンコーダの構成例を示すブロック図であり、また、図2
は本発明の音響信号の伝送方法を実施する際に使用され
るデコーダの構成例を示すブロック図である。図1にお
いて1は記録,伝送の対象にされているデジタル音響信
号の入力端子であり、前記したデジタル音響信号の入力
端子1に供給されたデジタル音響信号は、オーバーラッ
プ部2によってオーバーラップされた状態で予め定めら
れたそれぞれ一定の時間長を有するように切出されて、
順次のフーリエ変換フレームとされる。前記した各フー
リエ変換フレームは、音響信号からそれぞれN個(例え
ばN=1024)の標本点を有する期間となるように窓
関数処理部3において窓関数を掛けて、順次の各フレー
ムの繋ぎ目を互に重複させて緩やかに繋がるような状態
の順次の1フレーム期間として切出されたものである。
前記した各1フレーム毎のフーリエ変換フレームは、ブ
ロック4において例えば離散的有限系列のフーリエ変換
(DFT)または高速フーリエ変換(FFT)により直
交変換が行なわれる。以下の説明では前記の直交変換が
高速フーリエ変換(FFT)によって行なわれるものとし
て記述されている。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS The concrete contents of the acoustic signal transmission method of the present invention will be described in detail below with reference to the accompanying drawings. FIG. 1 is a block diagram showing a configuration example of an encoder used when implementing the method of transmitting an acoustic signal of the present invention, and FIG.
FIG. 3 is a block diagram showing a configuration example of a decoder used when implementing the acoustic signal transmission method of the present invention. In FIG. 1, reference numeral 1 denotes an input terminal of a digital audio signal to be recorded and transmitted, and the digital audio signal supplied to the input terminal 1 of the digital audio signal described above is overlapped by an overlap section 2. It is cut out so as to have a predetermined length of time in each state,
It is a sequential Fourier transform frame. Each of the Fourier transform frames described above is multiplied by a window function in the window function processing unit 3 so that each Fourier transform frame has a period having N (for example, N = 1024) sample points from the acoustic signal, and the joints of the respective frames are sequentially connected. It is cut out as one frame period in a sequence in which they overlap each other and are gently connected.
The above-mentioned Fourier transform frame for each frame is subjected to orthogonal transform in block 4 by, for example, discrete finite series Fourier transform (DFT) or fast Fourier transform (FFT). In the following description, the above orthogonal transformation is described as being performed by a fast Fourier transform (FFT).

【0007】さて、各1フレーム毎のフーリエ変換フレ
ームについてFFT演算が行なわれた場合には、前記し
た各1フレーム毎のフーリエ変換フレームにおけるデー
タ数(標本数)をNとし、標本化周波数をfsとする
と、f=fs/N で示されるfの周波数間隔毎の離散
的な各周波数(合計N個の周波数)についてのFFT演
算結果が得られるが、前記したFFT演算結果は、N個
の離散的な周波数毎に実数部(Real)振幅と、虚数部
(Imag)振幅とからなるものである。そして、前記の
ようにFFT演算の結果として得られたN個の離散的な
周波数毎のデータは、それぞれの離散的な周波数のデー
タ毎に個別に信号処理が行なわれるのであり、前記のF
FT演算の結果として得られたN個の離散的な周波数毎
の実数部と虚数部とからなる特定な離散的な周波数のデ
ータは、直交座標→極座標変換部5において、極座標変
換されて振幅項と位相項とに分離された後に、振幅計算
部5Aにおける「数1」に従った振幅の計算と、位相計
算部5Pにおける「数2」に従った位相の計算とが行な
われることにより、順次の各1フレーム毎のフーリエ変
換フレームについて、前記した離散的な各周波数毎に、
振幅スペクトル(振幅成分)と位相スペクトル(位相成
分)とが求められる。
When the FFT operation is performed for each Fourier transform frame for each frame, the number of data (sample number) in the Fourier transform frame for each frame is N, and the sampling frequency is fs. Then, the FFT operation result is obtained for each discrete frequency (total of N frequencies) for each frequency interval of f represented by f = fs / N. Real part amplitude and imaginary part for each specific frequency
(Imag) amplitude. The N discrete data for each discrete frequency obtained as a result of the FFT operation as described above is subjected to signal processing individually for each discrete frequency data.
The data of a specific discrete frequency, which is obtained as a result of the FT operation and is composed of a real number part and an imaginary number part for each of N discrete frequencies, is polar coordinate-transformed by the orthogonal coordinate → polar coordinate transforming part 5 to generate an amplitude term. After being separated into a phase term and a phase term, the amplitude calculation unit 5A calculates the amplitude according to the "Equation 1" and the phase calculation unit 5P calculates the phase according to the "Equation 2". For each Fourier transform frame of each of the above, for each discrete frequency described above,
An amplitude spectrum (amplitude component) and a phase spectrum (phase component) are obtained.

【0008】[0008]

【数1】 [Equation 1]

【数2】 [Equation 2]

【0009】ところで、前記のようにFFT演算結果と
して離散的な各周波数毎に得られたN個の実数部(Re
al)振幅とN個の虚数部(Imag)振幅とにおい
て、N個の実数部(Real)振幅には同じ値のものが2
個ずつ現われており、また、N個の虚数部(Imag)
振幅には絶対値で同じ値のものが2個ずつ現われている
から、有効な合成振幅項(Amp)の項数が総数の1/2
となり、また有効な位相項(Phase)の項数も総数
の1/2となるから、FFT出力データ数をFFTの実
数入力データ数と等しくできる。
By the way, as described above, the N real parts (Re
al) amplitude and N imaginary part (Imag) amplitudes, the same number of N real part (Real) amplitudes is 2
Appearing one by one, and N imaginary parts (Imag)
Since two amplitudes each having the same absolute value appear, the number of valid composite amplitude terms (Amp) is 1/2 of the total.
Since the number of effective phase terms is 1/2 of the total number, the number of FFT output data can be made equal to the number of FFT real input data.

【0010】さて、直交変換後の周波数軸上での分解能
は、既述のように各1フレーム毎のフーリエ変換フレー
ムにおけるデータ数(標本数)をNとし、標本化周波数を
fsとすると、f=fs/N によって示されるが、
今、例えば標本数N=1024とし、また、標本化周波
数fs=44100Hzとすると、この場合の分解能は
f=fs/N=44100/1024=43.07Hz
となる。一方、人間の聴感特性について考えてみると、
低い周波数に対する分解能と、高い周波数に対する分解
能とには差があり、可聴周波数帯域における人間の聴感
特性は周波数の低い音については分解能が細かく、高い
周波数の音に対しては分解能が広くなるという、所謂、
臨界帯域幅でその分解能が定義される。ここで、前記し
た43.07Hzという分解能の値についてみると、こ
の分解能の数値は低い周波数に対してはともかくとし
て、高い周波数に対しては十分過ぎる分解能を示す値で
あって、高域周波数についてみるとデータ圧縮という観
点から大きな無駄があるといえる。
As described above, the resolution on the frequency axis after the orthogonal transformation is f, where N is the number of data (number of samples) in the Fourier transform frame for each frame and fs is the sampling frequency. = Fs / N,
Now, assuming that the number of samples N = 1024 and the sampling frequency fs = 44100 Hz, the resolution in this case is f = fs / N = 44100/1024 = 43.07 Hz.
Becomes On the other hand, considering human hearing characteristics,
There is a difference between the resolution for low frequencies and the resolution for high frequencies, and human auditory characteristics in the audible frequency band have a fine resolution for low frequency sounds and a wide resolution for high frequency sounds. So-called
The critical bandwidth defines its resolution. Here, regarding the value of the resolution of 43.07 Hz described above, the numerical value of the resolution is a value that is too high for the high frequency, even if it is for the low frequency. From a viewpoint of data compression, it can be said that there is a great waste.

【0011】そこで、本発明の音響信号の伝送方法で
は、予め定められた一定の時間長を有するように音響信
号から切出された順次の各フーリエ変換フレームの信号
に同じ窓関数を用いて離散的にフーリエ変換し、前記し
た各フーリエ変換フレーム毎のフーリエ変換の結果とし
て求められた同一な所定数の離散周波数毎のデータを用
いて、前記した各フーリエ変換フレームにおける順次の
離散周波数毎の振幅成分と位相成分とを得て、各フーリ
エ変換フレームについての順次の離散周波数毎の振幅成
分と位相成分とを周波数軸上で複数個のブロックに分割
し、前記した各ブロック毎にそれぞれ予め定められた本
数の振幅スペクトルをまとめて振幅成分の代表値を得る
とともに、前記した各ブロック毎にそれぞれ予め定めら
れた本数の位相スペクトルについて位相成分の代表値を
定めて、前記の振幅成分の代表値と位相成分の代表値と
を伝送するようにして、音響信号を高能率圧縮して伝送
できるようにしたのである。
Therefore, in the method of transmitting an acoustic signal according to the present invention, the signals of each successive Fourier transform frame cut out from the acoustic signal so as to have a predetermined fixed time length are discretely distributed by using the same window function. Fourier transform, and using the same predetermined number of data for each discrete frequency obtained as a result of the Fourier transform for each Fourier transform frame, the amplitude for each successive discrete frequency in each Fourier transform frame described above. The component and the phase component are obtained, the amplitude component and the phase component for each discrete discrete frequency for each Fourier transform frame are divided into a plurality of blocks on the frequency axis, and each block is predetermined in advance. The representative values of the amplitude components are obtained by collecting the number of amplitude spectra, and a predetermined number of phase spectrums are set for each block. Defining a representative value of the phase components for Torr, so as to transmit a representative value of the representative values and the phase component of the amplitude component is had to be able to transmit the sound signal and the high efficiency compression.

【0012】すなわち直交座標→極座標変換部5におけ
る振幅計算部5Aにおいて「数1」に従った振幅の計算
と、位相計算部5Pにおいて「数2」に従った位相の計
算とが行なわれることにより、順次の各1フレーム毎の
フーリエ変換フレームについて、前記した離散的な各周
波数毎に求められた振幅スペクトル(振幅成分)と位相
スペクトル(位相成分)とにおける振幅スペクトル(振
幅成分)は、帯域分割部6に与えられ、また、位相スペ
クトル(位相成分)は帯域分割部7に与えられる。前記
した振幅スペクトル(振幅成分)と位相スペクトル(位
相成分)とは、それぞれ帯域分割部6,7において、所
定の周波数帯域毎に分割されて周波数軸上で複数個のブ
ロックに分割される。
That is, the amplitude calculation unit 5A in the rectangular coordinate → polar coordinate conversion unit 5 calculates the amplitude according to the "Formula 1" and the phase calculation unit 5P calculates the phase according to the "Formula 2". , The amplitude spectrum (amplitude component) in the amplitude spectrum (amplitude component) and the phase spectrum (phase component) obtained for each discrete frequency is sequentially divided into bands for each successive Fourier transform frame. The phase spectrum (phase component) is given to the band division unit 7. The amplitude spectrum (amplitude component) and the phase spectrum (phase component) are divided into predetermined frequency bands by the band division units 6 and 7, respectively, and divided into a plurality of blocks on the frequency axis.

【0013】次いで、帯域分割部6において所定の周波
数帯域毎のブロックとされた振幅成分は、代表値算出部
8において各ブロック毎にそれぞれ予め定められた本数
の振幅スペクトルについての算術平均を求めて、それを
振幅成分の代表値としてマルチプレクサ10に出力し、
また、帯域分割部7において所定の周波数帯域毎のブロ
ックとされた位相成分は、代表値算出部9において各ブ
ロック毎にそれぞれ予め定められた本数の位相スペクト
ルの内の1つのものを位相成分の代表値としてマルチプ
レクサ10に出力し、前記のマルチプレクサ10では、
振幅成分の代表値と位相成分の代表値とを出力端子11
に送出する。
Next, the amplitude component made into a block for each predetermined frequency band in the band division unit 6 is subjected to an arithmetic mean for a predetermined number of amplitude spectra in each block in the representative value calculation unit 8. , And outputs it to the multiplexer 10 as a representative value of the amplitude component,
In addition, the phase component which is made into a block for each predetermined frequency band in the band division unit 7 is a phase component which is one of the predetermined number of phase spectra in each block in the representative value calculation unit 9. The value is output to the multiplexer 10 as a representative value.
The representative value of the amplitude component and the representative value of the phase component are output terminal 11
Send to.

【0014】[0014]

【表1】 [Table 1]

【0015】「表1」は本発明の音響信号の伝送方法具
体的な実施の一例を示した表であって、この「表1」に
示した具体例においては、順次の各1フレーム毎のフー
リエ変換フレームについて、離散的な各周波数f=fs
/N毎に求められた振幅スペクトル(振幅成分)と位相
スペクトル(位相成分)とが、それぞれ対応する帯域分
割部6,7において、0〜2.76KHzの周波数帯域
に属する成分よりなるブロックと、2.76KHz〜
5.51KHzの周波数帯域に属する成分よりなるブロ
ックと、5.51KHz〜11.03KHzの周波数帯
域に属する成分よりなるブロックと、11.03KHz
〜22.05KHzの周波数帯域に属する成分よりなる
ブロックとに分割され、次いで、前記の各ブロック毎に
「表1」に記載のような予め定められたスペクトルの本
数ずつ1まとめとし、前記の1まとめにしたスぺクトル
毎に代表値を設定することにより、それぞれ160個の
代表値によって振幅成分と位相成分との伝送が行なわれ
るようにした場合の例を示している。「表1」に示す例
においては、もともと512本のスペクトルと対応する
データ量を、160本のスペクトルと対応するデータ量
にまで圧縮できるような比率でデータ量の圧縮ができる
ことになる。
"Table 1" is a table showing an example of a concrete implementation of the acoustic signal transmission method of the present invention. In the specific example shown in "Table 1", each successive frame is For a Fourier transform frame, each discrete frequency f = fs
/ N, the amplitude spectrum (amplitude component) and the phase spectrum (phase component) obtained in each of the corresponding band division units 6 and 7, the block consisting of components belonging to the frequency band of 0 to 2.76 KHz, 2.76 KHz
A block composed of components belonging to the frequency band of 5.51 KHz, a block composed of components belonging to the frequency band of 5.51 KHz to 11.03 KHz, and 11.03 KHz
To 22.05 KHz, and each block is divided into blocks each having a predetermined number of spectra as shown in "Table 1". An example is shown in which a representative value is set for each of the collected spectra, so that the amplitude component and the phase component are transmitted by 160 representative values. In the example shown in "Table 1," the data amount can be compressed at such a ratio that the data amount originally corresponding to 512 spectra can be compressed to the data amount corresponding to 160 spectra.

【0016】前記した「表1」に例示した具体例におい
て、0〜2.76KHzの最も低い周波数帯域のブロッ
ク内には64本のスペクトルが存在しうるが、この最も
低い周波数帯域のブロックについては、そのブロック内
で1まとめするスペクトルの本数を1、すなわち、ブロ
ック内に含まれているすべてのスペクトルをそれぞれ代
表値としており、また、2.76KHz〜5.51KH
zの周波数帯域のブロックに存在する64本のスペクト
ルについては、そのブロック内では2本ずつのスペクト
ルを1まとめにして、それぞれ代表値を定めることによ
り、この2.76KHz〜5.51KHzの周波数帯域
のブロックでは32個の代表値を定め、さらに、5.5
1KHz〜11.03KHzの周波数帯域のブロックに
存在する128本のスペクトルについては、そのブロッ
ク内では4本ずつのスペクトルを1まとめにして、それ
ぞれ代表値を定めることにより、この5.51KHz〜
11.03KHzの周波数帯域のブロックでは32個の
代表値を定め、さらにまた11.03KHz〜22.0
5KHzの周波数帯域のブロックに存在する256本の
スペクトルについては、そのブロック内では8本ずつの
スペクトルを1まとめにして、それぞれ代表値を定める
ことにより、この11.03KHz〜22.05KHz
の周波数帯域のブロックでは32個の代表値を定めて、
0〜22.05KHzの全周波数帯域について160個
の代表値が定められている。
In the specific example illustrated in "Table 1" above, 64 spectra can exist in the block of the lowest frequency band of 0 to 2.76 KHz. Regarding the block of the lowest frequency band, , The number of spectra to be combined into one in the block is 1, that is, all the spectra included in the block are respectively representative values, and 2.76 KHz to 5.51 KH
With respect to the 64 spectra existing in the block of the frequency band of z, the two spectra are grouped into one in the block, and the representative value is determined for each of the spectra, so that the frequency band of 2.76 KHz to 5.51 KHz is obtained. 32 representative values are set in the block of
With respect to 128 spectra existing in a block in the frequency band of 1 KHz to 11.03 KHz, by grouping four spectra each in the block and defining a representative value for each of them, the 5.51 KHz to
In the block of the frequency band of 11.03 KHz, 32 representative values are determined, and further, 11.03 KHz to 22.0.
Regarding the 256 spectra existing in the block of the frequency band of 5 KHz, the spectra of 8 lines each are grouped into one in the block, and the representative value is determined for each of the spectra, so that 11.03 KHz to 22.05 KHz.
In the block of the frequency band of, define 32 representative values,
160 representative values are defined for the entire frequency band of 0 to 22.05 KHz.

【0017】振幅成分の代表値算出部8における代表値
の算出は、前記のように各ブロック毎に予め定められた
本数の振幅スペクトル値の算術平均値を算出して行なわ
れるのであり、また位相成分の代表値算出部9における
代表値の算出は、前記のように各ブロック毎に予め定め
られた本数の位相スペクトルの内の特定なもの、例えば
ブロック内で1まとめにされるべき位相スペクトルの内
で一番低い周波数と対応する位相スペクトルを代表値に
する等のように、予め定めた代表値の設定法に従って位
相の代表値を定める。すなわち、人間の聴覚は音響信号
の位相に関しては高周波数になる程鈍感になるから、位
相スペクトルに関しては複数本の位相スペクトルについ
ての代表値を得るのには、算術平均を算出する等の手段
を用いるようなことをせず、単に、複数本の位相スペク
トルの内の1本を任意に選択してそれを代表値としても
よいのである。
The calculation of the representative value in the representative value calculation unit 8 of the amplitude component is performed by calculating the arithmetic mean value of the amplitude spectrum values of a predetermined number for each block as described above, and the phase. The calculation of the representative value in the representative value calculation unit 9 of the component is performed by calculating a specific one of the phase spectra of a predetermined number for each block as described above, for example, of the phase spectra to be combined into one in the block. The representative value of the phase is determined according to a predetermined method of setting the representative value, such as setting the phase spectrum corresponding to the lowest frequency among them to the representative value. That is, since human hearing becomes less sensitive to the phase of an acoustic signal as the frequency becomes higher, in order to obtain a representative value for a plurality of phase spectra, a means such as calculating an arithmetic mean should be used. Instead of using it, one of the phase spectra may be arbitrarily selected and used as the representative value.

【0018】図1中の出力端子11にデータ量が圧縮さ
れた状態のものとして送出された音響信号のデータは、
伝送路を介して送信側から受信側に送られて復号された
り、あるいは記録媒体に記録された後に再生された後に
復号されるのであるが、既述した図1に示されているエ
ンコーダによって符号化されることにより、データ量が
圧縮された音響信号のデータに対する復号動作は、図2
に例示されているような構成を有するデコーダを用いて
行なうことができる。図2において12は復号の対象に
されている音響信号のデータの入力端子であり、13は
デ・マルチプレクサである。復号の対象にされている音
響信号のデータの内で振幅成分の代表値によるデータ
は、デ・マルチプレクサ13から、代表値から全ての振
幅スペクトルの復原部14に供給され、また、復号の対
象にされている音響信号のデータの内で位相成分の代表
値によるデータは、デ・マルチプレクサ13から、代表
値から全ての位相スペクトルの復原部15に供給され
る。
The data of the acoustic signal sent to the output terminal 11 in FIG.
It is sent from the transmission side to the reception side via the transmission line for decoding, or is recorded on a recording medium and then reproduced and then decoded. However, it is encoded by the encoder shown in FIG. The decoding operation for the data of the acoustic signal whose data amount is compressed by
It can be performed using a decoder having a configuration as illustrated in FIG. In FIG. 2, reference numeral 12 is an input terminal for the audio signal data to be decoded, and 13 is a demultiplexer. The data of the representative value of the amplitude component in the data of the audio signal to be decoded is supplied from the demultiplexer 13 to the restoration unit 14 of all the amplitude spectra from the representative value, and also to the target of decoding. The data of the representative value of the phase component in the data of the acoustic signal being supplied is supplied from the demultiplexer 13 to the restoration unit 15 of all the phase spectra from the representative value.

【0019】前記した代表値から全ての振幅スペクトル
の復原部14と、代表値から全ての位相スペクトルの復
原部15とは、それぞれの代表値を得るのに用いられた
スペクトルの本数と対応する回数だけ、それぞれの代表
値を繰返して出力して極座標→直交座標変換部16に供
給する、というような動作での復原動作を行なう。極座
標→直交座標変換部16では、それに供給された特定な
離散的な周波数における振幅成分のデータと位相成分の
データとによって、特定な離散的な周波数における実数
部振幅と虚数部振幅とを算出して逆FFT演算部17に
供給する。逆FFT演算部17では、もとの音響信号の
データを復原して窓関数処理部18に供給する。前記の
窓関数処理部18で窓関数処理された音響信号のデータ
はオーバーラップ加算部19でオーバーラップ加算が施
されて出力端子20に送出される。
The above-described representative part 14 for all amplitude spectrum restorations and the representative value for all phase spectrum restorations 15 correspond to the number of spectra used to obtain each representative value and the corresponding number of times. However, the restoration operation is performed by repeatedly outputting the respective representative values and supplying the representative values to the polar coordinate → rectangular coordinate conversion unit 16. The polar-coordinate-to-rectangular-coordinate conversion unit 16 calculates the real part amplitude and the imaginary part amplitude at the specific discrete frequency based on the amplitude component data and the phase component data at the specific discrete frequency supplied thereto. And supplies it to the inverse FFT calculator 17. The inverse FFT calculator 17 restores the original acoustic signal data and supplies it to the window function processor 18. The data of the acoustic signal subjected to the window function processing by the window function processing section 18 is overlap-added by the overlap adding section 19 and sent to the output terminal 20.

【0020】なお、本発明の音響信号の伝送方法の実施
に当っては、マスキングを利用したデータの圧縮の手法
を組合わせて実施したり、より一層のデータの圧縮率の
向上を図かったり、あるいは本出願人会社で提案した直
交変換と予測とによる圧縮方式とを組合わせて実施した
りしてもよいことは当然である。また、本発明の音響信
号の伝送方法の実施に当り、各フーリエ変換フレームに
ついての順次の離散周波数毎の振幅成分と位相成分とを
周波数軸上で複数個のブロックに分割する際の各ブロッ
クの大きさや、代表値としてまとめるスペクトルの本数
等を、それぞれのフーリエ変換フレーム毎に適応的に変
化させるようにしてもよいが、そのような実施の態様と
して本発明の音響信号の伝送方法が実施される際には、
「表1」に示されている各項目に対応して設定される情
報も、データに付加して伝送することが必要とされる。
In implementing the acoustic signal transmission method of the present invention, a method of data compression using masking may be combined, or the data compression rate may be further improved. Alternatively, the compression method based on the orthogonal transformation and the prediction proposed by the applicant company may be combined and implemented. Further, in carrying out the method for transmitting an acoustic signal of the present invention, the amplitude component and the phase component for each discrete frequency for each Fourier transform frame are divided into a plurality of blocks on the frequency axis. The size, the number of spectra to be collected as a representative value, and the like may be adaptively changed for each Fourier transform frame, but as such an embodiment, the acoustic signal transmission method of the present invention is implemented. When
The information set corresponding to each item shown in "Table 1" also needs to be added to data and transmitted.

【0021】[0021]

【発明の効果】以上、詳細に説明したところから明らか
なように本発明の音響信号の伝送方法は、予め定められ
た一定の時間長を有するように音響信号から切出された
順次の各フーリエ変換フレームの信号に、同じ窓関数を
用いて離散的にフーリエ変換を施し、前記した各フーリ
エ変換フレーム毎のフーリエ変換の結果として求められ
た同一な所定数の離散周波数毎のデータを用いて、前記
した各フーリエ変換フレームにおける順次の離散周波数
毎の振幅成分と位相成分とを得て、前記した各フーリエ
変換フレームについての順次の離散周波数毎の振幅成分
と位相成分とを周波数軸上で複数個のブロックに分割
し、前記した各ブロック毎にそれぞれ予め定められた本
数の振幅スペクトルずつの算術平均値を求めて、それを
振幅成分の代表値とし、また、前記した各ブロック毎に
それぞれ予め定められた本数の位相スペクトルについ
て、その中の1つを位相成分の代表値として、前記の振
幅成分の代表値と、位相成分の代表値とを伝送するもの
であるから、本発明の音響信号の伝送方法によれば、高
い圧縮率でデータの圧縮を行なっても、楽音信号のデー
タを高品質の状態で再現できるのであり、既提案の諸方
式よりも、より一層、少ないデータ量で音響信号の伝
送,記録再生を良好に行なうことができ、本発明により
既述した従来の問題点は良好に解決できる。
As is apparent from the above description in detail, the method of transmitting an acoustic signal of the present invention is such that each of the sequential Fourier signals cut out from the acoustic signal so as to have a predetermined fixed time length. The signal of the transform frame, subjected to discrete Fourier transform using the same window function, using the same predetermined number of discrete frequency data obtained as a result of the Fourier transform for each Fourier transform frame described above, Obtaining an amplitude component and a phase component for each discrete frequency in each Fourier transform frame described above, a plurality of amplitude components and phase components for each discrete frequency for each Fourier transform frame on the frequency axis. Divided into blocks, the arithmetic mean value of each of the predetermined number of amplitude spectra for each of the blocks described above is obtained, and it is used as the representative value of the amplitude component. Also, with respect to a predetermined number of phase spectra for each block, one of them is used as the representative value of the phase component, and the representative value of the amplitude component and the representative value of the phase component are transmitted. Therefore, according to the audio signal transmission method of the present invention, even if the data is compressed at a high compression rate, the data of the musical tone signal can be reproduced in a high quality state. As compared with the above, the transmission and recording / reproduction of the acoustic signal can be favorably performed with a smaller amount of data, and the conventional problems already described by the present invention can be favorably solved.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の音響信号の伝送方法を実施する際に使
用されるエンコーダの構成例を示すブロック図である。
FIG. 1 is a block diagram showing a configuration example of an encoder used when implementing an acoustic signal transmission method of the present invention.

【図2】本発明の音響信号の伝送方法を実施する際に使
用されるデコーダの構成例を示すブロック図である。
FIG. 2 is a block diagram showing a configuration example of a decoder used when implementing the acoustic signal transmission method of the present invention.

【符号の説明】 1…記録,伝送の対象にされているデジタル音響信号の
入力端子、2…オーバーラップ部、3…窓関数処理部、
5…直交座標→極座標変換部、5A…振幅計算部、5P
…位相計算部、6,7…帯域分割部、8,9…代表値算
出部、10…マルチプレクサ、12…復号の対象にされ
ている音響信号のデータの入力端子、13…デ・マルチ
プレクサ、14…代表値から全ての振幅スペクトルの復
原部、15…代表値から全ての位相スペクトルの復原
部、16…極座標→直交座標変換部、17…逆FFT演
算部、18…窓関数処理部、19…オーバーラップ加算
部、20…出力端子、
[Explanation of Codes] 1 ... Input terminal of digital audio signal targeted for recording and transmission, 2 ... Overlap portion, 3 ... Window function processing portion,
5 ... Cartesian coordinate → polar coordinate conversion unit, 5A ... Amplitude calculation unit, 5P
... phase calculation section, 6, 7 ... band division section, 8, 9 ... representative value calculation section, 10 ... multiplexer, 12 ... audio signal data input terminal to be decoded, 13 ... de-multiplexer, 14 ... reconstruction part of all amplitude spectra from the representative value, 15 ... reconstruction part of all phase spectra from the representative value, 16 ... polar coordinate → rectangular coordinate conversion part, 17 ... inverse FFT operation part, 18 ... window function processing part, 19 ... Overlap adder, 20 ... output terminal,

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 予め定められた一定の時間長を有するよ
うに音響信号から切出された順次の各フーリエ変換フレ
ームの信号に同じ窓関数を用いて離散的にフーリエ変換
し、前記した各フーリエ変換フレーム毎のフーリエ変換
の結果として求められた同一な所定数の離散周波数毎の
データを用いて、前記した各フーリエ変換フレームにお
ける順次の離散周波数毎の振幅成分と位相成分とを得
て、各フーリエ変換フレームについての順次の離散周波
数毎の振幅成分と位相成分とを周波数軸上で複数個のブ
ロックに分割し、前記した各ブロック毎にそれぞれ予め
定められた本数の振幅スペクトルをまとめて振幅成分の
代表値を得るとともに、前記した各ブロック毎にそれぞ
れ予め定められた本数の位相スペクトルについて位相成
分の代表値を定めて、前記の振幅成分の代表値と、位相
成分の代表値とを伝送するようにした音響信号の伝送方
法。
1. The Fourier transform is performed discretely by using the same window function on a signal of each successive Fourier transform frame cut out from an acoustic signal so as to have a predetermined fixed time length, and each Fourier transform described above. Using the same predetermined number of data for each discrete frequency obtained as a result of the Fourier transform for each transform frame, to obtain the amplitude component and the phase component for each successive discrete frequency in each Fourier transform frame described above, The amplitude component and the phase component for each discrete frequency of the Fourier transform frame are divided into a plurality of blocks on the frequency axis, and a predetermined number of amplitude spectra are collectively collected for each of the above-mentioned blocks. While obtaining the representative value of, the representative value of the phase component is determined for each of the predetermined number of phase spectra for each block described above, A method of transmitting an acoustic signal, wherein the representative value of the amplitude component and the representative value of the phase component are transmitted.
【請求項2】 予め定められた一定の時間長を有するよ
うに音響信号から切出された順次の各フーリエ変換フレ
ームの信号に同じ窓関数を用いて離散的にフーリエ変換
し、前記した各フーリエ変換フレーム毎のフーリエ変換
の結果として求められた同一な所定数の離散周波数毎の
データを用いて、前記した各フーリエ変換フレームにお
ける順次の離散周波数毎の振幅成分と位相成分とを得
て、各フーリエ変換フレームについての順次の離散周波
数毎の振幅成分と位相成分とを周波数軸上で複数個のブ
ロックに分割し、前記した各ブロック毎にそれぞれ予め
定められた本数の振幅スペクトルずつの算術平均値を求
めて、それを振幅成分の代表値とするとともに、前記し
た各ブロック毎にそれぞれ予め定められた本数の位相ス
ペクトルについて、その中の1つを位相成分の代表値と
して、前記の振幅成分の代表値と、位相成分の代表値と
を伝送するようにした音響信号の伝送方法。
2. The Fourier transform is discretely Fourier-transformed using the same window function to the signal of each successive Fourier transform frame cut out from the acoustic signal so as to have a predetermined fixed time length, and each Fourier transform described above. Using the same predetermined number of data for each discrete frequency obtained as a result of the Fourier transform for each transform frame, to obtain the amplitude component and the phase component for each successive discrete frequency in each Fourier transform frame described above, The amplitude component and the phase component for each discrete frequency for the Fourier transform frame are divided into a plurality of blocks on the frequency axis, and the arithmetic mean value of each of the predetermined number of amplitude spectra for each block described above. Then, the value is used as the representative value of the amplitude component, and the number of phase spectra is determined for each block described above. A method of transmitting an acoustic signal, wherein one of the two is used as a representative value of the phase component, and the representative value of the amplitude component and the representative value of the phase component are transmitted.
JP05019367A 1993-01-11 1993-01-11 Transmission method of acoustic signal Expired - Fee Related JP3099569B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05019367A JP3099569B2 (en) 1993-01-11 1993-01-11 Transmission method of acoustic signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05019367A JP3099569B2 (en) 1993-01-11 1993-01-11 Transmission method of acoustic signal

Publications (2)

Publication Number Publication Date
JPH06209297A true JPH06209297A (en) 1994-07-26
JP3099569B2 JP3099569B2 (en) 2000-10-16

Family

ID=11997383

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05019367A Expired - Fee Related JP3099569B2 (en) 1993-01-11 1993-01-11 Transmission method of acoustic signal

Country Status (1)

Country Link
JP (1) JP3099569B2 (en)

Also Published As

Publication number Publication date
JP3099569B2 (en) 2000-10-16

Similar Documents

Publication Publication Date Title
KR100550399B1 (en) Method and apparatus for encoding and decoding multiple audio channels at low bit rates
JP2904472B2 (en) Method, data processing system and apparatus for efficiently compressing digital audio signals
JP4444296B2 (en) Audio encoding
US6681204B2 (en) Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
CN100578621C (en) Signal processing device and method
EP0657873B1 (en) Speech signal bandwidth compression and expansion apparatus, and bandwidth compressing speech signal transmission method, and reproducing method
CN100405460C (en) Coding an audio signal
WO2003044776A1 (en) Audio coding
KR100352351B1 (en) Information encoding method and apparatus and Information decoding method and apparatus
PL207861B1 (en) Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
US20030220801A1 (en) Audio compression method and apparatus
JPH06503186A (en) Speech synthesis method
KR100750115B1 (en) Method and apparatus for encoding/decoding audio signal
US5392231A (en) Waveform prediction method for acoustic signal and coding/decoding apparatus therefor
EP0772185A2 (en) Speech decoding method and apparatus
JP2776300B2 (en) Audio signal processing circuit
JP3191257B2 (en) Acoustic signal encoding method, acoustic signal decoding method, acoustic signal encoding device, acoustic signal decoding device
JP2958726B2 (en) Apparatus for coding and decoding a sampled analog signal with repeatability
JPH06209297A (en) Transmitting method for audio signal
JP3593201B2 (en) Audio decoding equipment
JP5491193B2 (en) Speech coding method and apparatus
JPH09146593A (en) Methods and devices for sound signal coding and decoding
KR100424036B1 (en) Disassembly / synthesis filtering system with efficient nodal stack single-sided band filter bank using time-domain aliasing
JP2001083995A (en) Sub band encoding/decoding method
JPH1198023A (en) Signal coding and decoding device

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees