JPH06324093A - Device for displaying spectrum of audio signal - Google Patents

Device for displaying spectrum of audio signal

Info

Publication number
JPH06324093A
JPH06324093A JP11325893A JP11325893A JPH06324093A JP H06324093 A JPH06324093 A JP H06324093A JP 11325893 A JP11325893 A JP 11325893A JP 11325893 A JP11325893 A JP 11325893A JP H06324093 A JPH06324093 A JP H06324093A
Authority
JP
Japan
Prior art keywords
spectrum
time
signal
display device
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11325893A
Other languages
Japanese (ja)
Inventor
Robaato Hedoru
ロバート ヘドル
Kenzo Akagiri
健三 赤桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP11325893A priority Critical patent/JPH06324093A/en
Publication of JPH06324093A publication Critical patent/JPH06324093A/en
Withdrawn legal-status Critical Current

Links

Abstract

PURPOSE:To provide accurate resolution and to simplify the constitution of a device. CONSTITUTION:An encoded audio signal, which is inputted into an encoded- audio-signal input terminal, is sent into a time window means 12, and a plurality of time-division blocks are generated. The spectrums corresponding to a plurality of the time-division blocks are computed with a spectrum computing means 13. The computed spectrums are converted into the spectrum display signals with a display-signal forming means 14. Then, the spectrum display signals are displayed on a spectrum display means 15.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、符号化されたオーディ
オ信号をスペクトル毎に表示するオーディオ信号のスペ
クトル表示装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an audio signal spectrum display device for displaying an encoded audio signal for each spectrum.

【0002】[0002]

【従来の技術】磁気テープ上に歪み等が無いように記録
を行うためには、信号レベルが所定の閾値を越えないよ
うにすることが必要である。従って、記録時の真の信号
レベルを判別するために、多くの市販品のカセットレコ
ーダ等にはレベルメータが備わっている。このレベルメ
ータは、左右のステレオチャンネルの両方の信号レベル
を表示する。また、このレベルメータは原始的なスペク
トル表示装置と考えることもでき、全周波数スペクトル
に渡る単一の周波数帯において時間毎に変化する信号レ
ベルを表示する。最近では、この概念は幾つかの周波数
帯において時間毎に変化する信号レベルを表示するもの
に拡張されている。このスペクトル表示装置は、市販の
オーディオ製品等に備えられ、LCDスクリーン等の表
示装置上に表示されている。このスペクトル表示装置
は、記録を行うときに用いるか否かにかかわらず、オー
ディオ製品の一般的なセールスポイントにもなってい
る。
2. Description of the Related Art In order to perform recording without distortion on a magnetic tape, it is necessary to prevent the signal level from exceeding a predetermined threshold value. Therefore, in order to determine the true signal level at the time of recording, many commercially available cassette recorders and the like are equipped with a level meter. This level meter displays both left and right stereo channel signal levels. The level meter can also be thought of as a primitive spectrum display, displaying a time-varying signal level in a single frequency band over the entire frequency spectrum. Recently, this concept has been extended to display signal levels that change over time in several frequency bands. This spectrum display device is provided in a commercially available audio product or the like, and is displayed on a display device such as an LCD screen. This spectrum display device is also a general selling point for audio products regardless of whether or not it is used for recording.

【0003】近年、オーディオ及びビデオ産業は急速に
変化しており、例えば、テレビの画面の品質は良くな
り、この画面の改良に伴い、より高品質の音声が要求さ
れる。よって、テレビ及びビデオの音声の質は、商業用
のオーディオシステムの音声の質に近づき始めている。
そして、例えばビデオ番組のサウンドトラックを再編成
するための商業用オーディオシステムを使用することが
できるようになることによって、商業用のオーディオ、
ビデオ及びテレビジョン装置は、より高度に統合される
べきである。将来的には、上記より高度に統合されたシ
ステムが現れることが期待される。
In recent years, the audio and video industries are changing rapidly, and for example, the quality of the screen of a television is improved, and with the improvement of this screen, higher quality audio is required. Thus, the audio quality of television and video is beginning to approach that of commercial audio systems.
And by allowing the use of commercial audio systems to reorganize the soundtracks of video programs, for example, commercial audio,
Video and television devices should be more highly integrated. It is expected that more highly integrated systems will emerge in the future.

【0004】オーディオの領域ではすでに急速な変化が
あり、いわゆるミニディスク(MD:MiniDisc)やいわゆ
るディジタルコンパクトカセット(DDC:Digital Com
pactCassette)のような低減されたビットレートによる
オーディオシステムが生産されている。これらのオーデ
ィオシステムは、所定の時間及び周波数の領域内の音声
のエネルギを表す量子化係数の形態のオーディオの情報
を伝送する。現在のオーディオシステムは本来的にオー
ディオ用途のために考えられたものであるが、今後はテ
レビ及びビデオの音声が、上記オーディオシステムや上
記オーディオシステムと同様なシステムを使用して伝送
されることが考えられる。
In the audio field, there has already been a rapid change, and so-called mini-discs (MD: MiniDiscs) and so-called digital compact cassettes (DDC: Digital Com).
Audio systems with reduced bit rates are being produced, such as the pact Cassette). These audio systems transmit audio information in the form of quantized coefficients that represent the energy of the voice within a given time and frequency domain. Current audio systems were originally conceived for audio applications, but in the future television and video audio may be transmitted using the above audio systems or systems similar to the above audio systems. Conceivable.

【0005】[0005]

【発明が解決しようとする課題】ところで、上記スペク
トル表示装置においては、符号化されたデータ信号を表
示するために、個々のシステムにおいて必要なスペクト
ル信号に修正しなければならず、上記符号化されたデー
タ信号を周波数領域に変換するための装置が必要とされ
る。
In the above-mentioned spectrum display device, in order to display the coded data signal, the spectrum signal must be corrected to a spectrum signal required in each system, and the coded data signal must be corrected. What is needed is a device for converting a data signal into the frequency domain.

【0006】そこで、本発明は上述の実情に鑑み、従来
よりも精確な分解能を持ち、構成が簡単なスペクトル表
示装置を提供するものである。
Therefore, in view of the above situation, the present invention provides a spectrum display device having a more accurate resolution than the conventional one and having a simple structure.

【0007】[0007]

【課題を解決するための手段】本発明に係るオーディオ
信号のスペクトル表示装置は、符号化された入力オーデ
ィオ信号の時間ブロックを選択する時間窓掛け手段と、
上記窓掛け手段により窓掛けされた信号の時間ブロック
の上記入力信号から表示用のスペクトル特性を算出する
スペクトル算出手段と、上記スペクトル算出手段により
算出されたスペクトル特性を具体的な表示信号に変換形
成するための表示信号形成手段とを備えて成ることによ
り上述した課題を解決する。
SUMMARY OF THE INVENTION An audio signal spectrum display apparatus according to the present invention comprises time windowing means for selecting a time block of an encoded input audio signal,
Spectrum calculating means for calculating the display spectrum characteristic from the input signal of the time block of the windowed signal by the windowing means, and converting the spectrum characteristic calculated by the spectrum calculating means into a specific display signal The above-mentioned problem is solved by including display signal forming means for achieving the above.

【0008】ここで、上記表示信号形成手段により出力
される表示信号を表示する表示装置を備えることが好ま
しい。また、上記表示装置としてはLCD表示装置又は
テレビジョンを挙げることができる。また、外部の表示
装置に接続される機器を使用するための出力端子を設け
てもよい。
Here, it is preferable to include a display device for displaying the display signal output by the display signal forming means. The display device may be an LCD display device or a television. Further, an output terminal for using a device connected to an external display device may be provided.

【0009】さらに、上記符号化された入力オーディオ
信号は2チャンネルのステレオオーディオ信号から成る
ことが考えられる。
Further, it is conceivable that the encoded input audio signal is composed of a two-channel stereo audio signal.

【0010】また、上記符号化された入力オーディオ信
号は、時間及び周波数の領域内の信号のエネルギに相当
する係数を備え、上記係数は時間と周波数とにより均一
に又は不均一に分割される時間−周波数係数とすればよ
い。また、上記時間窓掛け手段によって使用される時間
ブロックは、上記符号化された入力オーディオ信号の時
間分割に対応させればよい。さらに、上記時間窓掛け手
段によって使用される時間ブロックは、上記符号化され
たオーディオ信号の不均一な時間分割であることを特徴
とする。
Also, the encoded input audio signal comprises a coefficient corresponding to the energy of the signal in the time and frequency domain, the coefficient being divided uniformly or non-uniformly in time and frequency. -It may be a frequency coefficient. Further, the time block used by the time windowing means may correspond to the time division of the encoded input audio signal. Furthermore, the time block used by the time windowing means is characterized by a non-uniform time division of the encoded audio signal.

【0011】上記符号化された入力オーディオ信号の時
間−周波数係数を不均一に分割するために時間と周波数
とを不均一に分割することにより、スペクトル特性又は
複数の特性を算出することを特徴とする。
[0011] The above-mentioned encoded input audio signal is characterized by calculating a spectral characteristic or a plurality of characteristics by non-uniformly dividing time and frequency in order to non-uniformly dividing the time-frequency coefficient. To do.

【0012】上記オーディオ信号の時間−周波数係数
は、単一もしくは複数の係数が、上記係数の最大値を示
すスケールファクタ及びそれぞれの係数を得るために使
用されるビット数を示すワードレングスにより符号化さ
れるブロックフローティング処理により符号化されるこ
とを特徴とする。
The time-frequency coefficient of the audio signal is encoded by a single or a plurality of coefficients by a scale factor indicating the maximum value of the coefficient and a word length indicating the number of bits used to obtain each coefficient. It is characterized in that it is encoded by a block floating process.

【0013】また、上記オーディオ信号の時間−周波数
係数は、サブバンド符号化に基づいた時間−周波数変換
により生成され、単一のサブバンドからの連続した時間
ブロックの係数が上記単一のワードレングス及びスケー
ルファクタにより符号化されるブロックフローティング
アルゴリズムにより符号化されることを特徴とする。
Further, the time-frequency coefficient of the audio signal is generated by time-frequency conversion based on subband coding, and the coefficient of a continuous time block from a single subband is the single word length. And a block floating algorithm which is encoded by a scale factor.

【0014】上記ブロックフローティングアルゴリズム
は、一定間隔でそれぞれのサブバンドにスケールファク
タを供給するように固定された時間ブロックに対して作
用するものであることを特徴とする。
The block floating algorithm is characterized in that it operates on a fixed time block so as to supply a scale factor to each subband at regular intervals.

【0015】また、上記ブロックフローティングアルゴ
リズムは、入力されたオーディオ信号のスペクトル特性
に基づいた可変レートにより上記スケールファクタの値
を供給するように不均一な時間ブロックに対して作用す
るものであることを特徴とする。
Further, the block floating algorithm operates on the non-uniform time block so as to supply the value of the scale factor at a variable rate based on the spectral characteristic of the input audio signal. Characterize.

【0016】さらに、上記ブロックフローティングアル
ゴリズムは、異なるサブバンドの異なるレートにより上
記スケールファクタの値を供給するように不均一な時間
ブロックに対して作用するものであることを特徴とす
る。
Further, the block floating algorithm is characterized in that it operates on a non-uniform time block so as to provide the values of the scale factor with different rates of different subbands.

【0017】上記オーディオ信号の時間−周波数係数
は、変換符号化に基づいた時間−周波数変換により生成
されることを特徴とする。
The time-frequency coefficient of the audio signal is characterized by being generated by time-frequency conversion based on transform coding.

【0018】また、上記オーディオ信号の時間−周波数
係数は、上記変換がそれぞれのサブバンド信号に適合さ
れるようなサブバンド及び変換符号化の組合せに基づい
た時間−周波数変換により生成されることを特徴とす
る。
Also, the time-frequency coefficients of the audio signal may be generated by a time-frequency transform based on a combination of subband and transform coding such that the transform is adapted to each subband signal. Characterize.

【0019】さらに、上記オーディオ信号の時間−周波
数係数は、単一の変換出力に属する、隣接する周波数の
係数のブロックを単一のワードレングス及びスケールフ
ァクタにより符号化するブロックフローティングアルゴ
リズムにより符号化されることを特徴とする。
Further, the time-frequency coefficients of the audio signal are encoded by a block floating algorithm which encodes blocks of adjacent frequency coefficients belonging to a single transform output with a single word length and scale factor. It is characterized by

【0020】ここで、上記ブロックフローティングアル
ゴリズムは、一定の時間間隔で固定された周波数範囲に
相当する上記スケールファクタの値を供給するように固
定された時間及び周波数に対して作用するものであるこ
とを特徴とする。
Here, the block floating algorithm operates on a fixed time and frequency so as to provide a value of the scale factor corresponding to a fixed frequency range at fixed time intervals. Is characterized by.

【0021】また、上記ブロックフローティングアルゴ
リズムは、可変レートによるスケールファクタの値を供
給するように可変的な時間及び周波数に対して作用する
ものであることを特徴とする。
Further, the block floating algorithm is characterized in that it operates on a variable time and frequency so as to supply a value of a scale factor according to a variable rate.

【0022】さらに、上記ブロックフローティングアル
ゴリズムは、上記スケールファクタの値が固定レートで
供給されるように、増加した時間分解能は減少した周波
数分解能、又は減少した時間分解能は増加した周波数分
解能により補われる可変的な時間及び周波数に対して作
用するものであることを特徴とする。
Further, in the block floating algorithm, the increased time resolution is reduced in frequency resolution, or the decreased time resolution is compensated by increased frequency resolution so that the scale factor value is supplied at a fixed rate. It is characterized in that it acts on a specific time and frequency.

【0023】上記スペクトル算出手段は、上記スペクト
ル特性又は複数の特性を算出するために上記符号化され
た入力オーディオ信号から上記スケールファクタを抽出
し、使用することを特徴とする。
The spectrum calculating means is characterized by extracting and using the scale factor from the encoded input audio signal to calculate the spectrum characteristic or a plurality of characteristics.

【0024】また、上記スペクトル算出手段は、算出さ
れたそれぞれのスペクトルの時間ブロックに相当するス
ケールファクタを直接に出力することにより上記スペク
トル特性又は複数の特性を生成することを特徴とする。
Further, the spectrum calculating means is characterized in that the spectrum characteristic or a plurality of characteristics is generated by directly outputting a scale factor corresponding to the calculated time block of each spectrum.

【0025】ここで、上記表示装置は、上記スケールフ
ァクタが周波数軸に沿った不均一なレートにより供給さ
れる場合に、時間が一定間隔であるスペクトル出力を生
成するために上記スケールファクタを緩衝する時間軸処
理のサブシステムを含むことを特徴とする。
Here, the display device buffers the scale factor in order to produce a spectral output at regular intervals when the scale factor is supplied at a non-uniform rate along the frequency axis. It is characterized by including a time axis processing subsystem.

【0026】また、上記表示装置は、上記スケールファ
クタが周波数軸に沿った不均一なレートにより供給され
る場合に、受信されるそれぞれの新しいスケールファク
タ又はスケールファクタのグループの新しいスペクトル
出力を生成する時間軸処理のサブシステムを含むことを
特徴とする。
The display device also produces a new spectral output of each new scale factor or group of scale factors received, where the scale factor is provided by a non-uniform rate along the frequency axis. It is characterized by including a time axis processing subsystem.

【0027】[0027]

【作用】本発明においては、従来よりも精確な分解能を
持つスペクトル信号を簡易に表示することができる。
In the present invention, it is possible to easily display the spectrum signal having a more accurate resolution than the conventional one.

【0028】[0028]

【実施例】以下、本発明の好ましい実施例について、図
面を参照しながら説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENT A preferred embodiment of the present invention will be described below with reference to the drawings.

【0029】図1は、本発明に係るオーディオ信号のス
ペクトル表示装置の基本概念を説明するための図であ
り、図2には、本発明に係るオーディオ信号のスペクト
ル表示装置を使用した一例を示す。
FIG. 1 is a view for explaining the basic concept of an audio signal spectrum display device according to the present invention, and FIG. 2 shows an example of using the audio signal spectrum display device according to the present invention. .

【0030】図1の符号化オーディオ信号入力端子11
から符号化オーディオ信号が入力され、時間窓掛け手段
12に送られる。この符号化オーディオ信号は、時間に
応じて変化するスペクトルを持つため、上記符号化オー
ディオ信号から上記時間窓掛け手段12において複数の
時間分割ブロックを生成する。上記それぞれの時間分割
ブロックのスペクトルは、スペクトル算出手段13にお
いて算出され、表示信号形成手段14に送られる。この
表示信号形成手段14では、上記算出されたスペクトル
が変換されてスペクトル表示用信号が形成された後、ス
ペクトル表示手段15においてスペクトルが表示され
る。
The encoded audio signal input terminal 11 of FIG.
The encoded audio signal is input from and is sent to the time windowing means 12. Since this encoded audio signal has a spectrum that changes with time, a plurality of time division blocks are generated in the time windowing means 12 from the encoded audio signal. The spectrum of each of the time division blocks is calculated by the spectrum calculating means 13 and sent to the display signal forming means 14. The display signal forming means 14 converts the calculated spectrum to form a spectrum display signal, and then the spectrum display means 15 displays the spectrum.

【0031】上記スペクトル表示手段15には、従来の
オーディオ装置に設けられているLCD表示装置やLE
D表示装置だけではなく、図2に示すようなテレビ装置
16を用いることも可能である。この場合には、上記符
号化オーディオ信号入力端子11からのオーディオ信号
は、テレビ信号に相当するオーディオ信号、もしくはラ
ジオ又はコンパクトディスクプレーヤ等のような外部オ
ーディオ装置から受信されるオーディオ信号のどちらか
である。
The spectrum display means 15 is an LCD display device or LE provided in a conventional audio device.
It is possible to use not only the D display device but also the television device 16 as shown in FIG. In this case, the audio signal from the encoded audio signal input terminal 11 is either an audio signal corresponding to a television signal or an audio signal received from an external audio device such as a radio or a compact disc player. is there.

【0032】さらに、図3には、上記スペクトル表示手
段15において、本発明によるスペクトル表示部が処理
ブロックから物理的に分離している場合の基本構成の一
例を示す。
Further, FIG. 3 shows an example of the basic structure of the spectrum display means 15 in the case where the spectrum display unit according to the present invention is physically separated from the processing block.

【0033】オーディオ信号変換部30内のスペクトル
表示用信号の出力のための接続部17は、テレビ装置3
1内のスペクトル表示用信号を入力するための接続部1
8と接続されており、上記テレビ装置31内には上記接
続部18を介して入力されたスペクトル表示用信号をス
ペクトルとして表示する表示部19が含まれている。上
記オーディオ装置30と上記テレビ装置31とは、より
高度に統合されている。図2及び図3における時間窓掛
け手段12、スペクトル算出手段13、表示信号形成手
段14は、図1の各部と同様であるため、対応する部分
に同じ参照番号を付して説明を省略する。
The connection section 17 for outputting the spectrum display signal in the audio signal conversion section 30 is connected to the television device 3.
1 for inputting the spectrum display signal in 1
The television device 31 includes a display unit 19 for displaying the spectrum display signal input via the connection unit 18 as a spectrum. The audio device 30 and the television device 31 are more highly integrated. Since the time windowing means 12, the spectrum calculating means 13, and the display signal forming means 14 in FIGS. 2 and 3 are the same as those in FIG. 1, the corresponding parts are designated by the same reference numerals and the description thereof will be omitted.

【0034】次に、上記時間窓掛け手段12及びスペク
トル算出手段13を介すことにより生成されるスペクト
ルを算出するための具体的な実施例を後述する。
Next, a specific embodiment for calculating the spectrum generated by the time windowing means 12 and the spectrum calculating means 13 will be described later.

【0035】先ず、本発明の第1の実施例の概略的な構
成を図4に示す。
First, FIG. 4 shows a schematic configuration of the first embodiment of the present invention.

【0036】符号化オーディオ信号入力端子41より入
力される符号化オーディオ信号は、いわゆるMD(ミニ
ディスク)やいわゆるDCC(ディジタルコンパクトカ
セット)等に用いられているような低減されたビットレ
ートを生成するオーディオ信号符号化装置からの出力信
号である。
The coded audio signal input from the coded audio signal input terminal 41 generates a reduced bit rate as used in so-called MD (mini disc) and so-called DCC (digital compact cassette). It is an output signal from the audio signal encoding device.

【0037】ここで、図5に通常のオーディオ信号の符
号化及び復号化の概略的な構成を示す。オーディオ信号
入力端子51から入力されたオーディオ信号は、オーデ
ィオ信号符号化手段52において符号化され、データ伝
送又は記録手段53を介して他のオーディオ装置へ伝送
されたり、種々の記録媒体へ記録されたりする。上記デ
ータ伝送又は記録された信号は、オーディオ信号復号化
手段54において復号化され、オーディオ信号出力端子
55より出力される。
Here, FIG. 5 shows a schematic configuration of encoding and decoding of a normal audio signal. The audio signal input from the audio signal input terminal 51 is encoded by the audio signal encoding means 52, transmitted to another audio device via the data transmission or recording means 53, or recorded in various recording media. To do. The data transmitted or recorded signal is decoded by the audio signal decoding means 54 and output from the audio signal output terminal 55.

【0038】図6には、図5のオーディオ信号符号化手
段52の概略的な構成を示す。時間−周波数分析部61
では、時間領域のオーディオ信号を、時間と周波数の空
間に配置される時間−周波数の成分に分割する。この時
間−周波数の成分は、ビット割当処理部62及びスペク
トル量子化部63に送られる。上記ビット割当処理部6
2では、スペクトルの量子化により発生する量子化ノイ
ズが最小可聴になるように、心理的音響モデル64に基
づいて量子化ビット数を割り当て、この量子化ビット数
を上記スペクトル量子化部63に送る。また、スケール
ファクタやワードレングス等の各パラメータが出力され
る。上記スペクトル量子化部63では、上記時間−周波
数分析部61からの出力である時間−周波数の成分が、
上記ビット割当処理部62からの出力によって量子化さ
れた後、スペクトル信号が出力される。
FIG. 6 shows a schematic structure of the audio signal coding means 52 of FIG. Time-frequency analysis unit 61
Then, an audio signal in the time domain is divided into time-frequency components arranged in a space of time and frequency. This time-frequency component is sent to the bit allocation processing unit 62 and the spectrum quantization unit 63. The bit allocation processing unit 6
In No. 2, the quantization bit number is assigned based on the psychological acoustic model 64 so that the quantization noise generated by the quantization of the spectrum becomes minimum audible, and the quantization bit number is sent to the spectrum quantization unit 63. . In addition, each parameter such as a scale factor and word length is output. In the spectrum quantization unit 63, the time-frequency component output from the time-frequency analysis unit 61 is
After being quantized by the output from the bit allocation processing unit 62, a spectrum signal is output.

【0039】通常、上記スペクトル量子化部63ではブ
ロックフローティングによる量子化方法が用いられる。
この量子化方法では、先ず、時間−周波数の成分がスケ
ールファクタにより標準化された後に、設定されたワー
ドレングスで量子化される。このビット割当処理では、
それぞれの時間ブロックに対して適切なスケールファク
タ及びワードレングスを決定する。このスケールファク
タは、一般的に、固定された複数のパラメータ中から選
択される値である。また、それぞれのブロックに対して
選択されたスケールファクタは、最小のスケールファク
タであるが、この最小のスケールファクタはブロック内
の全ての時間及び周波数の係数の大きさよりも大きい。
Usually, the spectrum quantizing unit 63 uses a quantizing method by block floating.
In this quantization method, first, time-frequency components are standardized by a scale factor and then quantized with a set word length. In this bit allocation process,
Determine the appropriate scale factor and word length for each time block. This scale factor is generally a value selected from among a plurality of fixed parameters. Also, the scale factor selected for each block is the minimum scale factor, which is greater than the magnitude of all time and frequency coefficients in the block.

【0040】よって、このスケールファクタは、時間及
び周波数の係数のブロックの時間及び周波数範囲内のオ
ーディオ信号のエネルギに近似した値である。従って、
時間上の特定時点における全周波数範囲に相当する複数
のスケールファクタは、スペクトル信号の有効な近似値
として使用することができる。
Thus, this scale factor is a value that approximates the energy of the audio signal within the time and frequency range of the block of time and frequency coefficients. Therefore,
Multiple scale factors corresponding to the entire frequency range at a particular point in time can be used as a good approximation of the spectral signal.

【0041】実際には、上記オーディオ信号符号化手段
52による動作は、図1の時間窓掛け手段12及びスペ
クトル算出手段13において行われている。図4におい
て、上記ブロックフローティングアルゴリズムによる各
パラメータは符号化データ抽出手段42により抽出さ
れ、このスケールファクタのデータは上記表示信号形成
手段14を通してスペクトル表示手段15まで送られ
る。上記符号化データ抽出手段42は、図5のオーディ
オ信号復号化手段54内の一部分である。この第1の実
施例による方法では、時間毎に変化するスペクトル信号
が高効率、且つ簡単に算出され、表示される。
Actually, the operation by the audio signal coding means 52 is performed by the time windowing means 12 and the spectrum calculating means 13 of FIG. In FIG. 4, each parameter by the block floating algorithm is extracted by the encoded data extracting means 42, and the data of this scale factor is sent to the spectrum display means 15 through the display signal forming means 14. The encoded data extraction means 42 is a part of the audio signal decoding means 54 of FIG. In the method according to the first embodiment, the spectral signal which changes with time is highly efficiently and easily calculated and displayed.

【0042】次に、本発明の第2の実施例の概略的な構
成を図7に示す。
Next, FIG. 7 shows a schematic configuration of the second embodiment of the present invention.

【0043】この第2の実施例によるスペクトル表示装
置においては、符号化オーディオ信号入力端子41に可
変の時間分解能を持つ符号化オーディオ信号が入力され
る場合(第1のケース)、または表示信号形成手段14
及びスペクトル表示手段15の時間分解能が入力される
符号化オーディオ信号の分解能とは異なる場合(第2の
ケース)のスペクトル信号の算出を考える。
In the spectrum display apparatus according to the second embodiment, a coded audio signal having a variable time resolution is input to the coded audio signal input terminal 41 (first case), or a display signal is formed. Means 14
And the calculation of the spectrum signal when the time resolution of the spectrum display means 15 is different from the resolution of the input encoded audio signal (second case) will be considered.

【0044】この第2の実施例によれば、上記符号化オ
ーディオ信号入力端子41に入力された符号化オーディ
オ信号は、符号化データ抽出手段42によりスケールフ
ァクタ、ワードレングス、係数等が抽出されて時間軸処
理手段43に送られる。上記それぞれの値は、上記時間
軸処理手段43で保持することにより、一定の時間間隔
のスケールファクタのデータを上記表示信号形成手段1
4に供給する。上記表示信号形成手段14によりスペク
トル表示用信号が形成され、このスペクトル表示用信号
は上記スペクトル表示手段15に供給されて、スペクト
ルが表示される。
According to the second embodiment, the coded audio signal input to the coded audio signal input terminal 41 has the scale factor, word length, coefficient, etc. extracted by the coded data extracting means 42. It is sent to the time axis processing means 43. By holding the respective values in the time axis processing means 43, the scale factor data at constant time intervals can be converted into the display signal forming means 1.
Supply to 4. The display signal forming means 14 forms a spectrum display signal, and the spectrum display signal is supplied to the spectrum display means 15 to display a spectrum.

【0045】上記第1のケースは可変な時間分解能を持
つ入力オーディオ信号の場合であり、上記オーディオ信
号符号化手段52内の時間−周波数分析部61により分
配されるブロックが可変であるときに生じる。また、上
記時間−周波数分析部61が時間により変化する分析窓
を持つときにも生じる。この方法は、振幅変化の激しい
信号の振幅中に分析窓が短すぎるために信号の振幅部分
に生じるプリエコーを防止するために使用される。
The first case is the case of an input audio signal having a variable time resolution, and occurs when the block distributed by the time-frequency analysis unit 61 in the audio signal encoding means 52 is variable. . It also occurs when the time-frequency analysis unit 61 has an analysis window that changes with time. This method is used to prevent pre-echoes that occur in the amplitude part of the signal due to the analysis window being too short during the amplitude of the signal with a large amplitude change.

【0046】第1のケースは、可変的なレートのスケー
ルファクタが図7の時間軸処理手段43に入力され、上
記表示信号形成手段14により要求される固定されたレ
ートに変換されて出力される。ここで、幾つかのスケー
ルファクタが単一の周波数帯で受信されるならば、上記
時間軸処理手段43では、例えば平均値、もしくは最大
値のような最も近似するスケールファクタが選択され
る。また、与えられた周波数帯が現在の時間ブロック内
に新しいスケールファクタを受信しなければ、以前のス
ケールファクタが使用されることになる。
In the first case, a variable rate scale factor is input to the time axis processing means 43 of FIG. 7, converted to a fixed rate required by the display signal forming means 14 and output. . Here, if several scale factors are received in a single frequency band, the time axis processing means 43 selects the most approximate scale factor such as an average value or a maximum value. Also, if a given frequency band does not receive a new scale factor within the current time block, the previous scale factor will be used.

【0047】さらに、第1のケースにおいて、表示レー
トは新しいスケールファクタが受信されたときの最大レ
ートよりも大きいならば、上記時間軸処理手段43は、
上記スペクトル表示手段15がそれぞれの新しいスケー
ルファクタに対して対応することを確実にするバッファ
として動作する。このように、上記スペクトル表示手段
15は、上記周波数帯が短い分析モードにより入力され
るときに生成される増加したスケールファクタのレート
にも迅速に対応する。上述した動作は、一般的に信号の
振幅変化が激しい部分に生じ、上記スペクトル表示手段
15は、自動的に上記振幅変化の激しい部分のエネルギ
の急な増加にも適応する。この適応された結果は、固定
した窓のスペクトル表示装置には有効ではない望まれた
特徴である。
Furthermore, in the first case, if the display rate is greater than the maximum rate at which a new scale factor was received, the time base processing means 43
The spectrum display means 15 acts as a buffer to ensure that it corresponds to each new scale factor. Thus, the spectrum display means 15 quickly responds to the rate of increased scale factor produced when the frequency band is input in the short analysis mode. The above-mentioned operation generally occurs in a portion where the amplitude of the signal changes drastically, and the spectrum display means 15 automatically adapts to a sudden increase in energy in the portion where the amplitude changes drastically. This adapted result is a desired feature that is not valid for fixed window spectral displays.

【0048】また、第2のケースは、上記スペクトル表
示手段15の分解能とは異なる時間分解能を持つ入力オ
ーディオ信号の場合であり、上記時間軸処理手段43は
それぞれの表示サイクル中に受信された全スケールファ
クタを保持する。もし、新しいスケールファクタが受信
されないならば、即ち上記表示サイクルが信号の分析窓
よりも短い場合には、上記時間軸処理手段43は以前の
表示サイクルのスケールファクタの1つを出力する。ま
た、上記1つのスケールファクタよりも多くのスケール
ファクタを受信した場合には、上記時間軸処理手段43
はそれぞれの周波数帯に最も近似した、即ち最大又は同
等であるスケールファクタを選択し、このスケールファ
クタを出力する。
The second case is the case of an input audio signal having a time resolution different from that of the spectrum display means 15, and the time axis processing means 43 receives all the received signals during each display cycle. Holds the scale factor. If no new scale factor is received, i.e. the display cycle is shorter than the signal analysis window, the time base processing means 43 outputs one of the scale factors of the previous display cycle. Further, when more scale factors than the one scale factor are received, the time axis processing means 43.
Selects the scale factor that is the closest to, ie, maximum or equivalent to, each frequency band and outputs this scale factor.

【0049】上述したように、一定のスペクトルの係数
は伝送されて、本発明のスペクトル表示装置により表示
される。
As mentioned above, constant spectral coefficients are transmitted and displayed by the spectral display device of the present invention.

【0050】さらに、本発明で用いられるスペクトルを
得るために、第3の実施例として高能率圧縮符号化方法
を用いることができる。よって、この高能率圧縮符号化
の一具体例を詳述する。即ち、オーディオPCM信号等
の入力ディジタル信号を、帯域分割符号化(SBC)、
適応変換符号化(ATC)及び適応ビット割当ての各技
術を用いて高能率符号化する技術について、図8以降を
参照しながら説明する。
Furthermore, in order to obtain the spectrum used in the present invention, a high efficiency compression coding method can be used as the third embodiment. Therefore, a specific example of this high-efficiency compression encoding will be described in detail. That is, an input digital signal such as an audio PCM signal is subjected to band division coding (SBC),
A technique for highly efficient coding using each technique of adaptive transform coding (ATC) and adaptive bit allocation will be described with reference to FIG. 8 and subsequent figures.

【0051】図8に示す具体的な高能率符号化装置で
は、入力ディジタル信号を複数の周波数帯域に分割する
と共に、最低域の隣接した2帯域の帯域幅は同じで、よ
り高い周波数帯域では高い周波数帯域ほどバンド幅を広
く選定し、各周波数帯域毎に直交変換を行って得られた
周波数軸のスペクトルデータを、低域では、後述する人
間の聴覚特性を考慮したいわゆる臨界帯域幅(クリティ
カルバンド)毎に、中高域ではブロックフローティング
効率を考慮して臨界帯域幅を細分化した帯域毎に、適応
的にビット割当して符号化している。通常、このブロッ
クが量子化雑音発生ブロックとなる。さらに、本発明実
施例においては、直交変換の前に入力信号に応じて適応
的にブロックサイズ(ブロック長)を変化させると共
に、該ブロック単位でフローティング処理を行ってい
る。
In the concrete high-efficiency coding apparatus shown in FIG. 8, the input digital signal is divided into a plurality of frequency bands, and the bandwidths of the two adjacent lowest bands are the same, and are higher in the higher frequency bands. The wider the frequency band, the wider the bandwidth is selected, and the spectrum data on the frequency axis that is obtained by performing orthogonal transformation for each frequency band is used in the low frequency range. ), In the high and middle frequency band, the critical bandwidth is subdivided in consideration of the block floating efficiency, and each bit is adaptively bit-assigned and coded. Usually, this block is the quantization noise generation block. Furthermore, in the embodiment of the present invention, the block size (block length) is adaptively changed according to the input signal before the orthogonal transformation, and the floating process is performed for each block.

【0052】即ち、図8において、入力端子100には
例えばサンプリング周波数が44.1kHzの時、0〜
22kHzのオーディオPCM信号が供給されている。
この入力信号は、例えばいわゆるQMFフィルタ等の帯
域分割フィルタ101により0〜11kHz帯域と11
kHz〜22kHz帯域(高域)とに分割され、0〜1
1kHz帯域の信号は同じくいわゆるQMFフィルタ等
の帯域分割フィルタ102により0〜5.5kHz帯域
(低域)と5.5kHz〜11kHz帯域(中域)とに
分割される。帯域分割フィルタ101、102からの各
帯域の信号は直交変換ブロックサイズ決定回路106に
送られ、各帯域毎にブロックサイズが決定される。
That is, in FIG. 8, for example, when the sampling frequency is 44.1 kHz, 0 to 0 is input to the input terminal 100.
A 22 kHz audio PCM signal is supplied.
This input signal is divided into 0 to 11 kHz band and 11 by a band division filter 101 such as a so-called QMF filter.
It is divided into the band of kHz to 22 kHz (high range), and it is 0-1
A signal in the 1 kHz band is similarly divided into a 0 to 5.5 kHz band (low band) and a 5.5 kHz to 11 kHz band (middle band) by a band dividing filter 102 such as a so-called QMF filter. The signals of each band from the band division filters 101 and 102 are sent to the orthogonal transform block size determination circuit 106, and the block size is determined for each band.

【0053】この直交変換ブロックサイズ決定回路10
6において、ブロックサイズの長さは例えば11.6m
sの長さを基本とし、この長さが最大ブロックサイズと
なる。信号が時間的に準定常的である場合には、直交変
換ブロックサイズに最大ブロックサイズである11.6
msを選択することによって周波数分解能を高め、信号
が時間的に非定常的である場合には、11kHz以下の
帯域では直交変換ブロックサイズをさらに4分割し、1
1kHz以上の帯域では直交変換ブロックサイズを8分
割することにより時間分解能を高める。
This orthogonal transform block size determination circuit 10
6, the block size length is 11.6 m, for example.
Based on the length of s, this length becomes the maximum block size. If the signal is quasi-stationary in time, the maximum block size is 11.6 which is the orthogonal transform block size.
When the frequency resolution is increased by selecting ms and the signal is non-stationary in time, the orthogonal transform block size is further divided into four in the band of 11 kHz or less, and
In the band of 1 kHz or higher, the time resolution is improved by dividing the orthogonal transform block size into eight.

【0054】ここで上述した入力ディジタル信号を複数
の周波数帯域に分割する手法としては、例えばQMFフ
ィルタがあり、1976 R.E.Crochiere Digital Coding o
fSpeech in Subbands Bell Syst.Tech. J. Vol.55,No.8
1976に述べられている。また、ICASSP 83,Boston Poly
phase Quadrature Filters-A New Subband CodingTechn
ique Joseph H. Rothweiler には、等バンド幅のフィル
タ分割手法が述べられている。
As a method of dividing the above-mentioned input digital signal into a plurality of frequency bands, there is, for example, a QMF filter, and 1976 RECrochiere Digital Coding
fSpeech in Subbands Bell Syst.Tech. J. Vol.55, No.8
1976. Also, ICASSP 83, Boston Poly
phase Quadrature Filters-A New Subband CodingTechn
ique Joseph H. Rothweiler describes a technique for partitioning filters with equal bandwidth.

【0055】図8において、帯域分割フィルタ101、
102からの出力は、各帯域の信号毎にそれぞれ各直交
変換回路103、104、105に供給される。これと
同時に、上記直交変換ブロックサイズ決定回路106に
おいて決定されたブロックサイズは各直交変換回路10
3、104、105に供給され、上記帯域分割フィルタ
101、102からの出力は上記ブロックサイズに応じ
てブロック化され、直交変換処理される。図9は直交変
換ブロックサイズを示したものであり、低域及び中域で
は11.6ms(ロングモード)もしくは2.9ms
(ショートモード)のどちらかを選択し、高域では1
1.6ms(ロングモード)もしくは1.45ms(シ
ョートモード)のどちらかを選択する。決定された直交
変換ブロックサイズ情報は、図8の端子111から取り
出され、復号化回路へ送られる。
In FIG. 8, the band division filter 101,
The output from 102 is supplied to each orthogonal transform circuit 103, 104, 105 for each signal in each band. At the same time, the block size determined by the orthogonal transform block size determination circuit 106 is determined by the orthogonal transform circuit 10
3, 104, 105, and the outputs from the band division filters 101, 102 are divided into blocks according to the block size and subjected to orthogonal transform processing. FIG. 9 shows the orthogonal transform block size, which is 11.6 ms (long mode) or 2.9 ms in the low and middle frequencies.
Select either (Short mode), 1 in high range
Select either 1.6 ms (long mode) or 1.45 ms (short mode). The determined orthogonal transform block size information is taken out from the terminal 111 of FIG. 8 and sent to the decoding circuit.

【0056】ここで、上述した直交変換としては、例え
ば入力オーディオ信号を所定単位時間(フレーム)でブ
ロック化し、当該ブロック毎に高速フーリエ変換(FF
T)、離散コサイン変換(DCT)、変更離散DCT変
換(MDCT)等を行うことで時間軸を周波数軸に変換
するような直交変換がある。MDCTについてはICASSP
1987 Subband/Transform Coding Using Filter Bank D
esigns Based on TimeDomain Aliasing Cancellation
J.P.Princen A.B.Bradley Univ. of SurreyRoyal Me
lbourne Inst. of Tech.に述べられている。
Here, as the above-mentioned orthogonal transform, for example, the input audio signal is divided into blocks in a predetermined unit time (frame), and fast Fourier transform (FF) is performed for each block.
T), Discrete Cosine Transform (DCT), Modified Discrete DCT Transform (MDCT), etc. are used to transform the time axis into the frequency axis. ICASSP for MDCT
1987 Subband / Transform Coding Using Filter Bank D
esigns Based on TimeDomain Aliasing Cancellation
JPPrincen ABBradley Univ. Of SurreyRoyal Me
lbourne Inst. of Tech.

【0057】次に、上記ビット配分算出回路107の一
具体例の概略構成を示すブロック回路を図10に示す。
この図10において、入力端子121には、上記各直交
変換回路103、104、105からの周波数軸上のス
ペクトルデータが供給されている。
Next, FIG. 10 shows a block circuit showing a schematic configuration of a specific example of the bit distribution calculating circuit 107.
In FIG. 10, input terminal 121 is supplied with spectrum data on the frequency axis from each of the orthogonal transform circuits 103, 104 and 105.

【0058】この周波数軸上の入力データは、帯域毎の
エネルギ算出回路122に送られて、上記マスキング量
とクリティカルバンド及びブロックフローティングを考
慮した各分割帯域のエネルギが、例えば当該バンド内で
の各振幅値の総和を計算すること等により求められる。
この各バンド毎のエネルギの代わりに、振幅値のピーク
値、平均値等が用いられることもある。このエネルギ算
出回路122からの出力として、例えば各バンドの総和
値のスペクトルを図11にスペクトルSBとして示して
いる。ただし、この図11では、図示を簡略化するた
め、上記マスキング量とクリティカルバンド及びブロッ
クフローティングを考慮した分割帯域数を12バンド
(B1 〜B12)で表現している。
The input data on the frequency axis is sent to the energy calculation circuit 122 for each band, and the energy of each divided band considering the masking amount, the critical band and the block floating is, for example, each energy in the band. It can be obtained by calculating the sum of amplitude values.
Instead of the energy for each band, a peak value, an average value, etc. of the amplitude value may be used. As an output from the energy calculation circuit 122, for example, the spectrum of the sum value of each band is shown as the spectrum SB in FIG. However, in FIG. 11, in order to simplify the illustration, the number of division bands in consideration of the masking amount, the critical band, and the block floating is represented by 12 bands (B1 to B12).

【0059】ここで、上記スペクトルSBのいわゆるマ
スキングにおける影響を考慮するために、該スペクトル
SBに所定の重み付け関数を掛けて加算するような畳込
み(コンボリューション)処理を施す。このため、上記
帯域毎のエネルギ算出回路22の出力、即ち該スペクト
ルSBの各値は、畳込みフィルタ回路123に送られ
る。この畳込みフィルタ回路123は、例えば、入力デ
ータを順次遅延させる複数の遅延素子と、これら遅延素
子からの出力にフィルタ係数(重み付け関数)を乗算す
る複数の乗算器(例えば各バンドに対応する25個の乗
算器)と、各乗算器出力の総和をとる総和加算器とから
構成されるものである。この畳込み処理により、図11
中の点線で示す部分の総和がとられる。
Here, in order to consider the influence of so-called masking on the spectrum SB, a convolution process is performed such that the spectrum SB is multiplied by a predetermined weighting function and added. Therefore, the output of the energy calculation circuit 22 for each band, that is, each value of the spectrum SB is sent to the convolution filter circuit 123. The convolution filter circuit 123 includes, for example, a plurality of delay elements that sequentially delay input data and a plurality of multipliers that multiply outputs from these delay elements by a filter coefficient (weighting function) (for example, 25 corresponding to each band). Number of multipliers), and a sum adder that sums the outputs of the multipliers. By this convolution processing, FIG.
The sum of the parts shown by the dotted line in the figure is taken.

【0060】尚、上記マスキングとは、人間の聴覚上の
特性により、ある信号によって他の信号がマスクされて
聞こえなくなる現象をいうものであり、このマスキング
効果には、時間軸上のオーディオ信号による時間軸マス
キング効果と、周波数軸上の信号による同時刻マスキン
グ効果とがある。これらのマスキング効果により、マス
キングされる部分にノイズがあったとしても、このノイ
ズは聞こえないことになる。このため、実際のオーディ
オ信号では、このマスキングされる範囲内のノイズは許
容可能なノイズとされる。
The masking means a phenomenon in which one signal is masked by another signal and becomes inaudible due to human auditory characteristics. The masking effect depends on the audio signal on the time axis. There are a time axis masking effect and a simultaneous time masking effect by a signal on the frequency axis. Due to these masking effects, even if there is noise in the masked portion, this noise cannot be heard. Therefore, in the actual audio signal, the noise within the masked range is regarded as an acceptable noise.

【0061】ここで、上記畳込みフィルタ回路123の
各乗算器の乗算係数(フィルタ係数)の一具体例を示す
と、任意のバンドに対応する乗算器Mの係数を1とする
とき、乗算器M−1で係数0.15を、乗算器M−2で
係数0.0019を、乗算器M−3で係数0.0000
086を、乗算器M+1で係数0.4を、乗算器M+2
で係数0.06を、乗算器M+3で係数0.007を各
遅延素子の出力に乗算することにより、上記スペクトル
SBの畳込み処理が行われる。ただし、Mは1〜25の
任意の整数である。
Here, a specific example of the multiplication coefficient (filter coefficient) of each multiplier of the convolution filter circuit 123 will be described. When the coefficient of the multiplier M corresponding to an arbitrary band is 1, the multiplier is M-1 gives a coefficient of 0.15, multiplier M-2 gives a coefficient of 0.0019, and multiplier M-3 gives a coefficient of 0.0000.
086, multiplier M + 1 gives a coefficient of 0.4, multiplier M + 2
By multiplying the output of each delay element by a coefficient of 0.06 with a coefficient of 0.007 with a multiplier M + 3, the convolution processing of the spectrum SB is performed. However, M is an arbitrary integer of 1 to 25.

【0062】上記畳込みフィルタ回路123からの出力
は引算器124に送られる。この引算器124は、上記
畳込んだ領域での後述する許容可能なノイズレベルに対
応するレベルαを求めるものである。なお、当該許容可
能なノイズレベル(許容ノイズレベル)に対応するレベ
ルαは、後述するように、逆コンボリューション処理を
行うことによって、クリティカルバンドの各バンド毎の
許容ノイズレベルとなるようなレベルである。ここで、
上記引算器124には、上記レベルαを求めるための許
容関数(マスキングレベルを表現する関数)が供給され
る。この許容関数を増減させることで上記レベルαの制
御を行っている。当該許容関数は、次に説明するような
(n−ai)関数発生回路125から供給されているも
のである。
The output from the convolution filter circuit 123 is sent to the subtractor 124. The subtractor 124 calculates a level α corresponding to an allowable noise level described later in the convoluted area. The level α corresponding to the permissible noise level (permissible noise level) is a level at which the critical noise band becomes the permissible noise level for each band by performing inverse convolution processing, as described later. is there. here,
The subtractor 124 is supplied with an allowance function (function expressing a masking level) for obtaining the level α. The level α is controlled by increasing or decreasing this allowance function. The permissible function is supplied from the (n-ai) function generating circuit 125 described below.

【0063】即ち、許容ノイズレベルに対応するレベル
αは、クリティカルバンドのバンドの低域から順に与え
られる番号をiとすると、次の(1)式で求めることが
できる。 α=S−(n−ai) ・・・(1) この(1)式において、n,aは定数でa>0、Sは畳
込み処理されたバークスペクトルの強度であり、(1)
式中(n−ai)が許容関数となる。本実施例では、n
=38、a=1としており、この時の音質劣化はなく、
良好な符号化が行える。
That is, the level α corresponding to the allowable noise level can be obtained by the following equation (1), where i is the number given in order from the low band of the critical band. α = S- (n-ai) (1) In this equation (1), n and a are constants, a> 0, S is the intensity of the convolution-processed Bark spectrum, and (1)
In the formula, (n-ai) is the allowable function. In this embodiment, n
= 38, a = 1, there is no sound quality deterioration at this time,
Good encoding can be performed.

【0064】このようにして、上記レベルαが求めら
れ、このデータは割算器126に伝送される。この割算
器126は、上記畳込みされた領域での上記レベルαを
逆コンボリューションするためのものである。従って、
この逆コンボリューション処理を行うことにより、上記
レベルαからマスキングスペクトルが得られるようにな
る。即ち、このマスキングスペクトルが許容ノイズスペ
クトルとなる。なお、上記逆コンボリユーション処理は
複雑な演算を必要とするが、本実施例では簡略化した割
算器126を用いて逆コンボリューションを行ってい
る。
In this way, the level α is obtained, and this data is transmitted to the divider 126. The divider 126 is for deconvoluting the level α in the convolved region. Therefore,
By performing this inverse convolution processing, the masking spectrum can be obtained from the level α. That is, this masking spectrum becomes the allowable noise spectrum. Although the above-mentioned inverse convolution processing requires a complicated operation, in the present embodiment, the inverse convolution is performed using the simplified divider 126.

【0065】次に、上記マスキングスペクトルは、合成
回路127を介して減算器128に伝送される。ここ
で、この減算器128には、上記帯域毎のエネルギ検出
回路122からの出力、即ち前述したスペクトルSB
が、遅延回路129を介して供給されている。従って、
この減算器128で上記マスキングスペクトルとスペク
トルSBとの減算演算が行われることで、図12示すよ
うに、上記スペクトルSBは、該マスキングスペクトル
MSのレベルで示すレベル以下がマスキングされること
になる。
Next, the masking spectrum is transmitted to the subtractor 128 via the synthesizing circuit 127. Here, the output from the energy detection circuit 122 for each band, that is, the spectrum SB described above, is input to the subtractor 128.
Are supplied via the delay circuit 129. Therefore,
By performing the subtraction operation of the masking spectrum and the spectrum SB in the subtractor 128, as shown in FIG. 12, the spectrum SB is masked below the level indicated by the level of the masking spectrum MS.

【0066】上記減算器128からの出力は、許容雑音
補正回路130を介し、出力端子131を介して取り出
され、例えば割当てビット数情報が予め記憶されたRO
M等(図示せず)に送られる。このROM等は、上記減
算回路128から許容雑音補正回路130を介して得ら
れた出力(上記各バンドのエネルギと上記ノイズレベル
設定手段の出力との差分のレベル)に応じ、各バンド毎
の割当ビット数情報を出力する。この割当ビット数情報
が図8の適応ビット割当符号化回路108に送られるこ
とで、各直交変換回路103、104、105からの周
波数軸上の各スペクトルデータがそれぞれのバンド毎に
割り当てられたビット数で量子化されるわけである。
The output from the subtracter 128 is taken out through the output terminal 131 through the allowable noise correction circuit 130, and, for example, RO in which the allocated bit number information is stored in advance.
M, etc. (not shown). This ROM or the like is assigned to each band according to the output (the level of the difference between the energy of each band and the output of the noise level setting means) obtained from the subtraction circuit 128 via the allowable noise correction circuit 130. Outputs bit number information. This allocation bit number information is sent to the adaptive bit allocation encoding circuit 108 in FIG. 8 so that each spectrum data on the frequency axis from each orthogonal transformation circuit 103, 104, 105 is allocated to each band. It is quantized by a number.

【0067】即ち、要約すれば、図8の適応ビット割当
符号化回路108では、上記マスキング量とクリティカ
ルバンド及びブロックフローティングを考慮した各分割
帯域のエネルギと上記ノイズレベル設定手段の出力との
差分のレベルに応じて割当てられたビット数で、上記各
バンド毎のスペクトルデータを量子化することになる。
なお、遅延回路129は上記合成回路127以前の各回
路での遅延量を考慮してエネルギ検出回路122からの
スペクトルSBを遅延させるために設けられている。
That is, in summary, in the adaptive bit allocation encoding circuit 108 of FIG. 8, the difference between the masking amount, the energy of each divided band considering the critical band and the block floating, and the output of the noise level setting means is calculated. The spectrum data for each band is quantized by the number of bits assigned according to the level.
The delay circuit 129 is provided in order to delay the spectrum SB from the energy detection circuit 122 in consideration of the delay amount in each circuit before the synthesis circuit 127.

【0068】ところで、上述した合成回路127での合
成の際には、最小可聴カーブ発生回路132から供給さ
れる図13に示すような人間の聴覚特性であるいわゆる
最小可聴カーブRCを示すデータと、上記マスキングス
ペクトルMSとを合成することができる。この最小可聴
カーブにおいて、雑音絶対レベルがこの最小可聴カーブ
以下ならば該雑音は聞こえないことになる。この最小可
聴カーブは、コーディングが同じであっても例えば再生
時の再生ボリュームの違いで異なるものとなるが、現実
的なディジタルシステムでは、例えば16ビットダイナ
ミックレンジへの音楽のはいり方にはさほど違いがない
ので、例えば4kHz付近の最も耳に聞こえやすい周波
数帯域の量子化雑音が聞こえないとすれば、他の周波数
帯域ではこの最小可聴カーブのレベル以下の量子化雑音
は聞こえないと考えられる。
By the way, at the time of synthesizing by the synthesizing circuit 127 described above, data indicating a so-called minimum audible curve RC which is the human auditory characteristic as shown in FIG. The masking spectrum MS can be combined. In this minimum audible curve, if the absolute noise level is below this minimum audible curve, the noise will not be heard. Even if the coding is the same, the minimum audible curve differs depending on, for example, the difference in reproduction volume at the time of reproduction, but in a realistic digital system, for example, how to enter music into a 16-bit dynamic range is very different. Therefore, if the quantization noise in the most audible frequency band around 4 kHz is not heard, it is considered that the quantization noise below the level of the minimum audible curve is not heard in other frequency bands.

【0069】従って、このように例えばシステムの持つ
ワードレングスの4kHz付近の雑音が聞こえない使い
方をすると仮定し、この最小可聴カーブRCとマスキン
グスペクトルMSとを共に合成することで許容ノイズレ
ベルを得るようにすると、この場合の許容ノイズレベル
は、図13中の斜線で示す部分までとすることができる
ようになる。なお、本実施例では、上記最小可聴カーブ
の4kHzのレベルを、例えば20ビット相当の最低レ
ベルに合わせている。また、この図13は、信号スペク
トルSSも同時に示している。
Accordingly, assuming that the system is used in such a manner that noise near the 4 kHz of the word length possessed by the system cannot be heard, the minimum audible curve RC and the masking spectrum MS are combined together to obtain an allowable noise level. In this case, the allowable noise level in this case can be up to the shaded portion in FIG. In this embodiment, the level of 4 kHz of the minimum audible curve is set to the minimum level equivalent to 20 bits, for example. Further, FIG. 13 also shows the signal spectrum SS at the same time.

【0070】また、上記許容雑音補正回路130では、
補正情報出力回路133から送られてくる例えば等ラウ
ドネスカーブの情報に基づいて、上記減算器128から
の出力における許容雑音レベルを補正している。ここ
で、等ラウドネスカーブとは、人間の聴覚特性に関する
特性曲線であり、例えば1kHzの純音と同じ大きさに
聞こえる各周波数での音の音圧を求めて曲線で結んだも
ので、ラウドネスの等感度曲線とも呼ばれる。またこの
等ラウドネス曲線は、図13に示した最小可聴カーブR
Cと略同じ曲線を描くものである。この等ラウドネス曲
線においては、例えば4kHz付近では1kHzのとこ
ろより音圧が8〜10dB下がっても1kHzと同じ大
きさに聞こえ、逆に、50Hz付近では1kHzでの音
圧よりも約15dB高くないと同じ大きさに聞こえな
い。このため、上記最小可聴カーブのレベルを越えた雑
音(許容ノイズレベル)は、該等ラウドネス曲線に応じ
たカーブで与えられる周波数特性を持つようにするのが
良いことがわかる。このようなことから、上記等ラウド
ネス曲線を考慮して上記許容ノイズレベルを補正するこ
とは、人間の聴覚特性に適合していることがわかる。
Further, in the allowable noise correction circuit 130,
The allowable noise level in the output from the subtractor 128 is corrected based on, for example, the equal loudness curve information sent from the correction information output circuit 133. Here, the equal loudness curve is a characteristic curve relating to human auditory characteristics, and is obtained by, for example, obtaining the sound pressure of sound at each frequency heard at the same loudness as a pure tone of 1 kHz and connecting them with a curve. Also called sensitivity curve. Further, this equal loudness curve is the minimum audible curve R shown in FIG.
It draws a curve substantially the same as C. In this equal loudness curve, for example, in the vicinity of 4 kHz, even if the sound pressure is reduced by 8 to 10 dB from 1 kHz, it sounds as loud as 1 kHz, and conversely, in the vicinity of 50 Hz, it is not higher than the sound pressure at 1 kHz by about 15 dB. It doesn't sound the same. Therefore, it is understood that it is preferable that the noise (allowable noise level) exceeding the level of the minimum audible curve has a frequency characteristic given by a curve corresponding to the equal loudness curve. From this, it can be seen that correcting the permissible noise level in consideration of the equal loudness curve is suitable for human hearing characteristics.

【0071】ここで、上記補正情報出力回路133とし
て、図8の上記適応ビット割当符号化回路108での量
子化の際の出力情報量(データ量)の検出出力と、最終
符号化データのビットレート目標値との間の誤差の情報
に基づいて、上記許容ノイズレベルを補正するようにし
てもよい。これは、全てのビット割当単位ブロックに対
して予め一時的な適応ビット割当を行って得られた総ビ
ット数が、最終的な符号化出力データのビットレートに
よって定まる一定のビット数(目標値)に対して誤差を
持つことがあり、その誤差分を0とするように再度ビッ
ト割当をするものである。即ち、当該目標値よりも総割
当ビット数が少ないときには、差のビット数を各単位ブ
ロックに割り振って付加するようにし、目標値よりも総
割当ビット数が多いときには、差のビット数を各単位ブ
ロックに割り振って削るようにするわけである。
Here, as the correction information output circuit 133, the detection output of the output information amount (data amount) at the time of quantization in the adaptive bit allocation encoding circuit 108 of FIG. 8 and the bit of the final encoded data The allowable noise level may be corrected based on the information on the error from the rate target value. This is because the total number of bits obtained by performing temporary adaptive bit allocation in advance for all bit allocation unit blocks is a fixed number of bits (target value) determined by the bit rate of the final encoded output data. May have an error with respect to, and bit allocation is performed again so that the error may be zero. That is, when the total allocated bit number is smaller than the target value, the difference bit number is allocated to each unit block and added, and when the total allocated bit number is larger than the target value, the difference bit number is set in each unit. Allocate to blocks and delete.

【0072】このようなことを行うため、上記総割当ビ
ット数の上記目標値からの誤差を検出し、この誤差デー
タに応じて上記補正情報出力回路133が各割当ビット
数を補正するための補正データを出力する。ここで、上
記誤差データがビット数不足を示す場合は、上記単位ブ
ロック当たり多くのビット数が使われることで上記デー
タ量が上記目標値よりも多くなっている場合を考えるこ
とができる。また、上記誤差データが、ビット数余りを
示すデータとなる場合は、上記単位ブロック当たり少な
いビット数で済み、上記データ量が上記目標値よりも少
なくなっている場合を考えることができる。従って、上
記補正情報出力回路133からは、この誤差データに応
じて、上記減算器128からの出力における許容ノイズ
レベルを、例えば上記等ラウドネス曲線の情報データに
基づいて補正させるための上記補正値のデータが出力さ
れるようになる。上述のような補正値が、上記許容雑音
補正回路130に伝送されることで、上記減算器128
からの許容ノイズレベルが補正されるようになる。以上
説明したようなシステムでは、メイン情報として直交変
換出力スペクトルをサブ情報により処理したデータと、
サブ情報としてブロックフローティングの状態を示すス
ケールファクタ及び語長を示すワードレングスが得ら
れ、エンコーダからデコーダに送られる。
In order to do this, an error of the total allocated bit number from the target value is detected, and the correction information output circuit 133 corrects the allocated bit number according to the error data. Output the data. Here, when the error data indicates a bit number shortage, it can be considered that the data amount is larger than the target value because a large number of bits are used per unit block. Further, when the error data is data indicating a surplus of the number of bits, it can be considered that the number of bits per unit block is small and the amount of data is smaller than the target value. Therefore, the correction information output circuit 133 outputs the correction value for correcting the allowable noise level in the output from the subtractor 128 based on the error data, for example, based on the information data of the equal loudness curve. Data will be output. By transmitting the correction value as described above to the allowable noise correction circuit 130, the subtracter 128
The allowable noise level from is corrected. In the system as described above, the data obtained by processing the orthogonal transform output spectrum by the sub information as the main information,
As the sub information, a scale factor indicating a block floating state and a word length indicating a word length are obtained and sent from the encoder to the decoder.

【0073】上述したビット配分方法とは異なった有効
なビット配分方法について以下に述べる。
An effective bit allocation method different from the above-mentioned bit allocation method will be described below.

【0074】適応ビット割当回路の動作を図14で説明
する。直交変換出力、例えばMDCT出力が、端子30
0に供給されており、このMDCT出力は、臨界帯域又
は高域ではさらに臨界帯域を複数個に分割した帯域、い
わゆるブロックフローティングバンド毎に帯域毎のエネ
ルギ算出回路301において、分割帯域毎のエネルギが
算出される。この各帯域のエネルギの代わりに振幅のピ
ーク値、平均値等が用いられることもある。
The operation of the adaptive bit allocation circuit will be described with reference to FIG. Orthogonal transform output, for example MDCT output,
This MDCT output has the energy for each divided band in the energy calculation circuit 301 for each band, that is, a band obtained by further dividing the critical band into a plurality of bands in the critical band or the high band, that is, a so-called block floating band. It is calculated. A peak value, an average value or the like of the amplitude may be used instead of the energy of each band.

【0075】ところで、直交変換出力であるMDCT係
数を表現して伝送又は記録に使用することができる総ビ
ット数305を、1kビット/ブロックとすると、この
1kビットを用いた固定ビット配分パターン307を形
成する。固定ビット配分のためのビット割当パターンは
複数個用意されており、信号の性質により、種々の選択
をすることができる。このビット割当パターンには、1
kビットに対応する短い時間のブロックのビット量を各
周波数に分布させた種々のパターンがある。特に、本実
施例では、中低域と高域とのビット配分率を違えたパタ
ーンを複数個用意している。ここで、信号の大きさが小
さい程、高域への割当量が少ないパターンを選択するよ
うにする。このようにして、小さい信号の大きさとして
は、全帯域の信号の大きさを使用することもできるが、
さらには、フィルタなどが用いられている非ブロッキン
グ周波数分割回路の出力、もしくは直交変換出力、例え
ばMDCT出力を利用する。また、帯域毎のエネルギか
らエネルギ依存のビット配分パターン306が決定され
る。このエネルギ依存のビット配分パターン306は、
例えば該バンドのエネルギが大きい程、多くのビットが
割り当てられるように配分する。
By the way, assuming that the total number of bits 305 that can be used for transmission or recording by expressing the MDCT coefficient which is an orthogonal transform output is 1 kbit / block, a fixed bit allocation pattern 307 using this 1k bit is obtained. Form. A plurality of bit allocation patterns for fixed bit allocation are prepared, and various selections can be made depending on the nature of the signal. This bit allocation pattern has 1
There are various patterns in which the bit amount of a short time block corresponding to k bits is distributed to each frequency. In particular, in the present embodiment, a plurality of patterns having different bit allocation ratios in the low and middle frequencies are prepared. Here, as the signal size is smaller, a pattern with a smaller amount of allocation to the high frequency band is selected. In this way, as the small signal size, the signal size of the entire band can be used,
Furthermore, the output of the non-blocking frequency division circuit using a filter or the like, or the orthogonal transform output, for example, the MDCT output is used. An energy-dependent bit allocation pattern 306 is determined from the energy of each band. This energy-dependent bit allocation pattern 306 is
For example, the larger the energy of the band is, the more bits are allocated and allocated.

【0076】上記固定ビット配分パターン307のビッ
ト配分と、各帯域毎のスペクトルに依存したビット配分
との分割率は、信号スペクトルの滑らかさを表す指標
(トーナリティ)により決定される。本実施例では、ス
ペクトルの滑らかさ算出回路302において、信号スペ
クトルの隣接値間の差の絶対値の和を、信号スペクトル
の和で割った値を算出し、この値を指標(トーナリテ
ィ)として用いている。このトーナリティが決定される
と、ビット分割率決定回路304において、上記分割率
が決定される。この分割率とは、固定ビット配分とエネ
ルギ依存のビット配分との重み付けを変えるための値で
ある。
The division ratio between the bit allocation of the fixed bit allocation pattern 307 and the spectrum-dependent bit allocation of each band is determined by an index (tonality) indicating the smoothness of the signal spectrum. In the present embodiment, the spectrum smoothness calculation circuit 302 calculates a value obtained by dividing the sum of absolute values of differences between adjacent values of the signal spectrum by the sum of the signal spectrum, and uses this value as an index (tonality). ing. When the tonality is determined, the bit division rate determination circuit 304 determines the division rate. This division ratio is a value for changing the weighting of fixed bit allocation and energy-dependent bit allocation.

【0077】上記固定ビット配分の値は乗算器309
で、帯域毎(臨界帯域、又は高域では臨界帯域をさらに
複数個に細分化した帯域)のエネルギに依存したビット
配分の値は乗算器308でそれぞれ上記配分率を乗じ、
それらの2つの値が加算回路310で加えられて、端子
311から取り出され、量子化及び符号化の際に使用さ
れる。
The value of the fixed bit allocation is the multiplier 309.
Then, the value of the bit allocation depending on the energy of each band (critical band or a band in which the critical band is further subdivided in the high band) is multiplied by the above allocation ratio in the multiplier 308,
These two values are added in the adder circuit 310, taken out from the terminal 311, and used in the quantization and encoding.

【0078】このときのビット割当の状態を図15の
(a)及び図16の(a)に示し、これに対応する量子
化雑音の状態を図15の(b)及び図16の(b)に示
す。
The state of bit allocation at this time is shown in (a) of FIG. 15 and (a) of FIG. 16, and the state of quantization noise corresponding to this is shown in (b) of FIG. 15 and (b) of FIG. Shown in.

【0079】図15の(a)及び図16の(a)におい
て、信号レベルa中の固定ビット割当分による雑音レベ
ルをb、信号レベル依存分のよる雑音低下分をcで示し
ている。図15は、信号のスペクトルが割合平坦である
場合を示しており、多量の固定ビット割当分によるビッ
ト割当は、全帯域において大きい信号雑音比を取るため
に役立つ。しかし、低域及び高域では比較的少ないビッ
ト割当が使用されている。これは聴覚的に低域及び高域
の重要度が小さいためである。同時に、若干の信号レベ
ル依存のビット配分のための図15の(b)の斜線で示
される信号レベル依存分のビット量により、信号の大き
さが大きい帯域の雑音レベルが選択的に低下させられる
が、信号スペクトルが割合平坦である場合には、この選
択性も割合広い帯域に渡って作用することになる。
In FIGS. 15A and 16A, the noise level due to the fixed bit allocation in the signal level a is shown by b, and the noise reduction due to the signal level dependent is shown by c. FIG. 15 shows the case where the spectrum of the signal is relatively flat, and bit allocation with a large amount of fixed bit allocation helps to have a large signal-to-noise ratio in the entire band. However, relatively low bit allocations are used in the low and high frequencies. This is because the importance of the low range and the high range is auditorily small. At the same time, the noise level in the band in which the signal size is large is selectively lowered by the bit amount corresponding to the signal level shown by the diagonal lines in FIG. 15B for the bit allocation depending on the signal level. However, if the signal spectrum is relatively flat, this selectivity will also work over a relatively wide band.

【0080】これに対して、図16に示すように、信号
スペクトルが高いトーナリティを示す場合には、多量の
信号レベル依存のビット配分のための図16の(b)の
斜線で示される信号レベル依存分のビット量により、量
子化雑音の低下は極めて狭い帯域の雑音を低減するため
に使用される。これにより、孤立スペクトル入力信号で
の特性の向上が達成される。同時に、若干の固定ビット
割当分によるビット配分を行う分により、広い帯域の雑
音レベルが非選択的に低下させられる。
On the other hand, as shown in FIG. 16, when the signal spectrum shows a high tonality, the signal level indicated by the diagonal lines in FIG. 16B for a large amount of signal level-dependent bit allocation. Due to the amount of dependent bits, the quantization noise reduction is used to reduce noise in a very narrow band. This achieves improved performance with isolated spectrum input signals. At the same time, the noise level in a wide band is non-selectively lowered by the bit allocation by a slight fixed bit allocation.

【0081】再び、図8において、適応ビット割当符号
化回路108について説明する。本実施例では、例えば
2種類のビットレートのモードを持ち、例えばAモード
を128kbps/channelとし、BモードはA
モードの半分の64kbps/channnelとす
る。また、本実施例では2種類のモードに限らず、複数
のモードを持つことが可能である。
Again, referring to FIG. 8, the adaptive bit allocation encoding circuit 108 will be described. In this embodiment, for example, there are two kinds of bit rate modes, for example, A mode is 128 kbps / channel and B mode is A.
Half the mode, 64 kbps / channel. In addition, the present embodiment is not limited to the two types of modes, and it is possible to have a plurality of modes.

【0082】先ず、Aモードにおける符号化方法につい
て説明する。図17及び図18は、Aモードにおけるブ
ロックフローティングバンド分割の一具体例を示してい
る。図17は直交変換ブロックサイズが11.6msの
場合であり、図18は直交変換ブロックサイズが低中域
で4分割、高域では8分割されている場合であるが、ど
ちらの場合でも全体のブロックフローティングバンドの
数は同じであり、52個のバンドに分割されている。さ
らに、帯域分割フィルタの出力である各帯域毎に見る
と、低域では20個、中高域ではそれぞれ16個のブロ
ックフローティングがあり、この個数は直交変換ブロッ
クサイズに関係なく決まっているので、直交変換ブロッ
クサイズが帯域毎に独立に変化しても問題はない。
First, the encoding method in the A mode will be described. 17 and 18 show a specific example of block floating band division in the A mode. FIG. 17 shows the case where the orthogonal transform block size is 11.6 ms, and FIG. 18 shows the case where the orthogonal transform block size is divided into 4 in the low and middle regions and 8 in the high region. The number of block floating bands is the same and is divided into 52 bands. Further, looking at each band output from the band division filter, there are 20 block floating in the low band and 16 block floating in the middle and high band, respectively. Since this number is determined regardless of the orthogonal transform block size, the orthogonal transform is performed. There is no problem if the conversion block size changes independently for each band.

【0083】例えば、低域だけ11.6msを4分割し
たブロックサイズで、中高域は11.6msのブロック
サイズである場合、ブロックフローティングバンドを、
低域は図18、中高域は図17のように分割すれば、バ
ンド数は全体として52個となる。上記適応ビット割当
符号化回路108には、この52個のブロックフローテ
ィングバンド毎にスケールファクタ及びワードレングス
の情報が与えられており、スペクトルデータは上記与え
られたスケールファクタ及びワードレングスに応じて量
子化され、符号化される。符号化データは端子110か
ら取り出され、記録又は伝送される。
For example, in the case where the low-frequency band has a block size obtained by dividing 11.6 ms into four blocks and the mid-high band has a block size of 11.6 ms, the block floating band is
If the low band is divided as shown in FIG. 18 and the middle and high bands are divided as shown in FIG. 17, the total number of bands is 52. The adaptive bit allocation coding circuit 108 is provided with scale factor and word length information for each of the 52 block floating bands, and the spectrum data is quantized in accordance with the given scale factor and word length. And encoded. The encoded data is taken out from the terminal 110 and recorded or transmitted.

【0084】次に、Bモードの符号化方法について説明
する。Bモードは、ビットレートがAモードに対して半
分になるため、Aモードと同じ方法で符号化すると、サ
ブ情報(スケールファクタ、ワードレングス等)の量は
変わらず、メイン情報(スペクトルデータ)の量だけ現
象することになり、Aモードに比較すると、全情報量中
のサブ情報の占める割合が増大し、符号化効率が低下す
る。ビットレートを半分にする場合は、メイン情報量だ
けではなく、サブ情報量も半減、もしくはそれ以下に削
減することが望ましい。本実施例においては、Bモード
におけるサブ情報量をAモードに対して半減させるため
に、時間的に隣接する2つのブロック間でサブ情報の値
を共通に持つことで、サブ情報量の削減を達成してい
る。即ち、Aモードにおけるサブ情報量は、基本的にブ
ロックフローティングバンド数と等しいため、52個/
11.6msであるが、Bモードにおいてはブロックフ
ローティングバンドの時間軸方向を拡張することになる
ため、52個/23.2msとなり、同一時間内におけ
るサブ情報量を比較すると、Aモードに対して半分の量
となっている。
Next, the B-mode coding method will be described. Since the bit rate in B mode is half that in A mode, the amount of sub information (scale factor, word length, etc.) does not change when encoded in the same manner as in A mode, and the main information (spectral data) As a result, the amount of sub information in the total amount of information increases, and the coding efficiency decreases, as compared with the A mode. When the bit rate is halved, it is desirable to reduce not only the main information amount but also the sub information amount by half or less. In the present embodiment, in order to reduce the amount of sub information in B mode to half that in A mode, the value of sub information is shared between two blocks that are temporally adjacent to each other, thereby reducing the amount of sub information. Has achieved. That is, since the amount of sub information in A mode is basically equal to the number of block floating bands, 52 /
Although it is 11.6 ms, in the B mode, since the time axis direction of the block floating band is expanded, it becomes 52 pieces / 23.2 ms, and comparing the sub information amounts in the same time, it is compared with the A mode. It is half the amount.

【0085】図19、図20、図21は、Bモードにお
けるブロックフローティングバンド分割の一具体例を示
している。
FIGS. 19, 20, and 21 show specific examples of block floating band division in the B mode.

【0086】図19は、時間的に隣接する2つのブロッ
クの直交変換ブロックサイズが共にロングモードの場合
を示しており、実線で囲まれている領域が直交変換ブロ
ック、斜線で表示されている領域が1つのブロックフロ
ーティングバンドを表している。即ち、このブロックフ
ローティングバンドは、図17におけるAモードのフロ
ックフローティングバンドの時間軸方向で隣合う2つの
バンドを1つにまとめており、周波数軸方向のバンド分
割は図17と全く同じである。
FIG. 19 shows a case where the orthogonal transform block sizes of two blocks temporally adjacent to each other are both in the long mode, and the region surrounded by the solid line is the orthogonal transform block and the region shown by diagonal lines. Indicates one block floating band. That is, this block floating band has two bands adjacent to each other in the time axis direction of the A mode Flock floating band in FIG. 17, and the band division in the frequency axis direction is exactly the same as that in FIG.

【0087】図20は、時間的に隣接する2つのブロッ
クの直交変換ブロックサイズが共にショートモードの場
合を示しており、図19と同様に、実線で囲まれている
領域が直交変換ブロック、斜線で表示されている領域が
1つのブロックフローティングバンドを表している。即
ち、このブロックフローティングバンドは、図18にお
けるAモードのブロックフローティングバンドの時間軸
方向で隣合う2つのバンドを1つにまとめており、周波
数軸方向のバンド分割は図18と全く同じである。
FIG. 20 shows the case where the orthogonal transform block sizes of two blocks that are temporally adjacent are both in the short mode. As in FIG. 19, the region surrounded by the solid line is the orthogonal transform block and the diagonal line. The area indicated by represents one block floating band. That is, this block floating band is a combination of two adjacent bands in the time axis direction of the A mode block floating band in FIG. 18, and the band division in the frequency axis direction is exactly the same as in FIG.

【0088】図21は、時間的に隣接する2つのブロッ
クの直交変換ブロックサイズが異なり、即ちショートモ
ードとロングモードの組合せである場合を示しており、
同様に実線で囲まれている領域が直交変換ブロック、斜
線で表示されている領域が1つのブロックフローティン
グバンドを表している。直交変換ブロックサイズがショ
ートモードであるブロック(図21における0〜11.
6msの中域と11.6〜23.2msの低域及び高
域)については、図20で示したような2つのブロック
の直交変換ブロックサイズが共にショートモードの場合
と同じである。即ち、図18におけるAモードのブロッ
クフローティングバンドの時間軸方向で隣合う2つのバ
ンドを1つにまとめており、周波数軸方向のバンド分割
は図18と全く同じである。逆に、直交変換ブロックサ
イズがロングモードであるブロック(図21における0
〜11.6msの低域及び高域と11.6〜23.2m
sの中域)については、時間軸方向でバンドをまとめる
ことができないので、例外的に周波数軸方向で隣合う2
バンドを1つにまとめており、時間軸方向のバンド分割
は図17と全く同じである。
FIG. 21 shows a case where two blocks that are temporally adjacent have different orthogonal transform block sizes, that is, a combination of a short mode and a long mode.
Similarly, a region surrounded by a solid line represents an orthogonal transform block, and a region shaded by a diagonal line represents one block floating band. A block in which the orthogonal transform block size is the short mode (0-11.
For the 6 ms middle band and the low and high bands of 11.6 to 23.2 ms), the orthogonal transform block sizes of the two blocks as shown in FIG. 20 are the same as those in the short mode. That is, two adjacent bands in the time axis direction of the block floating band of the A mode in FIG. 18 are combined into one, and the band division in the frequency axis direction is exactly the same as in FIG. On the contrary, a block whose orthogonal transform block size is the long mode (0 in FIG. 21).
~ 11.6ms low and high range and 11.6 ~ 23.2m
In the middle range of s), the bands cannot be put together in the time axis direction, so that the two adjacent bands in the frequency axis direction are exceptional.
The bands are combined into one, and the band division in the time axis direction is exactly the same as that in FIG.

【0089】このように、Bモードにおいてはサブ情報
の数をAモードに比べて半減させるために、時間軸方向
あるいは周波数軸方向で隣合うブロックフローティング
バンドを共通化することにより、結果的にビットレート
の減少に伴うメイン情報の極端な減少を防ぎ、符号化効
率を向上させている。
As described above, in order to reduce the number of sub-information in the B mode to half that in the A mode, the adjacent block floating bands in the time axis direction or the frequency axis direction are made common, resulting in bit The coding efficiency is improved by preventing the extreme decrease of the main information due to the decrease of the rate.

【0090】ここで、図22はBモードの場合の適応ビ
ット割当符号化回路の一具体例を示しており、端子40
1には直交変換ブロックサイズ情報、端子402には該
2ブロック分のスペクトルデータ(MDCT係数)がそ
れぞれ与えられている。
FIG. 22 shows a specific example of the adaptive bit allocation encoding circuit in the B mode, and the terminal 40
Orthogonal transform block size information is given to 1, and spectrum data (MDCT coefficients) for the two blocks is given to the terminal 402.

【0091】Aモード用のブロックフローティングバン
ド分割で各バンド毎に設定されたスケールファクタA4
03は、スケールファクタ再設定回路405において、
上述したように共通化すべき2つのフロックフローティ
ングバンドの値がまとめられ、Bモード用のスケールフ
ァクタBが再設定される。通常は、2つのスケールファ
クタAの内でより大きいスケールファクタAを選択し、
共通のスケールファクタAとする。同様に、Aモード用
のブロックフローティングバンド分割で各バンド毎に設
定されたワードレングスA404は、ワードレングス再
設定回路406において、Bモード用のワードレングス
Bが再設定される。ワードレングスの共通化の際には、
例えば2つのワードレングスAの内でより大きいワード
レングスAが選択される。さらに、2つのワードレング
スAの平均値等を用いても良い。上記スケールファクタ
A及びワードレングスAは、それぞれ2ブロック分(2
3.2ms)の情報を一単位にして上記スケールファク
タ再設定回路405及び上記ワードレングス再設定回路
406に送られている。上記ワードレングス再設定回路
406において再設定されたワードレングスは、総ビッ
ト数の補正回路407において、再設定により生じた総
ビット数の誤差の補正が行われる。再設定されたスケー
ルファクタB及びワードレングスBは、共に量子化器4
08及び符号化器409に送られ、スペクトルデータの
量子化の際に用いられる。上記量子化器408及び符号
化器409により量子化され、符号化されたスペクトル
データは、符号化データBとして端子410から取り出
される。
Scale factor A4 set for each band by block floating band division for A mode
03 in the scale factor reset circuit 405,
As described above, the values of the two floc floating bands to be made common are put together, and the scale factor B for B mode is reset. Usually, a larger scale factor A is selected from the two scale factors A,
A common scale factor A is used. Similarly, the word length A 404 set for each band in the block floating band division for A mode is reset to the word length B for B mode in the word length reset circuit 406. When sharing word lengths,
For example, of the two word lengths A, the larger word length A is selected. Furthermore, the average value of the two word lengths A or the like may be used. The scale factor A and the word length A are each 2 blocks (2
Information of 3.2 ms) is sent as one unit to the scale factor resetting circuit 405 and the word length resetting circuit 406. The word length reset by the word length reset circuit 406 is corrected by the total bit number correction circuit 407 for the error of the total bit number caused by the reset. The scale factor B and the word length B which are reset are both the quantizer 4
08 and the encoder 409, and is used when the spectrum data is quantized. The spectrum data that has been quantized by the quantizer 408 and the encoder 409 and coded is taken out from the terminal 410 as coded data B.

【0092】尚、上述の実施例は本発明の一例であり、
本発明の要旨を逸脱しない範囲でその他の様々な構成が
取り得ることは勿論である。
The above embodiment is an example of the present invention.
It goes without saying that various other configurations can be adopted without departing from the scope of the present invention.

【0093】[0093]

【発明の効果】以上の説明からも明らかなように、本発
明に係るオーディオ信号のスペクトル表示装置は、符号
化された入力オーディオ信号の時間ブロックを選択する
時間窓掛け手段と、上記窓掛け手段により窓掛けされた
信号の時間ブロックの上記入力信号から表示用のスペク
トル特性を算出するスペクトル算出手段と、上記スペク
トル算出手段により算出されたスペクトル特性を具体的
な表示信号に変換形成するための表示信号形成手段とを
備えて成ることにより、従来のスペクトル信号より精確
で高分解能なスペクトル信号を、より簡単な構成で表示
することができる。
As is apparent from the above description, in the audio signal spectrum display apparatus according to the present invention, the time windowing means for selecting the time block of the encoded input audio signal and the windowing means. Spectrum calculation means for calculating spectrum characteristics for display from the input signal of the time block of the signal windowed by, and display for converting and forming the spectrum characteristics calculated by the spectrum calculation means into a specific display signal. By including the signal forming means, it is possible to display a spectrum signal with higher precision and higher resolution than the conventional spectrum signal with a simpler configuration.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明に係るオーディオ信号のスペクトル表示
装置の基本概念を説明するための図である。
FIG. 1 is a diagram for explaining a basic concept of a spectrum display device for audio signals according to the present invention.

【図2】本発明に係るオーディオ信号のスペクトル表示
装置を使用した一例を示す図である。
FIG. 2 is a diagram showing an example of using the spectrum display device for audio signals according to the present invention.

【図3】本発明に係るオーディオ信号のスペクトル表示
装置を使用した応用例を示す図である。
FIG. 3 is a diagram showing an application example using a spectrum display device for audio signals according to the present invention.

【図4】本発明の第1の実施例の概略的な構成を示す図
である。
FIG. 4 is a diagram showing a schematic configuration of a first embodiment of the present invention.

【図5】一般的なオーディオ信号の符号化及び復号化を
示す図である。
FIG. 5 is a diagram showing encoding and decoding of a general audio signal.

【図6】本発明に係るオーディオ信号の符号化手段の概
略的な構成を示す図である。
FIG. 6 is a diagram showing a schematic configuration of an audio signal encoding means according to the present invention.

【図7】本発明の第2の実施例の概略的な構成を示す図
である。
FIG. 7 is a diagram showing a schematic configuration of a second embodiment of the present invention.

【図8】高能率圧縮符号化回路の一具体例を示すブロッ
ク回路図である。
FIG. 8 is a block circuit diagram showing a specific example of a high-efficiency compression encoding circuit.

【図9】ビット圧縮の際の直交変換ブロックの構造を表
す図である。
FIG. 9 is a diagram showing the structure of an orthogonal transform block at the time of bit compression.

【図10】ビット配分算出回路の一具体例を示すブロッ
ク回路図である。
FIG. 10 is a block circuit diagram showing a specific example of a bit allocation calculation circuit.

【図11】各臨界帯域及びブロックフローティングを考
慮して分割された帯域のスペクトルを示す図である。
FIG. 11 is a diagram showing spectra of bands divided in consideration of each critical band and block floating.

【図12】マスキングスペクトルを示す図である。FIG. 12 is a diagram showing a masking spectrum.

【図13】最小可聴カーブ、マスキングスペクトルを合
成した図である。
FIG. 13 is a diagram in which a minimum audible curve and a masking spectrum are combined.

【図14】適応ビット割当回路の一具体例を示すブロッ
ク回路図である。
FIG. 14 is a block circuit diagram showing a specific example of an adaptive bit allocation circuit.

【図15】適応ビット割当回路によりビット割当された
信号レベルと量子化雑音の状態を示す図である。
FIG. 15 is a diagram showing a signal level and quantization noise state in which bits are assigned by an adaptive bit assignment circuit.

【図16】適応ビット割当回路によりビット割当された
信号レベルと量子化雑音の第2の状態を示す図である。
FIG. 16 is a diagram showing a second state of the signal level and quantization noise bit-allocated by the adaptive bit allocation circuit.

【図17】Aモードにおけるブロックフローティングバ
ンド分割による周波数と時間とを具体的に示す図であ
る。
FIG. 17 is a diagram specifically showing a frequency and time by block floating band division in A mode.

【図18】Aモードにおけるブロックフローティングバ
ンド分割による周波数と時間とを具体的に示す第2の図
である。
FIG. 18 is a second diagram specifically showing the frequency and time by block floating band division in A mode.

【図19】Bモードにおけるブロックフローティングバ
ンド分割による周波数と時間とを具体的に示す図であ
る。
FIG. 19 is a diagram specifically showing frequency and time by block floating band division in B mode.

【図20】Bモードにおけるブロックフローティングバ
ンド分割による周波数と時間とを具体的に示す第2の図
である。
FIG. 20 is a second diagram specifically showing the frequency and time by block floating band division in B mode.

【図21】Bモードにおけるブロックフローティングバ
ンド分割による周波数と時間とを具体的に示す第3の図
である。
FIG. 21 is a third diagram specifically showing frequency and time by block floating band division in B mode.

【図22】Bモードの適応ビット割当符号化回路の一具
体例を示すブロック回路図である。
FIG. 22 is a block circuit diagram showing a specific example of a B-mode adaptive bit allocation encoding circuit.

【符号の説明】[Explanation of symbols]

11・・・・・・・・・・符号化オーディオ信号入力端
子 12・・・・・・・・・・時間窓掛け手段 13・・・・・・・・・・スペクトル算出手段 14・・・・・・・・・・表示信号形成手段 15・・・・・・・・・・スペクトル表示手段 16・・・・・・・・・・テレビ装置 17、18・・・・・・・接続部 19・・・・・・・・・・表示部 30・・・・・・・・・・オーディオ装置 31・・・・・・・・・・テレビ装置 42・・・・・・・・・・符号化データ抽出手段 43・・・・・・・・・・時間軸処理手段 52・・・・・・・・・・オーディオ信号符号化手段 54・・・・・・・・・・オーディオ信号復号化手段
11: coded audio signal input terminal 12: time windowing means 13: spectrum calculation means 14: ........ Display signal forming means 15 ........ Spectrum display means 16 .................. TV device 17, 18, .. 19 Display unit 30 Audio device 31 Television device 42 Encoded data extraction means 43 ... Time axis processing means 52 ... Audio signal coding means 54 ... Audio signal decoding Means of conversion

Claims (10)

【特許請求の範囲】[Claims] 【請求項1】 オーディオ信号の周波数のスペクトルを
表示するスペクトル表示装置において、 符号化された入力オーディオ信号の時間ブロックを選択
する時間窓掛け手段と、 上記窓掛け手段により窓掛けされた信号の時間ブロック
の上記入力信号から表示用のスペクトル特性を算出する
スペクトル算出手段と、 上記スペクトル算出手段により算出されたスペクトル特
性を具体的な表示信号に変換形成するための表示信号形
成手段とを備えて成ることを特徴とするオーディオ信号
のスペクトル表示装置。
1. A spectrum display device for displaying a frequency spectrum of an audio signal, comprising: time windowing means for selecting a time block of an encoded input audio signal; and time of a signal windowed by the windowing means. The block includes spectrum calculating means for calculating a display spectrum characteristic from the input signal of the block, and display signal forming means for converting and forming the spectrum characteristic calculated by the spectrum calculating means into a specific display signal. A spectrum display device for audio signals.
【請求項2】 上記表示信号形成手段により出力される
表示信号を表示する表示装置を備えることを特徴とする
請求項1記載のオーディオ信号のスペクトル表示装置。
2. A spectrum display device for an audio signal according to claim 1, further comprising a display device for displaying a display signal output by said display signal forming means.
【請求項3】 上記表示装置はLCD表示装置から成る
ことを特徴とする請求項2記載のオーディオ信号のスペ
クトル表示装置。
3. A spectrum display device for audio signals according to claim 2, wherein said display device comprises an LCD display device.
【請求項4】 上記表示装置はテレビジョン装置から成
ることを特徴とする請求項2記載のオーディオ信号のス
ペクトル表示装置。
4. A spectrum display device for audio signals according to claim 2, wherein said display device comprises a television device.
【請求項5】 外部の表示装置に接続される機器を使用
するための出力端子を備えることを特徴とする請求項1
記載のオーディオ信号のスペクトル表示装置。
5. An output terminal for using a device connected to an external display device is provided.
A spectrum display device for an audio signal according to claim 1.
【請求項6】 上記符号化された入力オーディオ信号は
2チャンネルのステレオオーディオ信号から成ることを
特徴とする請求項1、2、3、4又は5記載のオーディ
オ信号のスペクトル表示装置。
6. A spectrum display device for audio signals according to claim 1, wherein the encoded input audio signal comprises a two-channel stereo audio signal.
【請求項7】 上記符号化された入力オーディオ信号
は、時間及び周波数の領域内の信号のエネルギに相当す
る係数を備えることを特徴とする請求項1、2、3、
4、5又は6記載のオーディオ信号のスペクトル表示装
置。
7. The coded input audio signal comprises coefficients corresponding to the energy of the signal in the time and frequency domain.
7. A spectrum display device for audio signals according to 4, 5, or 6.
【請求項8】 上記係数は時間と周波数とにより均一に
分割される時間−周波数係数であることを特徴とする請
求項7記載のオーディオ信号のスペクトル表示装置。
8. A spectrum display device for audio signals according to claim 7, wherein said coefficient is a time-frequency coefficient uniformly divided by time and frequency.
【請求項9】 上記係数は時間と周波数とにより不均一
に分割される時間−周波数係数であることを特徴とする
請求項7記載のオーディオ信号のスペクトル表示装置。
9. The apparatus of claim 7, wherein the coefficient is a time-frequency coefficient which is non-uniformly divided by time and frequency.
【請求項10】 上記時間窓掛け手段によって使用され
る時間ブロックは、上記符号化された入力オーディオ信
号の時間分割であることを特徴とする請求項1記載のオ
ーディオ信号のスペクトル表示装置。
10. A spectrum display device for audio signals according to claim 1, wherein the time block used by the time windowing means is a time division of the encoded input audio signal.
JP11325893A 1993-05-14 1993-05-14 Device for displaying spectrum of audio signal Withdrawn JPH06324093A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11325893A JPH06324093A (en) 1993-05-14 1993-05-14 Device for displaying spectrum of audio signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11325893A JPH06324093A (en) 1993-05-14 1993-05-14 Device for displaying spectrum of audio signal

Publications (1)

Publication Number Publication Date
JPH06324093A true JPH06324093A (en) 1994-11-25

Family

ID=14607599

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11325893A Withdrawn JPH06324093A (en) 1993-05-14 1993-05-14 Device for displaying spectrum of audio signal

Country Status (1)

Country Link
JP (1) JPH06324093A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008536192A (en) * 2005-04-13 2008-09-04 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション Economical volume measurement of coded audio
JP2010118797A (en) * 2008-11-11 2010-05-27 Anritsu Corp Signal analysis device
JP2010119065A (en) * 2008-11-14 2010-05-27 Anritsu Corp Signal analysis device
JP2011529199A (en) * 2008-07-24 2011-12-01 ディーティーエス・インコーポレイテッド Audio scale factor compression by two-dimensional transformation

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008536192A (en) * 2005-04-13 2008-09-04 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション Economical volume measurement of coded audio
US8239050B2 (en) 2005-04-13 2012-08-07 Dolby Laboratories Licensing Corporation Economical loudness measurement of coded audio
JP2011529199A (en) * 2008-07-24 2011-12-01 ディーティーエス・インコーポレイテッド Audio scale factor compression by two-dimensional transformation
JP2010118797A (en) * 2008-11-11 2010-05-27 Anritsu Corp Signal analysis device
JP2010119065A (en) * 2008-11-14 2010-05-27 Anritsu Corp Signal analysis device

Similar Documents

Publication Publication Date Title
US5553193A (en) Bit allocation method and device for digital audio signals using aural characteristics and signal intensities
US5301205A (en) Apparatus and method for data compression using signal-weighted quantizing bit allocation
US5664056A (en) Digital encoder with dynamic quantization bit allocation
US5774844A (en) Methods and apparatus for quantizing, encoding and decoding and recording media therefor
US5583967A (en) Apparatus for compressing a digital input signal with signal spectrum-dependent and noise spectrum-dependent quantizing bit allocation
US6104321A (en) Efficient encoding method, efficient code decoding method, efficient code encoding apparatus, efficient code decoding apparatus, efficient encoding/decoding system, and recording media
JPH07160292A (en) Multilayered coding device
KR100512208B1 (en) Digital signal processing method, digital signal processing apparatus, digital signal recording method, digital signal recording apparatus, recording medium, digital signal transmission method and digital signal transmission apparatus
JPH0846517A (en) High efficiency coding and decoding system
JPH06324093A (en) Device for displaying spectrum of audio signal
JP3879250B2 (en) Encoding method, decoding method, encoding device, decoding device, digital signal recording method, digital signal recording device, recording medium, digital signal transmission method, and digital signal transmission device
JPH08123488A (en) High-efficiency encoding method, high-efficiency code recording method, high-efficiency code transmitting method, high-efficiency encoding device, and high-efficiency code decoding method
JP3291948B2 (en) High-efficiency encoding method and apparatus, and transmission medium
JP3879249B2 (en) Encoding method, decoding method, encoding device, decoding device, digital signal recording method, digital signal recording device, recording medium, digital signal transmission method, and digital signal transmission device
JP3227948B2 (en) Decryption device
JP3227945B2 (en) Encoding device
JP3134384B2 (en) Encoding device and method
JPH07181996A (en) Information processing method, information processor and media
JPH07161142A (en) Recording method, recording medium and reproducing method
JPH11272294A (en) Encoding method, decoding method, encoder, decoder, digital signal recording method and device, storage medium, and digital signal transmitting method and device
JPH0537396A (en) High efficient encoding method and device for digital data
JPH04302537A (en) High-efficiency encoding device for digital signal
JPH0591062A (en) Audio signal processing method

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20000801