JPH06318876A - Method and device for signal conversion and recording medium - Google Patents

Method and device for signal conversion and recording medium

Info

Publication number
JPH06318876A
JPH06318876A JP12786793A JP12786793A JPH06318876A JP H06318876 A JPH06318876 A JP H06318876A JP 12786793 A JP12786793 A JP 12786793A JP 12786793 A JP12786793 A JP 12786793A JP H06318876 A JPH06318876 A JP H06318876A
Authority
JP
Japan
Prior art keywords
frequency
frequency component
attribute
difference
signal conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP12786793A
Other languages
Japanese (ja)
Inventor
Kenzo Akagiri
健三 赤桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP12786793A priority Critical patent/JPH06318876A/en
Priority to TW083103252A priority patent/TW232116B/en
Priority to PCT/JP1994/000627 priority patent/WO1994024666A1/en
Priority to EP94912684A priority patent/EP0649137A4/en
Priority to US08/351,386 priority patent/US5737717A/en
Priority to KR1019940704551A priority patent/KR100310547B1/en
Publication of JPH06318876A publication Critical patent/JPH06318876A/en
Priority to KR1019947004551A priority patent/KR950702059A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To attain the conversion of a voice and an acoustic signal significant with respect to sound quality based on a human audible sense by controlling a harmonious relation between frequency components within a critical band backed up in an audible sense. CONSTITUTION:Data processed by respective MDCT circuits 5a-5d are fed to a frequency moving peak detection circuit 12, a dissonance frequency detection circuit 11 and a masking curve detection circuit 16, from which a moving peak value curve, a dissonance frequency region being frequencies exceeding a threshold level having a difference of the moving peak value, and a masking threshold curve are obtained. A mask circuit 10 uses an audible effect to revise no frequency component in an unnecessary frequency band. The circuit 10 provides an output of component information from which an effective operation to improve the audible sound quality is obtained among frequency components having a dissonance relation with the local peak component. Then a frequency component revision circuit 6 revises the magnitude of a frequency component being an object based on the information.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、例えばディジタルオー
ディオ機器に適用され、時間信号である入力オーディオ
信号に対して特に聴覚の性質を用いて音質を変更する
(すなわち時間信号情報の特性を変換する)信号変換方
法及び装置、並びにこれら方法又は装置により時間信号
情報の特性が変換された情報が記録される記録媒体に関
するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention is applied to, for example, digital audio equipment, and changes the sound quality of an input audio signal, which is a time signal, by using the auditory property (that is, the characteristic of time signal information is converted). The present invention relates to a signal conversion method and device, and a recording medium on which information in which the characteristics of time signal information are converted by the method or device is recorded.

【0002】[0002]

【従来の技術】従来より、音響信号情報の音質を変化さ
せる手法としては、例えば、フィルタ処理によって周波
数特性を変更する方式や、高次高調波を発生させる方
式、若しくはいわゆるコンプレサによってダイナミック
レンジを変更するなどの方式が用いられている。
2. Description of the Related Art Conventionally, as a method of changing the sound quality of acoustic signal information, for example, a method of changing frequency characteristics by filtering, a method of generating higher harmonics, or a so-called compressor is used to change the dynamic range. The method of doing is used.

【0003】[0003]

【発明が解決しようとする課題】しかし、上記フィルタ
を用いる方式の場合は、例えば中域を増強することでプ
レゼンスを上げるなどのフィルタの使用の仕方を変える
ことで音質を変化させるものであり、高次高調波を発生
させる方式の場合は、聞きやすい音を得るというよりも
効果音的な使用に供されるものである。また、上記コン
プレサによってダイナミックレンジを変更する方式は、
大きい音が耳を痛めたり小さい音が周囲の雑音にマスク
されないようにするというものである。これらの方式で
は、瞬時瞬時で変わってゆく音響信号情報の変化に対応
して聴覚的に心地好く聞こえる音にする最適なコントロ
ールは困難である。
However, in the case of the method using the above-mentioned filter, the sound quality is changed by changing the way of using the filter such as increasing the presence by increasing the midrange. In the case of the method of generating high-order harmonics, it is used for effective sound rather than obtaining a sound that is easy to hear. In addition, the method of changing the dynamic range by the above compressor is
A loud sound will hurt your ears and a quiet sound will not be masked by ambient noise. With these methods, it is difficult to optimally control the sound so that the sound can be heard audibly comfortably in response to a change in the acoustic signal information that changes instantaneously.

【0004】そこで、本発明は、上述のような実情に鑑
みて提案されたものであり、人間の聴覚に照らして音質
に関して意味のある音声及び音響信号の変換が可能な信
号変換方法及び装置、並びに記録媒体を提供することを
目的とするものである。
Therefore, the present invention has been proposed in view of the above situation, and a signal conversion method and apparatus capable of converting a voice signal and an acoustic signal that are significant in terms of sound quality in the light of human hearing. Another object is to provide a recording medium.

【0005】すなわち、本発明が解決しようとする課題
は、音響信号情報を聴覚的な原理を用いて瞬時瞬時に人
間にとって音質的に高品質に心地好く聞こえる音を作り
出す手法を与えることである。また、本発明の別の課題
は、既にディジタル化されて量子化雑音が付加されてし
まった音響信号情報からこの量子化雑音の聴覚的な影響
を減ずることにより、品質の向上を図ることである。ま
た、本発明の別の目的は、既にディジタル化されて量子
化雑音が付加されてしまったオーディオ信号情報からこ
の量子化雑音の聴覚的な影響を減じた後、本件出願人
が、先に、いわゆるコンパクトディスクのようなオーデ
ィオ機器の音質を向上させる技術として提案しているい
わゆる等ラウドネス特性やマスキング特性に合うように
量子化雑音のスペクトルを変更することによって聴感上
の雑音レベルを低減させる技術(以後この技術を例えば
スーパービットマッピング:Super Bit Mapping技術と呼
ぶことにする)、すなわち例えば特開平2−20812
号公報、特開平2−185552号公報、特開平2−1
85556号公報等に開示した技術を用いて、16ビッ
トの語長を持つコンパクトディスクに記録するとき、聴
覚的な処理によって音質を向上させたデータを作ること
にある。当該スーパービットマッピング技術は、16ビ
ットを越える語長を有するディジタル信号を16ビット
長を有するコンパクトディスクの為に再量子化する場
合、音質向上を図ることができる。さらに、本発明の一
つの課題は、既に量子化雑音が付加されてしまったオー
ディオ信号情報について、聴覚的に音質を等価的に16
ビット以上に一度向上させ、再び16ビットに再量子化
する際、聴覚的に重要な周波数帯域のS/Nを16ビッ
ト以上に保ったまま16ビットとすることで、音質の向
上を図ることである。
That is, the problem to be solved by the present invention is to provide a method for instantaneously and instantaneously producing a sound which is pleasant to the human being in a high quality sound quality by using an acoustic principle. . Another object of the present invention is to improve the quality by reducing the auditory influence of the quantization noise from the acoustic signal information that has already been digitized and added with the quantization noise. . Another object of the present invention is to reduce the auditory influence of this quantization noise from the audio signal information that has already been digitized and added with the quantization noise. A technique for reducing the perceptual noise level by changing the spectrum of the quantization noise so as to match the so-called equal loudness characteristics and masking characteristics, which is proposed as a technology for improving the sound quality of audio equipment such as so-called compact discs ( Hereinafter, this technique will be referred to as, for example, Super Bit Mapping technique), that is, for example, Japanese Patent Laid-Open No. 20812/1990.
Japanese Patent Laid-Open No. 2-185552, Japanese Patent Laid-Open No. 2-1
When the technique disclosed in Japanese Patent No. 85556 is used to record data on a compact disc having a word length of 16 bits, it is intended to produce data with improved sound quality by aural processing. The super bit mapping technique can improve the sound quality when a digital signal having a word length exceeding 16 bits is requantized for a compact disc having a 16 bit length. Further, one of the problems of the present invention is that the audio quality of audio signal information to which quantization noise has already been added is equivalently 16
By improving once more than a bit and then requantizing it to 16 bits again, by improving the sound quality by keeping the S / N of the frequency band that is acoustically important to 16 bits or more, it is possible to improve the sound quality. is there.

【0006】[0006]

【課題を解決するための手段】本発明の信号変換方法及
び装置は、上述の目的を達成するために提案されたもの
であり、音響時間信号情報から得られた周波数成分につ
いて、略臨界帯域内の他の周波数成分の内、最小可聴限
レベル又はマスキングスレッショールドレベルを越える
周波数成分との間で属性の大きさの違いを変えることで
上記音響時間信号情報の特性を変換すること、また、略
臨界帯域内の他の周波数成分の内、最小可聴限レベルと
マスキングスレッショールドレベルの大きいほうのレベ
ルを越える周波数成分との間で属性の大きさの違いを変
えることで上記音響時間信号情報の特性を変換するこ
と、さらに、略臨界帯域内の他の周波数成分の内、限定
されたレベル範囲内の周波数成分との間で属性の大きさ
の違いを変えることで上記音響時間信号情報の特性を変
換するようにしたものである。
DISCLOSURE OF THE INVENTION The signal conversion method and apparatus of the present invention have been proposed in order to achieve the above-mentioned object, and a frequency component obtained from acoustic time signal information is within a substantially critical band. Transforming the characteristic of the acoustic temporal signal information by changing the difference in the size of the attribute between the frequency component exceeding the minimum audible level or the masking threshold level among the other frequency components of Among the other frequency components in the substantially critical band, the above-mentioned acoustic time signal information is obtained by changing the difference in attribute size between the minimum audible limit level and the frequency component exceeding the larger masking threshold level. Transforming the characteristics of the above, and changing the size of the attribute between other frequency components within a substantially critical band and frequency components within a limited level range. It is obtained so as to convert the characteristics of the acoustic time signal information.

【0007】ここで、上記特性変換においては、量子化
雑音レベルにより限定されたレベル範囲内の周波数成分
との間で属性の大きさの違いを変えること、上記音響時
間信号情報から得られた複数の周波数成分の少なくとも
一つのローカルピークについて、略臨界帯域内の他の周
波数成分との間で属性の大きさの違いを変えること、略
臨界帯域幅の10%から50%の周波数差を持つ周波数
領域の他の周波数成分との間で属性の大きさの違いを大
きくすること、周波数成分から得られる2箇の移動ピー
ク値の差により周波数成分の属性の大きさの違いを変え
る周波数領域を決定すること、略臨界帯域幅の50%幅
の移動ピーク値から略臨界帯域幅の10%幅の移動ピー
ク値を引いた値が負の周波数領域の周波数成分を小さく
するか削除すること、時間信号情報の短時間エネルギを
保存するように周波数成分の大きさを調整すること、時
間信号情報の短時間エネルギを保存するように少なくと
も一つのローカルピークの周波数成分の大きさを調整す
ること、時間軸上に再合成された時間信号情報をノイズ
シェイプ特性を有する再量子化処理することなどを行
う。また、このとき、ノイズシェイプ特性が最小可聴
限、等ラウドネスもしくはマスキング特性の少なくとも
ひとつに依存していること、前記属性が周波数成分の大
きさであることがある。
Here, in the characteristic conversion, the difference in attribute size between the frequency component within the level range limited by the quantization noise level is changed, and a plurality of values obtained from the acoustic time signal information are changed. The difference in attribute size between at least one local peak of the frequency components of the above and other frequency components within the substantially critical band, and a frequency having a frequency difference of 10% to 50% of the substantially critical bandwidth. Increase the difference in the size of the attribute from other frequency components in the region, and determine the frequency region in which the difference in the size of the attribute of the frequency component is changed by the difference between the two moving peak values obtained from the frequency component. That is, the value obtained by subtracting the moving peak value of 10% width of the substantially critical bandwidth from the moving peak value of 50% width of the substantially critical bandwidth reduces or deletes the frequency component in the negative frequency region. Adjusting the magnitude of the frequency component so as to save the short time energy of the time signal information, and adjusting the magnitude of the frequency component of at least one local peak so as to save the short time energy of the time signal information , Re-quantizing the re-synthesized time signal information on the time axis with a noise shape characteristic. At this time, the noise shape characteristic may depend on at least one of the minimum audibility limit, equal loudness and masking characteristic, and the attribute may be the magnitude of the frequency component.

【0008】すなわち、本発明の信号変換方法及び装置
は、入力音響時間信号をフィルタ処理若しくは直交変換
を用いることにより周波数成分を得る。次にこれらの周
波数成分の隣接した成分毎の移動ピーク値を、臨界帯域
に関係した2つの異なる周波数幅で得て、この2種類の
移動ピーク値の差が生じる周波数帯域の周波数成分の大
きさを小さくすることにより、ローカルピーク周波数成
分と他の周波数成分との間の不協和度を低減させる。入
力音響時間信号を周波数軸上に展開するにあたっては、
フィルタなどにより複数の周波数帯域の時間軸上成分を
得た後、直交変換等によるブロック化周波数分析手法を
用いるか、いわゆるQMF(QuadratureMirror Filter)
や、CQF(Conjugate Quadrature Filter) などの帯域
分割フィルタをツリー構造に従属接続することにより、
低域から高域にかけて、徐々に周波数分解能が低下し、
逆に時間分解能が向上する帯域分割を行う。
That is, the signal conversion method and apparatus of the present invention obtain frequency components by filtering the input acoustic time signal or using orthogonal transformation. Next, the moving peak value for each adjacent component of these frequency components is obtained with two different frequency widths related to the critical band, and the magnitude of the frequency component of the frequency band in which the difference between these two types of moving peak values occurs. By reducing, the degree of dissonance between the local peak frequency component and other frequency components is reduced. In developing the input acoustic time signal on the frequency axis,
After obtaining the components on the time axis of multiple frequency bands with a filter, etc., use a blocked frequency analysis method such as orthogonal transformation, or use so-called QMF (Quadrature Mirror Filter).
By connecting band division filters such as CQF (Conjugate Quadrature Filter) in a tree structure,
The frequency resolution gradually decreases from the low range to the high range,
On the contrary, band division is performed to improve time resolution.

【0009】この時、低域の方が高域よりも長い時間の
ブロックでブロック化して直交変換若しくは時間軸上複
数サンプルのピーク値を取るようにしてもよい。ブロッ
クの周波数帯域幅及び時間幅は聴覚的に最適になるよう
に臨界帯域幅を充分満足する周波数分解能を与えるよう
にする。それぞれのブロックにおいて、分析により得ら
れているスペクトルは、その大きさと周波数により、マ
スキングスレッショールド(マスキングのしきい値)以
上か否かが判定され、マスキングスレッショールド以下
の場合には強さ,位相などの属性が変更されないように
する。このことは最小可聴限についても同様であり、最
小可聴限を下回る周波数成分については、たとえ移動ピ
ーク値の差がゼロではなくても変更しないようにする。
At this time, the low frequency band may be divided into blocks having a longer time than the high frequency band, and orthogonal transformation may be performed or peak values of a plurality of samples on the time axis may be taken. The frequency bandwidth and time width of the block are designed to give a frequency resolution sufficiently satisfying the critical bandwidth so as to be acoustically optimal. In each block, it is judged whether the spectrum obtained by the analysis is above the masking threshold (masking threshold) or not based on its magnitude and frequency, and if it is below the masking threshold, the strength is determined. , Make sure that attributes such as phase are not changed. This also applies to the minimum audible limit, and frequency components below the minimum audible limit are not changed even if the difference between the moving peak values is not zero.

【0010】さらには、既に付加されてしまった量子化
雑音のレベルが同定もしくは予想し得る場合には、この
レベルの周波数成分については他の成分とは異なる処理
を行うことは、付加済みの量子化雑音を効果的に除去す
る上で有効である。例えば他の成分よりも大きな減衰率
を与えるか、完全に除去してしまうことは有効である。
更に、以上のように処理した音響信号情報を前記スーパ
ービットマッピング処理することによりビット長を減ず
ることは、限られた語長で記録再生伝送等を行う場合、
聴感的な音質の劣化をできるだけ防ぐ上で有効である。
以上述べた様に本発明は聴覚的な方法で音響信号情報の
周波数成分をコントロールすることにより上述の課題を
解決する。
Furthermore, when the level of quantization noise that has already been added can be identified or predicted, it is not possible to perform processing different from other components on the frequency component of this level. It is effective in effectively removing the digitization noise. For example, it is effective to give a larger attenuation rate than other components or completely remove it.
Further, reducing the bit length by performing the super-bit mapping process on the acoustic signal information processed as described above means that when recording / reproducing transmission is performed with a limited word length,
This is effective in preventing auditory deterioration of sound quality as much as possible.
As described above, the present invention solves the above-mentioned problems by controlling the frequency component of acoustic signal information by an auditory method.

【0011】また、本発明の記録媒体は、上記信号変換
方法又は装置により処理されて得られた圧縮データが記
録されてなるものである。
Further, the recording medium of the present invention is one in which compressed data obtained by being processed by the above-mentioned signal conversion method or apparatus is recorded.

【0012】[0012]

【作用】本発明によれば、聴覚的に裏付けのある臨界帯
域内の周波数成分間の調和関係をコントロールすること
で、音声及び音響信号の音質を人間にとって有益なよう
に調整することができる。また、マスキングスレッショ
ールド及び最小可聴限以下の周波数成分については変更
を加えないようにすることは、音質的に無関係な不必要
な処理をできるだけ行わず、接続歪みなど余計な副作用
を防ぐ上で有効である。さらに、コンパクトディスクに
記録されるディジタルサンプルデータが16ビットの語
長の分解能しかないにもかかわらず、聴覚的な周波数成
分の変更とスーパービットマッピング処理を組み合わせ
て16ビット音響信号情報を作りだしコンパクトディス
クなどに記録することは、既に量子化雑音が付加された
音響信号情報及び、聴覚的に望ましくない周波数成分を
含む音響信号情報をコンパクトディスク、ディジタルオ
ーディオテープ等に記録する上で有効である。
According to the present invention, by controlling the harmonic relationship between frequency components within the critical band that is acoustically supported, it is possible to adjust the sound quality of voice and sound signals to be beneficial to humans. In addition, masking thresholds and frequency components below the minimum audible limit should not be changed in order to prevent unnecessary side effects such as connection distortion by not performing unnecessary processing that is unrelated to sound quality. It is valid. Further, even though the digital sample data recorded on the compact disc has only a 16-bit word length resolution, 16-bit acoustic signal information is created by combining auditory frequency component change and super bit mapping processing. It is effective to record the acoustic signal information to which the quantization noise has been added and the acoustic signal information including aurally undesired frequency components on a compact disc, a digital audio tape or the like.

【0013】[0013]

【実施例】以下、本発明の実施例について図面を参照し
ながら説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0014】本発明の信号変換方法が適用される本実施
例の信号変換装置は、図1に示すように、音響時間信号
情報を複数の周波数成分に変換する変換手段としての後
述する帯域分割フィルタ2,3,4及びMDCT回路5
a,5b,5c,5dと、当該変換手段から得られた複
数の周波数成分について、略臨界帯域内の他の周波数成
分の内、最小可聴限レベル又はマスキングスレッショー
ルドレベルを越える周波数成分との間で属性の大きさの
違いを変える属性変更手段としての後述する周波数成分
変更回路6及びマスク回路10,周波数移動ピーク検出
回路12,不協和周波数検出回路11,マスキングスレ
ショールドカーブ検出回路16,最小可聴カーブ発生回
路17とを有するものである。
The signal conversion apparatus of this embodiment to which the signal conversion method of the present invention is applied is, as shown in FIG. 1, a band division filter which will be described later as conversion means for converting acoustic time signal information into a plurality of frequency components. 2, 3, 4 and MDCT circuit 5
a, 5b, 5c, 5d and a plurality of frequency components obtained from the converting means, among other frequency components within the substantially critical band, a frequency component exceeding the minimum audible limit level or the masking threshold level. A frequency component changing circuit 6 and a mask circuit 10, which will be described later, as attribute changing means for changing the difference in the size of the attribute between them, a frequency shift peak detecting circuit 12, a dissonance frequency detecting circuit 11, a masking threshold curve detecting circuit 16, And a minimum audible curve generating circuit 17.

【0015】先ず、図1は、本発明に係る信号変換方法
を実現する本実施例の信号変換装置の一実施例の概略構
成を示すブロック回路図である。以下、図1の具体的な
構成について詳細に説明する。
First, FIG. 1 is a block circuit diagram showing a schematic configuration of an embodiment of a signal conversion apparatus of the present embodiment which realizes a signal conversion method according to the present invention. Hereinafter, the specific configuration of FIG. 1 will be described in detail.

【0016】すなわち、本実施例の信号変換装置は、音
声若しくは音響信号情報(音響時間信号情報)等の入力
ディジタル信号を、複数の周波数帯域に分割すると共
に、最低域の隣接した2帯域の帯域幅は同じで、より高
い周波数帯域ではその内の高い周波数帯域ほどバンド幅
を広く選定し、各周波数帯域毎に直交変換を行って、得
られた周波数軸上のスペクトルデータから、周波数領域
の移動ピークカーブと周波数領域のマスキングカーブの
情報を求める。
That is, the signal conversion apparatus of this embodiment divides an input digital signal such as voice or acoustic signal information (acoustic time signal information) into a plurality of frequency bands, and also divides the lowest two adjacent bands. The width is the same, but in the higher frequency band, the bandwidth is selected wider for the higher frequency band, orthogonal transformation is performed for each frequency band, and the frequency domain shifts from the obtained spectrum data on the frequency axis. Obtain information about the peak curve and the masking curve in the frequency domain.

【0017】上記周波数領域の移動ピークカーブの情報
からは、周波数成分間の調和関係から周波数成分を変更
することにより好ましい音質の変化が期待できる周波数
帯域を得る。また、周波数領域のマスキングカーブの情
報からは周波数領域の移動ピークカーブの情報から求ま
った周波数成分を変更することにより好ましい音質の変
化が期待できる周波数帯域のうち、マスキングにより実
質的に音質変化が期待できない周波数領域を求めて、周
波数成分を変化させる周波数帯域から除外する。最小可
聴限を下回る周波数成分についても変更の対象から除外
する。このようにして求められた周波数成分を変化させ
る周波数帯域内の周波数成分の大きさを小さくするか又
は除去する。
From the information of the moving peak curve in the frequency domain, a frequency band in which a preferable change in sound quality can be expected can be obtained by changing the frequency component from the harmonic relationship between the frequency components. Also, from the information of the masking curve in the frequency domain, it is possible to expect a change in the desired sound quality by changing the frequency component obtained from the information of the moving peak curve in the frequency domain. The impossible frequency region is obtained and excluded from the frequency band in which the frequency component is changed. Frequency components below the minimum audible limit are also excluded from changes. The magnitude of the frequency component within the frequency band that changes the frequency component thus obtained is reduced or eliminated.

【0018】次に、周波数成分を逆直交変換して時間信
号情報を得、全帯域を合成フィルタでまとめることで全
帯域時間信号情報を得る。さらに、量子化を行うにあっ
たては、20kHz以下の帯域内の量子化雑音スペクト
ルを聴感的に最適化するスーパービットマッピング処理
を行う。
Next, the frequency components are inversely orthogonally transformed to obtain time signal information, and all bands are combined by a synthesis filter to obtain all band time signal information. Further, in performing the quantization, a super bit mapping process for optimizing the quantized noise spectrum in the band of 20 kHz or less perceptually is performed.

【0019】より詳細に図1において説明すると、入力
端子1には、例えばサンプリング周波数が44.1kH
zの時、0〜22kHzのオーデイオPCM信号が供給
されている。この入力信号は、例えばいわゆる上記CQ
F等の帯域分割フイルタ2により0〜11kHz帯域と
11k〜22kHz帯域とに分割され、0〜11kHz
帯域の信号は同じくCQFフイルタ等の帯域分割フイル
タ3により0〜5.5kHz帯域と5.5k〜11kH
z帯域とに分割される。更に0〜5.5kHz帯域の信
号は同じくCQF等の帯域分割フイルタ4により0〜
2.75kHz帯域と2.75〜5.5kHz帯域とに
分割される。
Referring to FIG. 1 in more detail, the input terminal 1 has, for example, a sampling frequency of 44.1 kHz.
When z, an audio PCM signal of 0 to 22 kHz is supplied. This input signal is, for example, the so-called CQ mentioned above.
It is divided into a band of 0 to 11 kHz and a band of 11 to 22 kHz by a band dividing filter 2 such as F, and 0 to 11 kHz.
Similarly, the band signal is 0 to 5.5 kHz band and 5.5 k to 11 kH by the band division filter 3 such as CQF filter.
and z-band. Further, signals in the 0 to 5.5 kHz band are also set to 0 by the band division filter 4 such as CQF.
It is divided into a 2.75 kHz band and a 2.75 to 5.5 kHz band.

【0020】帯域分割フイルタ2からの11k〜22k
Hz帯域の信号は直交変換回路の一例であるMDCT
(モディファイド離散コサイン変換)回路5aに送ら
れ、帯域分割フイルタ3からの5.5k〜11kHz帯
域の信号はMDCT回路5bに送られ、帯域分割フイル
タ4からの2.75kHz〜5.5kHz帯域の信号は
MDCT回路5cに送られ、帯域分割フイルタ4からの
0kHz〜2.75kHz帯域の信号はMDCT回路5
dに送られることにより、それぞれMDCT処理され
る。もちろん、これら直交変換回路としては、上記MD
CT以外にも高速フーリエ変換(FFT),離散コサイ
ン変換(DCT)などの直交変換を用いることができ
る。
11k to 22k from the band division filter 2
A signal in the Hz band is an MDCT which is an example of an orthogonal transform circuit.
(Modified Discrete Cosine Transform) circuit 5a sends a signal of band 5.5k to 11kHz from band division filter 3 to MDCT circuit 5b and sends signal of band division filter 4 from band 2.75kHz to 5.5kHz. Is sent to the MDCT circuit 5c, and the signal in the band of 0 kHz to 2.75 kHz from the band division filter 4 is sent to the MDCT circuit 5c.
Then, the MDCT processing is performed on each of them. Of course, these orthogonal transform circuits are
Besides CT, orthogonal transform such as fast Fourier transform (FFT) and discrete cosine transform (DCT) can be used.

【0021】ここで、上述したような帯域分割フィルタ
による入力ディジタル信号を複数の周波数帯域に分割す
る手法としては、例えば、上記CQFなどのフィルタを
用いる手法があり、これは、例えば、 Mark J. T. Smit
h and Thomas P. Barnwell,"Exact Reconstruction Tec
hniques for Tree-Structured Subband Coders,"IEEE T
rans. ASSP, Vol ASSP-34 No 3, June 1986, pp. 434-4
41. に述べられている。また、1976 R.E.Crochiere Dig
ital coding of speech in subbands BellSyst.Tech.
J. Vol.55,No.8 1976 には、QMFなどのフィルタを用
いた手法が述べられている。更にICASSP 83,BOSTON Pol
yphase Quadrature filters-A newsubband coding tech
nique Joseph H. Rothweiler には等バンド幅のフィル
タ分割手法が述べられている。
Here, as a method of dividing the input digital signal by the band division filter as described above into a plurality of frequency bands, for example, there is a method of using a filter such as the above CQF, which is, for example, Mark JT Smit.
h and Thomas P. Barnwell, "Exact Reconstruction Tec
hniques for Tree-Structured Subband Coders, "IEEE T
rans. ASSP, Vol ASSP-34 No 3, June 1986, pp. 434-4
41. Also, 1976 REC Crochiere Dig
ital coding of speech in subbands BellSyst.Tech.
J. Vol.55, No.8 1976 describes a method using a filter such as QMF. Furthermore, ICASSP 83, BOSTON Pol
yphase Quadrature filters-A newsubband coding tech
Nique Joseph H. Rothweiler describes a filter partitioning method with equal bandwidth.

【0022】また、上述した直交変換としては、例え
ば、入力オーディオ信号を所定単位時間(フレーム)で
ブロック化し、当該ブロック毎に例えば高速フーリエ変
換(FFT)、コサイン変換(DCT)、モディファイ
ドDCT変換(MDCT)等を行うことで、時間軸を周
波数軸に変換するような直交変換がある。上記MDCT
についてはICASSP 1987Subband/Transform Coding Usin
g Filter Bank DesignsBased on Time Domain Aliasing
Cancellation J.P.Princen A.B.Bradley Univ.of Surr
ey Royal Melbourne Inst.of Tech.に述べられている。
As the above-mentioned orthogonal transform, for example, the input audio signal is divided into blocks in a predetermined unit time (frame), and for example, fast Fourier transform (FFT), cosine transform (DCT), modified DCT transform ( There is an orthogonal transformation in which the time axis is transformed into the frequency axis by performing MDCT) or the like. MDCT above
About ICASSP 1987 Subband / Transform Coding Usin
g Filter Bank DesignsBased on Time Domain Aliasing
Cancellation JPPrincen ABBradley Univ.of Surr
ey Royal Melbourne Inst. of Tech.

【0023】ここで、上記各MDCT回路5a、5b、
5c、5dに供給する各帯域毎のブロックについての標
準的な入力信号に対する具体例を図2に示す。
Here, each of the MDCT circuits 5a, 5b,
FIG. 2 shows a specific example of a standard input signal for blocks for each band supplied to 5c and 5d.

【0024】この図2の具体例において、上述した4つ
のフイルタ出力信号は、各帯域ごとに別々の直交変換ブ
ロックサイズを持ち、それぞれの周波数での臨界帯域幅
を充分満足するような周波数分析を行う。これにより周
波数が高くなるほど周波数分解能は低くなるが、その代
わりに時間分解能が向上する。本実施例では、周波数分
解は臨界帯域をそれぞれ略10分割する程度に選んでい
る。このことにより臨界帯域内の周波数成分の大きさの
コントロールが臨界帯域内周波数をかなり自由に限定し
て行うことができる様にしている。
In the specific example of FIG. 2, the four filter output signals described above have different orthogonal transform block sizes for each band, and frequency analysis is performed so as to sufficiently satisfy the critical bandwidth at each frequency. To do. As a result, the higher the frequency, the lower the frequency resolution, but instead the time resolution improves. In this embodiment, the frequency decomposition is selected so that the critical band is divided into about 10 parts. This makes it possible to control the magnitude of the frequency component within the critical band by limiting the frequency within the critical band quite freely.

【0025】すなわち、本実施例では、0Hzから2.
75kHzまでの帯域は、直交変換の時間ブロックサイ
ズを46.4msecとして、この帯域の最も狭い臨界
帯域幅100Hzの10分の1の概略10Hzの周波数
分解能が得られるようにしている。同様にして、2.7
5kHzから5.5kHz帯域は11.6msecの直
交変換の時間ブロックサイズを用いて40Hzの周波数
分解能を、5.5kHzから11kHz帯域は5.8m
secの直交変換の時間ブロックサイズを用いて80H
zの周波数分解能を、11kHzから22kHz帯域は
2.9msecの直交変換の時間ブロックサイズを用い
て160Hzの周波数分解能を得ている。なお、11k
Hzにおける臨界帯域幅は概略3kHzであるから、更
に直交変換ブロックサイズを半分にして320Hzの周
波数分解能とすることは時間分解能を更に上げるうえで
有効である。表1には臨界帯域の中心周波数と帯域幅を
示している。
That is, in this embodiment, from 0 Hz to 2.
In the band up to 75 kHz, the time block size of orthogonal transformation is set to 46.4 msec so that a frequency resolution of approximately 10 Hz, which is one tenth of the narrowest critical bandwidth of 100 Hz of this band, can be obtained. Similarly, 2.7
The 5 kHz to 5.5 kHz band uses a time block size of orthogonal transformation of 11.6 msec to obtain a frequency resolution of 40 Hz and the 5.5 kHz to 11 kHz band has 5.8 m.
80H using the time block size of the orthogonal transform of sec
As for the frequency resolution of z, the frequency resolution of 160 Hz is obtained by using the time block size of the orthogonal transformation of 2.9 msec in the band from 11 kHz to 22 kHz. In addition, 11k
Since the critical bandwidth in Hz is approximately 3 kHz, it is effective to further halve the orthogonal transform block size to obtain a frequency resolution of 320 Hz in order to further increase the time resolution. Table 1 shows the center frequency and bandwidth of the critical band.

【0026】[0026]

【表1】 [Table 1]

【0027】再び図1に戻って、各MDCT回路5a,
5b,5c,5dにてMDCT処理されて得られた周波
数成分或いはMDCT係数データは、ローカルピーク周
波数成分と不協和の関係を持つ周波数成分の存在する周
波数領域を確定する周波数移動ピーク検出回路12及び
不協和周波数検出回路11と、マスキングスレショール
ドカーブを求めるマスキングスレショールドカーブ検出
回路16に供給される。
Returning to FIG. 1 again, each MDCT circuit 5a,
The frequency component or MDCT coefficient data obtained by MDCT processing at 5b, 5c, and 5d determines the frequency shift peak detection circuit 12 that determines the frequency region where the frequency component having a dissonance relation with the local peak frequency component exists. It is supplied to the dissonance frequency detection circuit 11 and the masking threshold curve detection circuit 16 for obtaining the masking threshold curve.

【0028】ここで、上記周波数移動ピーク検出回路1
2の動作を以下に説明する。図3においては、判り易い
ように、3個の隣接周波数成分に関する移動ピーク値の
取り方を説明している。
Here, the frequency shift peak detection circuit 1 described above is used.
The operation of No. 2 will be described below. In FIG. 3, how to obtain the moving peak value regarding three adjacent frequency components is described for easy understanding.

【0029】先ず、成分s1を中心とした移動ピーク値
は、当該成分s1とその両隣の成分を含めた各成分s
0,s1,s2の中の最大の大きさを持つ成分の大きさ
で移動ピーク値が定義される。次に、成分s2を中心と
した移動ピーク値は、当該成分s2とその両隣の成分を
含めた各成分s1,s2,s3の中の最大の大きさを持
つ成分の大きさで移動ピーク値が定義される。このよう
にして次々にピーク値を求めて行くことにより、移動ピ
ークカーブが得られる。
First, the moving peak value centered on the component s1 is the component s including the component s1 and the components on both sides thereof.
The moving peak value is defined by the size of the component having the maximum size among 0, s1, and s2. Next, the moving peak value centering on the component s2 is the size of the component having the largest size among the components s1, s2, and s3 including the component s2 and the components on both sides thereof, and the moving peak value is Is defined. In this way, a moving peak curve is obtained by successively obtaining peak values.

【0030】図3では判り易いように、周波数成分は全
て同じ帯域幅を持ち、且つ移動ピークを求めるときの周
波数幅も等しくして図示してあるが、本実施例では、図
4に示すように、高域になるに従い、周波数成分の持つ
帯域幅は広がり且つその周波数での臨界帯域幅の10%
若しくは50%幅の周波数幅での移動ピーク値が求めら
れる。なお、図4において、図中BE1〜BE4はそれ
ぞれ帯域を示し、図中曲線P10は臨界帯域幅の10%幅
の移動ピークカーブを、曲線P50は臨界帯域幅の50%
幅の移動ピークカーブを示し、曲線SDは周波数成分分
布を、CBは各周波数における臨界帯域幅を示してい
る。ここでもしもピーク値が重複して定義された周波数
帯域ではピーク値の大きいほうが選ばれる。
For easy understanding in FIG. 3, all the frequency components have the same bandwidth, and the frequency widths for obtaining the moving peaks are also shown to be equal, but in this embodiment, as shown in FIG. In addition, as the frequency becomes higher, the bandwidth of frequency components expands and 10% of the critical bandwidth at that frequency
Alternatively, the moving peak value in the frequency width of 50% width is obtained. In addition, in FIG. 4, BE1 to BE4 in the figure each represent a band, a curve P 10 in the figure represents a moving peak curve having a width of 10% of the critical bandwidth, and a curve P 50 represents 50% of the critical bandwidth.
The moving peak curve of the width is shown, the curve SD shows the frequency component distribution, and CB shows the critical bandwidth at each frequency. Here, in the frequency band in which the peak values are defined overlappingly, the one having the larger peak value is selected.

【0031】なお、上記臨界帯域幅は、協和性、雑音の
大きさの感覚、マスキング特性など人間の聴覚特性を良
く理解できる物理量であり、本発明に関しては協和性に
ついての説明を図5を用いて説明する。図5は2つの周
波数成分の周波数差が、横軸(臨界帯域幅で正規化され
た周波数を示す軸)に示された周波数だけあるとき、こ
の2つの周波数成分がどの程度の協和性もしくは不協和
性を示すかを縦軸に表している。この結果によれば、2
つの周波数成分の周波数差が、臨界帯域幅の10%から
50%までの間(不協和音帯域NHB)では不協和の感
覚が生じ(不協和音レベルNHL)、0%から10%及
び50%から100%の周波数差(協和音帯域HB)で
は協和の感覚が生じる(協和音レベルHL)。なお、こ
の臨界帯域幅は、前記表1のように高域ほど帯域幅が広
くなっている。
The critical bandwidth is a physical quantity that allows human auditory characteristics such as consonance, noise level sensation, and masking characteristics to be well understood. With respect to the present invention, explanation of consonance will be given with reference to FIG. Explain. FIG. 5 shows that when the frequency difference between the two frequency components is only the frequency shown on the horizontal axis (the axis showing the frequency normalized by the critical bandwidth), the degree of reciprocity or incongruity these two frequency components have. The vertical axis indicates whether or not it shows consonance. According to this result, 2
When the frequency difference between the two frequency components is between 10% and 50% of the critical bandwidth (dissonance band NHB), a sense of dissonance occurs (dissonance level NHL), 0% to 10% and 50% to 100%. A sense of consonance occurs at the frequency difference (consonant band HB) (consonant level HL). As shown in Table 1 above, the critical bandwidth has a wider bandwidth as it goes higher.

【0032】次に不協和帯域を検出する具体的手段を図
6を用いて説明する。図1における各MDCT回路5
a,5b,5c,5dにてMDCT処理されて得られた
周波数成分或いはMDCT係数データは、絶対値を取ら
れた後、図6に示す不協和帯域検出手段としての不協和
周波数検出回路11の入力端子41に与えられる。ここ
で、より長い時間幅を持つ低域側特性は、各高域時間に
共通に使用される。
Next, a concrete means for detecting the dissonance band will be described with reference to FIG. Each MDCT circuit 5 in FIG.
The frequency component or MDCT coefficient data obtained by the MDCT processing at a, 5b, 5c, and 5d is taken as an absolute value, and then the dissonance frequency detection circuit 11 shown in FIG. It is given to the input terminal 41. Here, the low-frequency side characteristic having a longer time width is commonly used for each high-frequency time.

【0033】上記入力端子41に与えられた周波数成分
から2つの異なった周波数幅を持った移動ピーク特性が
得られる。すなわち、臨界帯域幅の10%幅の移動ピー
ク値を与える臨界帯域幅の10%幅の移動ピーク検出回
路42と臨界帯域幅の50%幅の移動ピーク値を与える
臨界帯域幅の50%幅の移動ピーク検出回路43によっ
て2つの異なった周波数幅を持った移動ピーク特性が得
られる。
From the frequency components given to the input terminal 41, moving peak characteristics having two different frequency widths can be obtained. That is, a moving peak detection circuit 42 having a moving bandwidth of 10% of the critical bandwidth and a moving peak detecting circuit 42 having a moving bandwidth of 10% of the critical bandwidth, and a moving peak value of 50% of the moving bandwidth having a moving peak value of 50% of the critical bandwidth. The moving peak detection circuit 43 can obtain moving peak characteristics having two different frequency widths.

【0034】これら臨界帯域幅の10%幅の移動ピーク
値を与える臨界帯域幅の10%幅の移動ピーク検出回路
42と臨界帯域幅の50%幅の移動ピーク値を与える臨
界帯域幅の50%幅の移動ピーク検出回路43で得られ
た移動ピークカーブは、その差を差検出回路44によっ
て求められ、出力端子45から取り出される。
A moving peak detection circuit 42 having a moving peak value of 10% of the critical bandwidth and a moving peak detecting circuit 42 having a moving peak value of 10% of the critical bandwidth and 50% of the critical bandwidth giving a moving peak value of 50% of the critical bandwidth. The difference of the moving peak curve obtained by the width moving peak detecting circuit 43 is obtained by the difference detecting circuit 44 and taken out from the output terminal 45.

【0035】このようにして求められた移動ピーク値の
差が、あるスレッショールドを越える周波数領域を不協
和周波数領域と定義する。
A frequency region in which the difference between the moving peak values thus obtained exceeds a certain threshold is defined as a dissonance frequency region.

【0036】しかしながら、その他の聴覚的効果すなわ
ちマスキング効果,等ラウドネス,最小可聴限を考える
とき、以上のようにして求められた不協和周波数領域に
含まれる周波数成分全てを操作の対象とする必要はな
い。すなわち、マスキング効果、等ラウドネス、最小可
聴限を考慮したときに、聴覚的に聞こえることがないと
判断される周波数成分は操作の対象から外してもほとん
ど影響がなく、また、等ラウドネスを考えたときに、効
果的である帯域のみを操作の対象とすることは演算量の
減少に役立つ。
However, when considering other auditory effects, that is, masking effect, equal loudness, and minimum audible limit, it is not necessary to target all the frequency components included in the dissonance frequency region obtained as described above. Absent. That is, considering the masking effect, the equal loudness, and the minimum audible limit, the frequency component that is determined not to be heard auditorily has almost no effect even if it is excluded from the operation target, and the equal loudness is considered. Sometimes, targeting the operation only to the effective band helps reduce the amount of calculation.

【0037】図1におけるマスク機能を有するマスク回
路10、マスキングカーブ算出機能を有するマスキング
スレショールドカーブ検出回路16、最小可聴限情報を
記憶する最小可聴カーブ発生回路17は、以上説明した
様に、マスキング効果、最小可聴限を考慮したときに、
聴覚的に聞こえることがないと判断される周波数成分を
操作の対象から外す為に用いられる。
The mask circuit 10 having the mask function, the masking threshold curve detecting circuit 16 having the masking curve calculating function, and the minimum audible curve generating circuit 17 for storing the minimum audible limit information in FIG. 1 are as described above. Considering the masking effect and minimum audibility,
It is used to remove the frequency component that is judged not to be audibly heard from the operation target.

【0038】以下、より詳細に上記マスク回路10での
マスク機能と、マスキングスレショールドカーブ検出回
路16でのマスキングカーブ算出機能と、最小可聴カー
ブ発生回路17での最小可聴限記憶機能につき説明す
る。
The masking function in the masking circuit 10, the masking curve calculating function in the masking threshold curve detecting circuit 16 and the minimum audible limit storing function in the minimum audible curve generating circuit 17 will be described in more detail below. .

【0039】図7は上記マスキングスレショールドカー
ブ検出回路16でのマスキングカーブ算出機能の一具体
例の概略構成を示すブロック回路図である。この図7に
おいて、入力端子71には、図1における各MDCT回
路5a,5b,5c,5dからの周波数成分データが供
給されている。
FIG. 7 is a block circuit diagram showing a schematic configuration of a specific example of the masking curve calculation function in the masking threshold curve detection circuit 16. 7, the input terminal 71 is supplied with frequency component data from the MDCT circuits 5a, 5b, 5c and 5d in FIG.

【0040】この周波数軸上の入力データは、臨界帯域
毎のエネルギ算出回路72に送られて、ここで各臨界帯
域のエネルギが、各臨界帯域内の周波数成分の各振幅値
の総和を計算することにより求められる。この各臨界地
域毎のエネルギの代わりに、振幅値のピーク値、平均値
等が用いられることもある。このエネルギ算出回路72
からの出力として、例えば各バンドの総和値のスペクト
ルを図8に図中SBとして示している。ただし、この図
8では、図示を簡略化するため、分割帯域数を12バン
ド(B1 〜B12)で表現している。
The input data on the frequency axis is sent to the energy calculating circuit 72 for each critical band, where the energy of each critical band calculates the sum of the amplitude values of the frequency components within each critical band. Required by Instead of the energy for each critical region, the peak value, the average value, etc. of the amplitude value may be used. This energy calculation circuit 72
As an output from, for example, the spectrum of the sum value of each band is shown as SB in the figure. However, in FIG. 8, the number of divided bands is expressed by 12 bands (B1 to B12) to simplify the illustration.

【0041】ここで、上記スペクトルSBのいわゆるマ
スキングに於ける影響を考慮するために、該スペクトル
SBに所定の重み付け関数を掛けて加算するような畳込
み(コンボリユーション)処理を施す。このため、上記
帯域毎のエネルギ算出回路72の出力すなわち該スペク
トルSBの各値は、畳込みフイルタ回路73に送られ
る。該畳込みフイルタ回路73は、例えば、入力データ
を順次遅延させる複数の遅延素子と、これら遅延素子か
らの出力にフイルタ係数(重み付け関数)を乗算する複
数の乗算器(例えば各バンドに対応する25個の乗算
器)と、各乗算器出力の総和をとる総和加算器とから構
成されるものである。この畳込み処理により、例えば図
8のB6で示されるバンドのスペクトルSBに対しては
図8の図中点線で示す部分の総和がとられる。なお、上
記マスキングとは、人間の聴覚上の特性により、ある信
号によって他の信号がマスクされて聞こえなくなる現象
をいうものであり、このマスキング効果には、時間軸上
のオーデイオ信号による継時マスキング効果と、周波数
軸上の信号による同時刻マスキング効果とがある。これ
らのマスキング効果により、マスキングされる部分に信
号情報もしくはノイズがあったとしても、これらは聞こ
えないことになる。このため、実際のオーデイオ信号で
は、このマスキングされる範囲内の信号情報及びノイズ
は操作対象とする必要がない。
Here, in order to take into consideration the influence of the spectrum SB on so-called masking, a convolution process is performed such that the spectrum SB is multiplied by a predetermined weighting function and added. Therefore, the output of the energy calculation circuit 72 for each band, that is, each value of the spectrum SB is sent to the convolution filter circuit 73. The convolution filter circuit 73 includes, for example, a plurality of delay elements that sequentially delay input data, and a plurality of multipliers that multiply outputs from these delay elements by a filter coefficient (weighting function) (for example, 25 corresponding to each band). Number of multipliers), and a sum adder that sums the outputs of the multipliers. By this convolution processing, for the spectrum SB of the band shown by B6 in FIG. 8, for example, the sum of the parts shown by the dotted line in the drawing is taken. Note that the masking is a phenomenon in which one signal is masked by another signal and becomes inaudible due to human auditory characteristics, and this masking effect includes continuous masking by an audio signal on the time axis. There are an effect and a simultaneous masking effect by a signal on the frequency axis. Due to these masking effects, even if there is signal information or noise in the masked portion, these will not be heard. Therefore, in the actual audio signal, the signal information and noise within the masked range do not need to be operated.

【0042】なお、上記畳込みフイルタ回路73の各乗
算器の乗算係数(フイルタ係数)の一具体例を示すと、
任意のバンドに対応する乗算器Mの係数を1とすると
き、乗算器M−1で係数0.15を、乗算器M−2で係
数0.0019を、乗算器M−3で係数0.00000
86を、乗算器M+1で係数0.4を、乗算器M+2で
係数0.06を、乗算器M+3で係数0.007を各遅
延素子の出力に乗算することにより、上記スペクトルS
Bの畳込み処理が行われる。ただし、Mは1〜25の任
意の整数である。
A specific example of the multiplication coefficient (filter coefficient) of each multiplier of the convolution filter circuit 73 will be described below.
When the coefficient of the multiplier M corresponding to an arbitrary band is 1, the coefficient M of the multiplier M-1 is 0.15, the coefficient of the multiplier M-2 is 0.0019, and the coefficient of the multiplier M-3 is 0. 00000
By multiplying the output of each delay element by 86, the multiplier M + 1 by a coefficient 0.4, the multiplier M + 2 by a coefficient 0.06, and the multiplier M + 3 by a coefficient 0.007.
B convolution processing is performed. However, M is an arbitrary integer of 1 to 25.

【0043】次に、上記畳込みフイルタ回路73の出力
は引算器74に送られる。該引算器74は、上記畳込ん
だ領域での後述する操作対象から外すことが可能な信号
情報もしくはノイズレベルに対応するレベルαを求める
ものである。なお、当該操作対象から外すことが可能な
信号情報もしくはノイズレベルに対応するレベルαは、
後述するように、逆コンボリユーション処理を行うこと
によって、クリテイカルバンド(臨界帯域幅)の各バン
ド毎の操作対象から外すことが可能な信号情報もしくは
ノイズレベルとなるようなレベルである。ここで、上記
引算器74には、上記レベルαを求めるための許容関数
(マスキングレベルを表現する関数)が供給される。こ
の許容関数を増減させることで上記レベルαの制御を行
っている。当該許容関数は、次に説明するような(n−
ai)関数発生回路75から供給されているものであ
る。
Next, the output of the convolution filter circuit 73 is sent to the subtractor 74. The subtractor 74 obtains a level α corresponding to signal information or noise level that can be removed from an operation target to be described later in the convoluted area. The level α corresponding to the signal information or noise level that can be removed from the operation target is
As will be described later, the level is such that the signal information or noise level can be removed from the operation target for each band of the critical band (critical bandwidth) by performing the inverse convolution process. Here, the subtractor 74 is supplied with an allowance function (function expressing a masking level) for obtaining the level α. The level α is controlled by increasing or decreasing this allowance function. The permissible function is (n-
ai) It is supplied from the function generating circuit 75.

【0044】すなわち、操作対象から外すことが可能な
信号情報もしくはノイズレベルに対応するレベルαは、
臨界帯域の帯域の低域から順に与えられる番号をiとす
ると、次の(1)式で求めることができる。 α=S−(n−ai) ・・・(1) この(1)式において、n,aは定数でa>0、Sは畳
込み処理されたバークスペクトルの強度であり、(1)
式中(n-ai)が許容関数となる。本実施例ではn=38,
a=1としている。
That is, the level α corresponding to the signal information or noise level that can be removed from the operation target is
When the number given in order from the lower band of the critical band is i, it can be calculated by the following equation (1). α = S- (n-ai) (1) In this equation (1), n and a are constants, a> 0, S is the intensity of the convolution-processed Bark spectrum, and (1)
In the formula, (n-ai) is the allowable function. In this embodiment, n = 38,
It is assumed that a = 1.

【0045】このようにして、上記レベルαが求めら
れ、このデータは、割算器76に伝送される。当該割算
器76では、上記畳込みされた領域での上記レベルαを
逆コンボリユーションするためのものである。したがっ
て、この逆コンボリユーション処理を行うことにより、
上記レベルαからマスキングスペクトルが得られるよう
になる。すなわち、このマスキングスペクトルが、操作
対象から外すことが可能な信号情報もしくはノイズスペ
クトルとなる。
In this way, the level α is obtained, and this data is transmitted to the divider 76. The divider 76 is for inverse convolution of the level α in the convolved area. Therefore, by performing this inverse convolution process,
The masking spectrum can be obtained from the level α. That is, this masking spectrum becomes signal information or noise spectrum that can be removed from the operation target.

【0046】なお、上記逆コンボリユーション処理は、
複雑な演算を必要とするが、本実施例では簡略化した割
算器76を用いて逆コンボリユーションを行っている。
The inverse convolution process is
Although a complicated operation is required, in this embodiment, the inverse convolution is performed using the simplified divider 76.

【0047】次に、上記マスキングスペクトルは、合成
回路77を介して減算器78に伝送される。ここで、当
該減算器78には、上記臨界帯域毎のエネルギ検出回路
72からの出力、すなわち前述したスペクトルSBが、
遅延回路79を介して供給されている。したがって、こ
の減算器78で上記マスキングスペクトルとスペクトル
SBとの減算演算が行われることで、図9に示すよう
に、上記スペクトルSBは、該マスキングスペクトルM
Sのレベルで示すレベル以下がマスキングされることに
なる。
Next, the masking spectrum is transmitted to the subtractor 78 via the synthesizing circuit 77. Here, the output from the energy detection circuit 72 for each critical band, that is, the spectrum SB described above, is input to the subtracter 78.
It is supplied via the delay circuit 79. Therefore, the subtractor 78 subtracts the masking spectrum from the spectrum SB, so that the spectrum SB becomes the masking spectrum M as shown in FIG.
The level below the level indicated by S will be masked.

【0048】当該減算器78からの出力は、操作対象か
ら外すことが可能な信号情報若しくはノイズレベル補正
回路(図示は省略している)を介し、出力端子81を介
して取り出され、上記マスク回路10に送られて、ここ
で不協和周波数領域のうちで操作対象から外すことが可
能な周波数領域を除外する。
The output from the subtractor 78 is taken out through an output terminal 81 via signal information or a noise level correction circuit (not shown) which can be removed from the operation target, and the mask circuit. The frequency domain that can be excluded from the operation target in the dissonance frequency domain is excluded.

【0049】なお、遅延回路79は上記合成回路77以
前の各回路での遅延量を考慮してエネルギ検出回路72
からのスペクトルSBを遅延させるために設けられてい
る。
The delay circuit 79 takes the amount of delay in each circuit before the synthesis circuit 77 into consideration, and the energy detection circuit 72.
Is provided to delay the spectrum SB from

【0050】ところで、上述した合成回路77での合成
の際には、最小可聴カーブ発生回路17から供給される
図10に示すような人間の聴覚特性であるいわゆる最小
可聴限カーブRCを示すデータと、上記マスキングスペ
クトルMSとを合成することができる。この最小可聴カ
ーブにおいて、信号もしくは雑音絶対レベルがこの最小
可聴限カーブ以下ならば該信号及び雑音は聞こえないこ
とになる。この最小可聴限カーブは、例えば再生時の再
生ボリュームの違いで異なるものとなるが、現実的なデ
ィジタルシステムでは、例えば16ビットダイナミック
レンジへの音楽のはいり方にはさほど違いがないので、
例えば4kHz付近の最も耳に聞こえやすい周波数帯域
の量子化雑音が聞こえないとすれば、他の周波数帯域で
はこの最小可聴限カーブのレベル以下の量子化雑音は聞
こえないと考えられる。したがって、このように例えば
システムの持つワードレングスの4kHz付近の雑音が
聞こえない使い方をすると仮定し、この最小可聴限カー
ブRCとマスキングスペクトルMSとを共に合成するこ
とで、操作対象から外すことが可能な信号情報もしくは
ノイズレベルを得るようにすると、この場合の操作対象
から外すことが可能な信号情報もしくはノイズレベル
は、図10中の斜線で示す部分までとすることができる
ようになる。
By the way, at the time of synthesizing by the synthesizing circuit 77 described above, data supplied from the minimum audible curve generating circuit 17 and showing the so-called minimum audible limit curve RC which is the human auditory characteristic as shown in FIG. , And the masking spectrum MS can be combined. In this minimum audible curve, if the signal or noise absolute level is below this minimum audible limit curve, the signal and noise will not be heard. The minimum audible limit curve varies depending on, for example, the reproduction volume at the time of reproduction. However, in a realistic digital system, there is not much difference in how to enter music into a 16-bit dynamic range.
For example, if the quantization noise in the most audible frequency band around 4 kHz is not heard, it is considered that the quantization noise below the level of the minimum audible limit curve is not heard in other frequency bands. Therefore, assuming that the system is used in such a manner that noise near the word length of the system of 4 kHz cannot be heard, and the minimum audible limit curve RC and the masking spectrum MS are combined together, it can be removed from the operation target. By obtaining the appropriate signal information or noise level, the signal information or noise level that can be removed from the operation target in this case can be up to the shaded portion in FIG. 10.

【0051】なお、本実施例では、上記最小可聴限カー
ブの4kHzのレベルを、例えば20ビット相当の最低
レベルに合わせている。また、この図10は、信号スペ
クトルSSも同時に示している。
In the present embodiment, the level of 4 kHz of the minimum audible limit curve is set to the minimum level equivalent to 20 bits, for example. Further, FIG. 10 also shows the signal spectrum SS at the same time.

【0052】また、別の操作対象周波数成分の限定方法
としては、入力ディジタル信号情報に含まれている量子
化雑音のレベルにより、限定する場合がある。量子化雑
音レベルはスペクトルがほぼ白色の場合、語長によりほ
ぼ決定されるからこのレベル範囲の周波数成分を限定的
に操作対象とすることによって効果的に量子化雑音のう
ち、不協和を引き起こす成分を低減もしくは除去するこ
とができる。図1においては、量子化雑音レベル記憶機
能に、量子化雑音レベルを記憶させておくことにより、
このレベルの範囲に操作対象とする周波数成分を限定す
る。もちろんこの量子化レベルは最適になるように調整
をしてもよい。
As another method of limiting the frequency components to be operated, there is a case where the frequency components are limited according to the level of the quantization noise included in the input digital signal information. When the spectrum is almost white, the quantization noise level is almost determined by the word length. Therefore, by limiting the frequency components in this level range to limited operations, the quantization noise component that effectively causes dissonance. Can be reduced or eliminated. In FIG. 1, by storing the quantization noise level in the quantization noise level storage function,
The frequency components to be operated are limited to this level range. Of course, this quantization level may be adjusted to be optimum.

【0053】また、上記操作対象から外すことが可能な
信号情報もしくはノイズレベル補正回路では、図示を省
略する補正情報出力回路から送られてくる例えば等ラウ
ドネスカーブの情報に基づいて、上記減算器78からの
出力における操作対象から外すことが可能な信号情報も
しくはノイズレベルを補正している。ここで、等ラウド
ネスカーブとは、人間の聴覚特性に関する特性曲線であ
り、例えば1kHzの純音と同じ大きさに聞こえる各周
波数での音の音圧を求めて曲線で結んだもので、ラウド
ネスの等感度曲線とも呼ばれる。またこの等ラウドネス
曲線は、図10に示した最小可聴カーブRCと略同じ曲
線を描くものである。この等ラウドネス曲線において
は、例えば4kHz付近では1kHzのところより音圧
が8〜10dB下がっても1kHzと同じ大きさに聞こ
え、逆に、10kHz付近では1kHzでの音圧よりも
約15dB高くないと同じ大きさに聞こえない。このた
め、上記最小可聴カーブのレベルを越えた信号もしくは
雑音は、該等ラウドネス曲線に応じたカーブで与えられ
る周波数特性でその大きさを評価されるのが良いことが
わかる。このようなことから、上記等ラウドネス曲線を
考慮して、演算量を削減するために操作対象から外すこ
とが可能な信号情報もしくはノイズを選定することは、
人間の聴覚特性に適合していることがわかる。
In the signal information or noise level correction circuit that can be removed from the operation target, the subtractor 78 is based on, for example, equal loudness curve information sent from a correction information output circuit (not shown). The signal information or noise level that can be removed from the operation target in the output from is corrected. Here, the equal loudness curve is a characteristic curve relating to human auditory characteristics, and is obtained by, for example, obtaining the sound pressure of sound at each frequency heard at the same loudness as a pure tone of 1 kHz and connecting them with a curve. Also called sensitivity curve. Further, this equal loudness curve draws a curve substantially the same as the minimum audible curve RC shown in FIG. In this equal loudness curve, for example, in the vicinity of 4 kHz, even if the sound pressure drops by 8 to 10 dB from 1 kHz, it sounds as loud as 1 kHz. It doesn't sound the same. Therefore, it is understood that the magnitude of the signal or noise exceeding the level of the minimum audible curve should be evaluated by the frequency characteristic given by the curve corresponding to the equal loudness curve. Therefore, in consideration of the equal loudness curve, it is necessary to select signal information or noise that can be removed from the operation target in order to reduce the calculation amount.
It can be seen that it matches human hearing characteristics.

【0054】図1に戻って、上記マスク回路10は、以
上に説明した聴覚的効果を用いて、不必要な周波数帯域
での周波数成分の変更を行わないようにする。このマス
ク回路10は出力としてローカルピーク成分との間で不
協和な関係を持つ周波数成分のうち聴覚的な音質向上に
効果的な操作が得られる成分情報を出す。図1の周波数
成分変更回路6は、この情報を基にして対象となる周波
数成分の大きさを変更する。
Returning to FIG. 1, the mask circuit 10 uses the auditory effect described above to prevent the frequency component from being changed in an unnecessary frequency band. The mask circuit 10 outputs, as an output, component information of frequency components having a dissonant relationship with the local peak component, which enables an operation effective for auditory sound quality improvement. The frequency component changing circuit 6 of FIG. 1 changes the magnitude of the frequency component of interest based on this information.

【0055】図11には、上記周波数成分変更回路6に
おいて周波数成分の大きさを変更する様子を示してい
る。この図11において、図中Band1〜Band4はマスク
回路10により指定された周波数成分の大きさを変更す
る周波数領域であり、その変更の程度は各バンドの中央
部ほど大きくなっている。これは前記図5に示された不
協和度が周波数差により異なることを利用したものであ
る。また、図中Sp1〜Sp4は、各ローカルピークス
ペクトルの位置の利得を表しており、不協和周波数帯域
の周波数成分が小さくなったことにより、全体のエネル
ギが減少することを補償するためにこの周波数位置のス
ペクトルの大きさを大きくすることを示している。
FIG. 11 shows how the frequency component changing circuit 6 changes the magnitude of the frequency component. In FIG. 11, Band1 to Band4 in the figure are frequency regions in which the magnitude of the frequency component designated by the mask circuit 10 is changed, and the degree of change becomes larger toward the center of each band. This utilizes the fact that the degree of dissonance shown in FIG. 5 differs depending on the frequency difference. In addition, Sp1 to Sp4 in the figure represent the gain at the position of each local peak spectrum, and in order to compensate for the decrease in the overall energy due to the decrease in the frequency component in the dissonance frequency band, this frequency is compensated. This shows that the magnitude of the position spectrum is increased.

【0056】このようにして周波数成分の大きさを変更
した周波数成分変更回路6の出力は、前記MDCTの逆
変換を行うIMDCT回路9a,9b,9c,9dによ
って、周波数軸上から時間軸上へと変換される。これら
IMDCT回路9a,9b,9c,9dからのIMDC
T出力信号は、前記CQFとは逆の周波数合成(ICQ
F)機能を有する帯域合成フィルタ13,14,15に
より周波数合成され全帯域時間信号となる。
The output of the frequency component changing circuit 6 in which the magnitude of the frequency component is changed in this way is moved from the frequency axis to the time axis by the IMDCT circuits 9a, 9b, 9c and 9d for performing the inverse transform of the MDCT. Is converted to. IMDC from these IMDCT circuits 9a, 9b, 9c, 9d
The T output signal has a frequency synthesis (ICQ) opposite to that of the CQF.
F) Frequency synthesis is performed by the band synthesis filters 13, 14 and 15 having the function to become the full-band time signal.

【0057】これら帯域合成フィルタ13,14,15
による全帯域信号は、周波数成分の変更によってダイナ
ミックレンジが、元の入力信号情報に比較して大きくな
っていることがあるので、コンパクトディスクに記録す
る場合には、16ビットへの再量子化が必要となること
がある。なお、本件出願人は、先に、入力されたディジ
タルオーデイオ信号をオーディオ帯域内でのノイズシェ
イピングによって等ラウドネス特性に近いノイズ周波数
特性を与える再量子化を行いコンパクトディスクに16
ビット再量子化信号を記録するような技術を、例えば前
述の特開平2−20812号公報、特開平2−1855
52号公報、特開平2−185556号公報にて開示し
ている。
These band synthesizing filters 13, 14, 15
The full-band signal due to may have a larger dynamic range compared to the original input signal information due to the change of the frequency component. Therefore, when recording on a compact disc, requantization to 16 bits is required. May be needed. The applicant of the present invention previously performed re-quantization on the input digital audio signal by noise shaping in the audio band to give a noise frequency characteristic close to an equal loudness characteristic, and then re-quantized it on a compact disc.
A technique for recording a bit requantized signal is disclosed in, for example, the above-mentioned Japanese Patent Laid-Open Nos. 20812/1990 and 1855/1990.
No. 52 and Japanese Patent Application Laid-Open No. 2-185556.

【0058】本発明ではこのような場合、本発明によっ
て処理された信号を更に上記ノイズシェイピングするこ
とによって16ビットを越える特性をもつコンパクトデ
ィスク記録信号を得ることができる。
In the present invention, in such a case, the signal processed by the present invention is further subjected to the above noise shaping to obtain a compact disc recording signal having a characteristic exceeding 16 bits.

【0059】以下、図1において上記ノイズシェイピン
グを行うノイズシェイパの動作を説明する。上記帯域合
成フィルタ15から加算回路18に供給された信号は、
帰還フィルタ21の出力信号との差をとられる。加算回
路18の出力は再量子化器19及び第2の加算回路20
に供給される。再量子化器19は、入力信号語長よりも
少ない語長で出力されることで少ない情報量で信号を伝
送記録等を行おうとするものである。この再量子化器1
9の出力は当該ノイズシェイパの出力端子22及び第2
の加算回路20に供給される。第2の加算回路20は再
量子化器19の入力及び出力の信号の差を得るものであ
り、出力として量子化誤差が抽出される。第2の加算回
路20の出力は帰還フィルタ21に供給される。
The operation of the noise shaper for performing the above noise shaping will be described below with reference to FIG. The signal supplied from the band synthesis filter 15 to the adding circuit 18 is
The difference from the output signal of the feedback filter 21 can be taken. The output of the adder circuit 18 is the requantizer 19 and the second adder circuit 20.
Is supplied to. The re-quantizer 19 outputs a signal with a word length shorter than the input signal word length, and thus tries to transmit and record the signal with a small amount of information. This requantizer 1
The output of 9 is the output terminal 22 and the second terminal of the noise shaper.
Is supplied to the adder circuit 20. The second addition circuit 20 obtains the difference between the input and output signals of the requantizer 19, and the quantization error is extracted as the output. The output of the second adder circuit 20 is supplied to the feedback filter 21.

【0060】ここで、当該帰還フィルタ21について図
12にて詳細に説明する。この図12において、端子5
0を介して帰還フィルタ21に供給された信号は、遅延
素子52,53,54,55の直列回路に順次シフトし
てゆく。各遅延素子52,53,54,55の出力は、
乗算素子56,57,58,59と接続されており、こ
れら乗算素子56,57,58,59において各対応す
る係数入力端子62,63,64,65から供給される
フィルタ係数との積がとられる。これらの乗算素子5
6,57,58,59の出力は、加算素子60で加算さ
れて帰還フィルタの出力端子61に導かれる。
Here, the feedback filter 21 will be described in detail with reference to FIG. In FIG. 12, the terminal 5
The signal supplied to the feedback filter 21 via 0 is sequentially shifted to the series circuit of the delay elements 52, 53, 54 and 55. The output of each delay element 52, 53, 54, 55 is
The multipliers 56, 57, 58 and 59 are connected to each other, and the product of the multipliers 56, 57, 58 and 59 and the filter coefficients supplied from the corresponding coefficient input terminals 62, 63, 64 and 65 is obtained. To be These multiplication elements 5
The outputs of 6, 57, 58, and 59 are added by the adder element 60 and guided to the output terminal 61 of the feedback filter.

【0061】以上の加算回路18、再量子化器19、第
2の加算回路20、及び帰還フイルタ21より構成され
るノイズシェイパによって等ラウドネス特性に近いノイ
ズ周波数特性が与えられたディジタルオーデイオ信号
は、出力端子22より出力される。この出力信号は、所
定の誤り訂正処理等がなされ、記録媒体(光磁気ディス
ク、半導体メモリ、ICメモリーカード、光ディスク)
に記録される。
The digital audio signal to which the noise frequency characteristic close to the equal loudness characteristic is given by the noise shaper including the adder circuit 18, the requantizer 19, the second adder circuit 20, and the feedback filter 21 is output. It is output from the terminal 22. This output signal is subjected to predetermined error correction processing and the like, and is recorded on a recording medium (magneto-optical disk, semiconductor memory, IC memory card, optical disk).
Recorded in.

【0062】以上の如く、本発明実施例の第1の信号変
換方法は、音響時間信号情報から得られた周波数成分に
ついて、概略臨界帯域内の他の周波数成分の内、最小可
聴限レベル又はマスキングスレッショールドレベルを越
える周波数成分との間で属性の大きさの違いを変えるこ
とを特徴とする時間信号情報特性変換方法である。
As described above, according to the first signal conversion method of the embodiment of the present invention, with respect to the frequency component obtained from the acoustic time signal information, the minimum audible level or the masking among the other frequency components within the substantially critical band. It is a time signal information characteristic conversion method characterized by changing the difference in attribute size between frequency components exceeding the threshold level.

【0063】また、本発明の実施例の第2の信号変換方
法は、音響時間信号情報から得られた周波数成分につい
て、概略臨界帯域内の他の周波数成分の内、最小可聴限
レベルとマスキングスレッショールドレベルの大きいほ
うのレベルを越える周波数成分との間で属性の大きさの
違いを変えることを特徴とする時間信号情報特性変換方
法である。
In the second signal conversion method of the embodiment of the present invention, with respect to the frequency component obtained from the acoustic time signal information, the minimum audible limit level and the masking threshold among the other frequency components within the substantially critical band. It is a time signal information characteristic conversion method characterized in that the difference in the size of the attribute is changed between the frequency component exceeding the higher level of the Shored level and the frequency component.

【0064】さらに、本発明の実施例の第3の信号変換
方法は、音響時間信号情報から得られた周波数成分につ
いて、概略臨界帯域内の他の周波数成分の内、限定され
たレベル範囲内の周波数成分との間で属性の大きさの違
いを変えることを特徴とする時間信号情報特性変換方法
である。
Further, according to the third signal conversion method of the embodiment of the present invention, the frequency component obtained from the acoustic time signal information is within a limited level range among other frequency components within the substantially critical band. It is a time signal information characteristic conversion method characterized by changing a difference in attribute size between frequency components.

【0065】また、本発明実施例の第1から第3の信号
変換方法は、前記属性が周波数成分の大きさであること
を特徴とする時間信号情報特性変換方法である。
Further, the first to third signal conversion methods of the embodiment of the present invention are time signal information characteristic conversion methods characterized in that the attribute is the magnitude of the frequency component.

【0066】なお、本発明実施例により形成された変換
データは記録媒体に記録したり、伝送路を介して伝送す
ることが可能である。例えば、記録媒体としては、光磁
気ディスク、光ディスク、半導体記録媒体、特にICメ
モリーカードなどが使用できる。
The converted data formed by the embodiment of the present invention can be recorded on a recording medium or can be transmitted through a transmission path. For example, as the recording medium, a magneto-optical disk, an optical disk, a semiconductor recording medium, especially an IC memory card can be used.

【0067】さらに、本発明は上記実施例のみに限定さ
れるものではなく、画像信号情報などにも適用できる。
Furthermore, the present invention is not limited to the above embodiments, but can be applied to image signal information and the like.

【0068】[0068]

【発明の効果】本発明によれば、上述したようなことか
ら、音響時間信号情報を聴覚的な原理を用いて瞬時瞬時
に人間にとって音質的に高品質に心地好く聞こえる音を
作り出すことができる。また、既にディジタル化されて
量子化雑音が付加した音響時間信号情報から量子化雑音
の聴覚的な影響を減ずることにより、品質の向上を図る
ことができ、既にディジタル化されて量子化雑音が付加
されたオーディオ信号情報から量子化雑音の聴覚的な影
響を減じた後、コンパクトディスクのようなオーディオ
機器の音質を向上させる技術として例えば等ラウドネス
特性やマスキング特性に合うように量子化雑音のスペク
トルを変更することによって聴感上の雑音レベルを低減
させる技術を用いて、16ビットの語長を持つコンパク
トディスクに記録するときに、聴覚的な処理によって音
質を向上させたデータを作ることができる。これによ
り、16ビットを越える語長を有するディジタル信号を
16ビット長を有するコンパクトディスクの為に再量子
化する場合、音質向上を図ることができる。さらに、本
発明によれば、既に量子化雑音が付加されたオーディオ
信号情報について、聴覚的に音質を等価的に16ビット
以上に一度向上させ、再び16ビットに再量子化する
際、聴覚的に重要な周波数帯域のS/Nを16ビット以
上に保ったまま16ビットとすることで、音質の向上を
図ることが可能となる。
As described above, according to the present invention, the sound time signal information can be instantly and instantly produced to a human being in a high quality and pleasant sound by using the auditory principle. it can. In addition, quality can be improved by reducing the auditory influence of the quantization noise from the acoustic time signal information that has already been digitized and added with the quantization noise. As a technique to improve the sound quality of audio equipment such as a compact disc after subtracting the auditory influence of the quantization noise from the audio signal information obtained, for example, the spectrum of the quantization noise is adjusted to match the equal loudness characteristics and masking characteristics. By using a technique of reducing the noise level on the sense of hearing by changing the data, it is possible to create data with improved sound quality by aural processing when recording on a compact disc having a word length of 16 bits. As a result, when requantizing a digital signal having a word length exceeding 16 bits for a compact disc having a 16-bit length, it is possible to improve the sound quality. Further, according to the present invention, for audio signal information to which quantization noise has already been added, the sound quality is auditorily improved once equivalently to 16 bits or more, and then requantized to 16 bits again. It is possible to improve the sound quality by setting the S / N of the important frequency band to 16 bits while keeping the S / N to 16 bits or more.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の時間信号情報の特性の変換方法(信号
変換方法)を実現する本実施例の信号変換装置の概略構
成例を示すブロック回路図である。
FIG. 1 is a block circuit diagram showing a schematic configuration example of a signal conversion apparatus of the present embodiment that realizes a method of converting characteristics of time signal information (signal conversion method) of the present invention.

【図2】本発明に係る各帯域毎の時間ブロックを示す図
である。
FIG. 2 is a diagram showing a time block for each band according to the present invention.

【図3】本発明に係る周波数移動ピークを示す図であ
る。
FIG. 3 is a diagram showing frequency shift peaks according to the present invention.

【図4】本発明に係る周波数移動ピーク周波数特性の例
を示す図である。
FIG. 4 is a diagram showing an example of frequency shift peak frequency characteristics according to the present invention.

【図5】協和度と臨界帯域の関係を示す図である。FIG. 5 is a diagram showing a relationship between a degree of concordance and a critical band.

【図6】本発明実施例装置の不協和帯域検出回路の構成
例を示すブロック回路図である。
FIG. 6 is a block circuit diagram showing a configuration example of a dissonance band detection circuit of the device according to the embodiment of the present invention.

【図7】本実施例装置のマスキングスレッショールドカ
ーブ検出回路の構成例を示すブロック回路図である。
FIG. 7 is a block circuit diagram showing a configuration example of a masking threshold curve detection circuit of the device of this embodiment.

【図8】各臨界帯域の信号成分の総和値を示す図であ
る。
FIG. 8 is a diagram showing a total value of signal components in each critical band.

【図9】各臨界帯域の信号成分の総和値とマスキングス
レショールドを示す図である。
FIG. 9 is a diagram showing a sum total value of signal components in each critical band and a masking threshold.

【図10】各臨界帯域の信号成分の総和値とマスキング
スレショールド、最小可聴限を示す図である。
FIG. 10 is a diagram showing a sum total value of signal components in each critical band, a masking threshold, and a minimum audible limit.

【図11】周波数成分の大きさを変える例を示す図であ
る。
FIG. 11 is a diagram showing an example of changing the magnitude of frequency components.

【図12】ノイズシェーピングの為の帰還フィルタの構
成例を示す図である。
FIG. 12 is a diagram showing a configuration example of a feedback filter for noise shaping.

【符号の説明】[Explanation of symbols]

1,41,71・・・入力端子 2,3,4・・・・・帯域分割フィルタ(CQF) 5a,5b,5c,5d・・・・MDCT回路 6・・・・・・・・・周波数成分変更回路 10・・・・・・・・マスク回路 11・・・・・・・・不協和周波数検出回路 12・・・・・・・・周波数移動ピーク検出回路 13,14,15・・帯域合成フィルタ 16・・・・・・・・マスキングスレッショールドカー
ブ検出回路16 17・・・・・・・・最小可聴カーブ発生回路 18,20・・・・・加算回路 19・・・・・・・・再量子化器 21・・・・・・・・帰還フィルタ 22,45,61,81・・・出力端子 42・・・・・・・・臨界帯域の10%幅の移動ピーク
検出回路 43・・・・・・・・臨界帯域の50%幅の移動ピーク
検出回路 44・・・・・・・・差検出回路 52,53,54,55・・・遅延素子 56,57,58,59・・・乗算素子 60・・・・・・・・加算素子 72・・・・・・・・臨界帯域のエネルギ算出回路 73・・・・・・・・畳み込みフィルタ回路 75・・・・・・・・関数発生回路 74・・・・・・・・引算器 76・・・・・・・・割算器 77・・・・・・・・合成回路 78・・・・・・・・減算回路
1, 41, 71 ... Input terminal 2, 3, 4 ... Band division filter (CQF) 5a, 5b, 5c, 5d ... MDCT circuit 6 ... Component change circuit 10 ... Mask circuit 11 ... Dissonance frequency detection circuit 12 ... Frequency shift peak detection circuit 13, 14, 15 ... Band Synthesis filter 16 ... Masking threshold curve detection circuit 16 17 ... Minimum audible curve generation circuit 18, 20 ... Addition circuit 19 ... ..Requantizer 21 ... Feedback filter 22, 45, 61, 81 ... Output terminal 42 ... Moving peak detection circuit 43 with 10% width of critical band 43・ ・ ・ ・ ・ ・ ・ ・ Moving peak detection circuit with 50% width of critical band 44・ ・ ・ ・ ・ ・ ・ ・ Difference detection circuit 52, 53, 54, 55 ・ ・ ・ Delay element 56, 57, 58, 59 ・ ・ ・ Multiplication element 60 ・ ・ ・ ・ ・ ・ Addition element 72 ・ ・ ・・ ・ ・ Critical band energy calculation circuit 73 ・ ・ ・ ・ ・ ・ Convolution filter circuit 75 ・ ・ ・ ・ ・ ・ Function generation circuit 74 ・ ・ ・ ・ ・ ・ ・ ・ Subtractor 76 ・ ・・ ・ ・ ・ ・ ・ Divider 77 ・ ・ ・ ・ ・ ・ Synthesis circuit 78 ・ ・ ・ ・ ・ ・ Subtraction circuit

Claims (27)

【特許請求の範囲】[Claims] 【請求項1】 音響時間信号情報から得られた周波数成
分について、略臨界帯域内の他の周波数成分の内、最小
可聴限レベル又はマスキングスレッショールドレベルを
越える周波数成分との間で属性の大きさの違いを変える
ことで上記音響時間信号情報の特性を変換することを特
徴とする信号変換方法。
1. The frequency component obtained from the acoustic time signal information has a large attribute between the frequency component exceeding the minimum audible level or the masking threshold level among other frequency components within the substantially critical band. A signal conversion method, characterized in that the characteristics of the acoustic time signal information are converted by changing the difference in height.
【請求項2】 音響時間信号情報から得られた周波数成
分について、略臨界帯域内の他の周波数成分の内、最小
可聴限レベルとマスキングスレッショールドレベルの大
きいほうのレベルを越える周波数成分との間で属性の大
きさの違いを変えることで上記音響時間信号情報の特性
を変換することを特徴とする信号変換方法。
2. A frequency component obtained from the acoustic time signal information is a frequency component that exceeds a minimum audible limit level and a masking threshold level, which are larger than other frequency components within a substantially critical band. A signal conversion method, characterized in that the characteristics of the acoustic time signal information are converted by changing the difference in attribute size between them.
【請求項3】 音響時間信号情報から得られた周波数成
分について、略臨界帯域内の他の周波数成分の内、限定
されたレベル範囲内の周波数成分との間で属性の大きさ
の違いを変えることで上記音響時間信号情報の特性を変
換することを特徴とする信号変換方法。
3. Regarding the frequency component obtained from the acoustic time signal information, among the other frequency components within the substantially critical band, the difference in attribute size between the frequency component within a limited level range is changed. By so doing, the characteristic of the acoustic time signal information is converted.
【請求項4】 量子化雑音レベルにより限定されたレベ
ル範囲内の周波数成分との間で属性の大きさの違いを変
えることを特徴とする請求項3記載の信号変換方法。
4. The signal conversion method according to claim 3, wherein a difference in attribute size between the frequency component and a frequency component within a level range limited by the quantization noise level is changed.
【請求項5】 上記音響時間信号情報から得られた複数
の周波数成分の少なくとも一つのローカルピークについ
て、略臨界帯域内の他の周波数成分との間で属性の大き
さの違いを変えることを特徴とする請求項1、2、3、
4記載の信号変換方法。
5. A difference in attribute size between at least one local peak of a plurality of frequency components obtained from the acoustic time signal information and another frequency component within a substantially critical band is changed. Claims 1, 2, 3,
4. The signal conversion method described in 4.
【請求項6】 略臨界帯域幅の10%から50%の周波
数差を持つ周波数領域の他の周波数成分との間で属性の
大きさの違いを大きくすることを特徴とする請求項1、
2、3、4、5記載の信号変換方法。
6. The difference in the size of the attribute between the frequency component and another frequency component having a frequency difference of 10% to 50% of the substantially critical bandwidth is increased.
The signal conversion method described in 2, 3, 4, and 5.
【請求項7】 周波数成分から得られる2箇の移動ピー
ク値の差により、周波数成分の属性の大きさの違いを変
える周波数領域を決定することを特徴とする請求項1、
2、3、4、5、6記載の信号変換方法。
7. The frequency region in which the difference in the magnitude of the attribute of the frequency component is changed is determined by the difference between the two moving peak values obtained from the frequency component.
The signal conversion method described in 2, 3, 4, 5, and 6.
【請求項8】 略臨界帯域幅の50%幅の移動ピーク値
から、略臨界帯域幅の10%幅の移動ピーク値を引いた
値が負の周波数領域の周波数成分を小さくするか、削除
することを特徴とする請求項7記載の信号変換方法。
8. A value obtained by subtracting a moving peak value of 10% width of the substantially critical bandwidth from a moving peak value of 50% width of the substantially critical bandwidth reduces or eliminates a frequency component in a negative frequency region. 8. The signal conversion method according to claim 7, wherein:
【請求項9】 時間信号情報の短時間エネルギを保存す
るように周波数成分の大きさを調整することを特徴とす
る請求項1、2、3、4、5、6、7、8記載の信号変
換方法。
9. The signal according to claim 1, wherein the magnitude of the frequency component is adjusted so as to preserve the short-term energy of the time signal information. How to convert.
【請求項10】 時間信号情報の短時間エネルギを保存
するように少なくとも一つのローカルピークの周波数成
分の大きさを調整することを特徴とする請求項9記載の
信号変換方法。
10. The signal conversion method according to claim 9, wherein the magnitude of the frequency component of at least one local peak is adjusted so as to preserve the short-term energy of the time signal information.
【請求項11】 時間軸上に再合成された時間信号情報
をノイズシェイプ特性を有する再量子化処理することを
特徴とする請求項1、2、3、4、5、6、7、8、9
記載の信号変換方法。
11. A requantization process for re-synthesizing time signal information on a time axis, which has a noise shape characteristic, is performed. 9
The signal conversion method described.
【請求項12】 ノイズシェイプ特性が最小可聴限、等
ラウドネスもしくはマスキング特性の少なくともひとつ
に依存していることを特徴とする請求項11記載の信号
変換方法。
12. The signal conversion method according to claim 11, wherein the noise shape characteristic depends on at least one of the minimum audibility limit, the equal loudness and the masking characteristic.
【請求項13】 前記属性が周波数成分の大きさである
ことを特徴とする請求項1、2、3、4、5、6、7、
8、9、10、11、12記載の信号変換方法。
13. The attribute according to claim 1, 2, 3, 4, 5, 6, 7,
8. The signal conversion method according to 8, 9, 10, 11, and 12.
【請求項14】 音響時間信号情報を周波数成分に変換
する変換手段と、 上記変換手段から得られた周波数成分について、略臨界
帯域内の他の周波数成分の内、最小可聴限レベル又はマ
スキングスレッショールドレベルを越える周波数成分と
の間で属性の大きさの違いを変える属性変更手段とを有
し、 上記音響時間信号情報の特性を変換することを特徴とす
る信号変換装置。
14. A conversion means for converting acoustic time signal information into frequency components, and a minimum audible level or a masking threshold among other frequency components within a substantially critical band for the frequency components obtained from the conversion means. A signal conversion device for converting the characteristic of the acoustic time signal information, which has attribute changing means for changing the difference in the size of the attribute with the frequency component exceeding the drive level.
【請求項15】 音響時間信号情報を周波数成分に変換
する変換手段と、 上記変換手段から得られた周波数成分について、略臨界
帯域内の他の周波数成分の内、最小可聴限レベルとマス
キングスレッショールドレベルの大きいほうのレベルを
越える周波数成分との間で属性の大きさの違いを変える
属性変更手段とを有し、 上記音響時間信号情報の特性を変換することを特徴とす
る信号変換装置。
15. A converting means for converting acoustic time signal information into frequency components, and a minimum audible limit level and a masking threshold among other frequency components within a substantially critical band for the frequency components obtained from the converting means. A signal conversion device for converting the characteristics of the above-mentioned acoustic time signal information, comprising attribute changing means for changing the difference in the size of the attribute between the frequency component having a larger level and the frequency component having a larger level.
【請求項16】 音響時間信号情報を周波数成分に変換
する変換手段と、 上記変換手段から得られた周波数成分について、略臨界
帯域内の他の周波数成分の内、限定されたレベル範囲内
の周波数成分との間で属性の大きさの違いを変える属性
変更手段とを有し、 上記音響時間信号情報の特性を変換することを特徴とす
る信号変換装置。
16. A conversion means for converting acoustic time signal information into frequency components, and a frequency component obtained from said conversion means, within other frequency components within a substantially critical band, within a limited level range. A signal conversion apparatus, comprising: an attribute changing unit that changes a difference in attribute size between a component and the characteristic of the acoustic time signal information.
【請求項17】 上記属性変更手段では、量子化雑音レ
ベルにより限定されたレベル範囲内の周波数成分との間
で属性の大きさの違いを変えることを特徴とする請求項
16記載の信号変換装置。
17. The signal conversion apparatus according to claim 16, wherein the attribute changing means changes a difference in attribute size between a frequency component within a level range limited by a quantization noise level. .
【請求項18】 上記属性変更手段では、音響時間信号
情報から得られた複数の周波数成分の少なくとも一つの
ローカルピークについて、略臨界帯域内の他の周波数成
分との間で属性の大きさの違いを変えることを特徴とす
る請求項14、15、16、17記載の信号変換装置。
18. The attribute changing means has a difference in attribute size between at least one local peak of a plurality of frequency components obtained from the acoustic time signal information and other frequency components within a substantially critical band. 18. The signal conversion device according to claim 14, 15, 16, or 17, wherein:
【請求項19】 上記属性変更手段では、略臨界帯域幅
の10%から50%の周波数差を持つ周波数領域の他の
周波数成分との間で属性の大きさの違いを大きくするこ
とを特徴とする請求項14、15、16、17、18記
載の信号変換装置。
19. The attribute changing means increases the difference in attribute size between other frequency components having a frequency difference of 10% to 50% of the substantially critical bandwidth. The signal conversion device according to claim 14, 15, 16, 17, or 18.
【請求項20】 上記属性変更手段では、周波数成分か
ら得られる2箇の移動ピーク値の差により、周波数成分
の属性の大きさの違いを変える周波数領域を決定するこ
とを特徴とする請求項14、15、16、17、18、
19記載の信号変換装置。
20. The attribute changing means determines a frequency region in which a difference in attribute size of a frequency component is changed, based on a difference between two moving peak values obtained from the frequency component. , 15, 16, 17, 18,
19. The signal conversion device according to item 19.
【請求項21】 上記属性変更手段では、略臨界帯域幅
の50%幅の移動ピーク値から、略臨界帯域幅の10%
幅の移動ピーク値を引いた値が負の周波数領域の周波数
成分を小さくするか、削除することを特徴とする請求項
20記載の信号変換装置。
21. In the attribute changing means, from a moving peak value of 50% width of the substantially critical bandwidth, 10% of the substantially critical bandwidth is obtained.
21. The signal conversion apparatus according to claim 20, wherein a value obtained by subtracting the moving peak value of the width reduces or eliminates a frequency component in a negative frequency region.
【請求項22】 上記属性変更手段では、時間信号情報
の短時間エネルギを保存するように周波数成分の大きさ
を調整することを特徴とする請求項14、15、16、
17、18、19、20、21記載の信号変換装置。
22. The attribute changing means adjusts the magnitude of the frequency component so as to save the short time energy of the time signal information.
The signal conversion device described in 17, 18, 19, 20, and 21.
【請求項23】 上記属性変更手段では、時間信号情報
の短時間エネルギを保存するように少なくとも一つのロ
ーカルピークの周波数成分の大きさを調整することを特
徴とする請求項22記載の信号変換装置。
23. The signal conversion apparatus according to claim 22, wherein the attribute changing unit adjusts the magnitude of the frequency component of at least one local peak so as to preserve the short-term energy of the time signal information. .
【請求項24】 時間軸上に再合成された時間信号情報
をノイズシェイプ特性を有する再量子化処理手段を有す
ることを特徴とする請求項14、15、16、17、1
8、19、20、21、22、23記載の信号変換装
置。
24. The requantization processing means having a noise shape characteristic for re-synthesized time signal information on a time axis is provided.
The signal conversion device according to 8, 19, 20, 21, 22, 23.
【請求項25】 上記再量子化処理手段でのノイズシェ
イプ特性が最小可聴限、等ラウドネスもしくはマスキン
グ特性の少なくともひとつに依存していることを特徴と
する請求項24記載の信号変換装置。
25. The signal conversion device according to claim 24, wherein the noise shape characteristic in said requantization processing means depends on at least one of minimum audibility limit, equal loudness and masking characteristic.
【請求項26】 上記属性変更手段での前記属性が周波
数成分の大きさであることを特徴とする請求項14、1
5、16、17、18、19、20、21、22、2
3、24、25記載の信号変換装置。
26. The attribute of the attribute changing means is the magnitude of a frequency component.
5, 16, 17, 18, 19, 20, 21, 22, 2
The signal conversion device according to 3, 24, 25.
【請求項27】 請求項13記載の信号変換方法に応じ
て変換された変換データを記録してなることを特徴とす
る記録媒体。
27. A recording medium on which conversion data converted according to the signal conversion method according to claim 13 is recorded.
JP12786793A 1993-04-14 1993-04-30 Method and device for signal conversion and recording medium Pending JPH06318876A (en)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP12786793A JPH06318876A (en) 1993-04-30 1993-04-30 Method and device for signal conversion and recording medium
TW083103252A TW232116B (en) 1993-04-14 1994-04-12 Method or device and recording media for signal conversion
PCT/JP1994/000627 WO1994024666A1 (en) 1993-04-14 1994-04-14 Method and apparatus for transforming signals, and recording medium
EP94912684A EP0649137A4 (en) 1993-04-14 1994-04-14 Method and apparatus for transforming signals, and recording medium.
US08/351,386 US5737717A (en) 1993-04-14 1994-04-14 Method and apparatus for altering frequency components of a transformed signal, and a recording medium therefor
KR1019940704551A KR100310547B1 (en) 1993-04-14 1994-04-14 Signal converting method and apparatus, and recording medium
KR1019947004551A KR950702059A (en) 1993-04-14 1994-12-14 Signal transforming method, signal transforming apparatus, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP12786793A JPH06318876A (en) 1993-04-30 1993-04-30 Method and device for signal conversion and recording medium

Publications (1)

Publication Number Publication Date
JPH06318876A true JPH06318876A (en) 1994-11-15

Family

ID=14970618

Family Applications (1)

Application Number Title Priority Date Filing Date
JP12786793A Pending JPH06318876A (en) 1993-04-14 1993-04-30 Method and device for signal conversion and recording medium

Country Status (1)

Country Link
JP (1) JPH06318876A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014506686A (en) * 2011-02-10 2014-03-17 ヤフー! インコーポレイテッド Extracting and matching feature fingerprints from speech signals

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014506686A (en) * 2011-02-10 2014-03-17 ヤフー! インコーポレイテッド Extracting and matching feature fingerprints from speech signals

Similar Documents

Publication Publication Date Title
US5583967A (en) Apparatus for compressing a digital input signal with signal spectrum-dependent and noise spectrum-dependent quantizing bit allocation
JP3278900B2 (en) Data encoding apparatus and method
JP3765622B2 (en) Audio encoding / decoding system
WO1995013660A1 (en) Quantization apparatus, quantization method, high efficiency encoder, high efficiency encoding method, decoder, high efficiency encoder and recording media
JP2001142498A (en) Method and device for digital signal processing, method and device for digital signal recording, and recording medium
US6097880A (en) Digital signal processing method, digital signal processing apparatus, digital signal recording method, digital signal recording apparatus, recording medium, digital signal transmission method and digital signal transmission apparatus
US5754127A (en) Information encoding method and apparatus, and information decoding method and apparatus
US6366545B2 (en) Reproducing and recording apparatus, decoding apparatus, recording apparatus, reproducing and recording method, decoding method and recording method
KR100310547B1 (en) Signal converting method and apparatus, and recording medium
JP3557674B2 (en) High efficiency coding method and apparatus
US5642383A (en) Audio data coding method and audio data coding apparatus
JPH0846517A (en) High efficiency coding and decoding system
JP3186331B2 (en) Signal conversion method or apparatus, and recording medium
JP3225680B2 (en) Signal conversion method and apparatus, and recording medium
JPH06318876A (en) Method and device for signal conversion and recording medium
JP3291948B2 (en) High-efficiency encoding method and apparatus, and transmission medium
JP3879249B2 (en) Encoding method, decoding method, encoding device, decoding device, digital signal recording method, digital signal recording device, recording medium, digital signal transmission method, and digital signal transmission device
EP0649137A1 (en) Method and apparatus for transforming signals, and recording medium
JPH11330974A (en) Encoding method and device, decoding method and device, digital signal recording method and device, recording medium and digital transmitting method and device
JP3227948B2 (en) Decryption device
JP3227945B2 (en) Encoding device
JP3010663B2 (en) Noise shaping circuit
JPH07221649A (en) Method and device for encoding information, method and device for decoding information, information recording medium and information transmission method
JPH08237130A (en) Method and device for signal coding and recording medium
JPH08167247A (en) High-efficiency encoding method and device as well as transmission medium

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20010731