JP3225680B2 - 信号変換方法及び装置、並びに記録媒体 - Google Patents

信号変換方法及び装置、並びに記録媒体

Info

Publication number
JP3225680B2
JP3225680B2 JP8759293A JP8759293A JP3225680B2 JP 3225680 B2 JP3225680 B2 JP 3225680B2 JP 8759293 A JP8759293 A JP 8759293A JP 8759293 A JP8759293 A JP 8759293A JP 3225680 B2 JP3225680 B2 JP 3225680B2
Authority
JP
Japan
Prior art keywords
frequency
frequency component
signal
band
local peak
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP8759293A
Other languages
English (en)
Other versions
JPH06303103A (ja
Inventor
健三 赤桐
誠 阿久根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP8759293A priority Critical patent/JP3225680B2/ja
Priority to TW083103252A priority patent/TW232116B/zh
Priority to PCT/JP1994/000627 priority patent/WO1994024666A1/ja
Priority to EP94912684A priority patent/EP0649137A4/en
Priority to US08/351,386 priority patent/US5737717A/en
Priority to KR1019940704551A priority patent/KR100310547B1/ko
Publication of JPH06303103A publication Critical patent/JPH06303103A/ja
Priority to KR1019947004551A priority patent/KR950702059A/ko
Application granted granted Critical
Publication of JP3225680B2 publication Critical patent/JP3225680B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えばディジタルオー
ディオ機器に適用され、入力オーディオ信号に対して特
に聴覚の性質を用いて音質を変更する処理を施す、すな
わち、時間信号情報の特性を変換する信号変換方法又は
装置(時間信号情報特性変換方法及び装置)、並びにこ
れら方法又は装置により処理された情報が記録される記
録媒体に関するものである。
【0002】
【従来の技術】従来より、音響信号情報の音質を変化さ
せる手法としては、例えば、フィルタ処理によって周波
数特性を変更する方式や、高次高調波を発生させる方
式、若しくはいわゆるコンプレサによってダイナミック
レンジを変更するなどの方式が用いられている。
【0003】
【発明が解決しようとする課題】しかし、上記フィルタ
を用いる方式の場合は、例えば中域を増強することでプ
レゼンスを上げるなどのフィルタの使用の仕方を変える
ことで音質を変化させるものであり、高次高調波を発生
させる方式の場合は、聞きやすい音を得るというよりも
効果音的な使用に供されるものである。また、上記コン
プレサによってダイナミックレンジを変更する方式は、
大きい音が耳を痛めたり小さい音が周囲の雑音にマスク
されないようにするというものである。これらの方式で
は、瞬時瞬時で変わってゆく音響信号情報の変化に対応
して聴覚的に心地好く聞こえる音にする最適なコントロ
ールは困難である。
【0004】そこで、本発明は、上述のような実情に鑑
みて提案されたものであり、人間の聴覚に照らして音質
に関して意味のある音声又は音響信号の変換が可能な信
号変換方法及び装置、並びにこれら方法又は装置により
処理された情報が記録される記録媒体を提供することを
目的とするものである。
【0005】すなわち、本発明が解決しようとする課題
は、音響信号情報を聴覚的な原理を用いて瞬時瞬時に人
間にとって音質的に高品質に心地好く聞こえる音を作り
出す手法を与えることである。また、本発明の別の課題
は、既にディジタル化されて量子化雑音が付加されてし
まった音響信号情報からこの量子化雑音の聴覚的な影響
を減ずることにより、品質の向上を図ることである。ま
た、本発明の別の目的は、既にディジタル化されて量子
化雑音が付加されてしまったオーディオ信号情報からこ
の量子化雑音の聴覚的な影響を減じた後、本件出願人
が、先に、いわゆるコンパクトディスクのようなオーデ
ィオ機器の音質を向上させる技術として提案しているい
わゆる等ラウドネス特性やマスキング特性に合うように
量子化雑音のスペクトルを変更することによって聴感上
の雑音レベルを低減させる技術(以後この技術を例えば
スーパービットマッピング:Super Bit Mapping技術と呼
ぶことにする)、すなわち例えば特開平2−20812
号公報、特開平2−185552号公報、特開平2−1
85556号公報等に開示した技術を用いて、16ビッ
トの語長を持つコンパクトディスクに記録するとき、聴
覚的な処理によって音質を向上させたデータを作ること
にある。当該スーパービットマッピング技術は、16ビ
ットを越える語長を有するディジタル信号を16ビット
長を有するコンパクトディスクの為に再量子化する場
合、音質向上を図ることができる。さらに、本発明の一
つの課題は、既に量子化雑音が付加されてしまったオー
ディオ信号情報について、聴覚的に音質を等価的に16
ビット以上に一度向上させ、再び16ビットに再量子化
する際、聴覚的に重要な周波数帯域のS/Nを16ビッ
ト以上に保ったまま16ビットとすることで、音質の向
上を図ることである。
【0006】
【課題を解決するための手段】本発明の信号変換方法
は、上述の目的を達成するために提案されたものであ
り、音響時間信号情報を周波数に変換して得られる周波
数成分を用いて当該音響時間信号を変換する信号変換方
法において、周波数成分のローカルピークを少なくとも
一つ求め、上記ローカルピークと、聴覚特性に基づく略
臨界帯域内で当該ローカルピークと不協和性を示す周波
数成分との相対的な大きさを変更するようにしたもので
ある。また、本発明の信号変換装置は、上述の目的を達
成するために提案されたものであり、音響時間信号情報
を周波数に変換して得られる周波数成分を用いて当該音
響時間信号を変換する信号変換装置において、周波数成
分のローカルピークを少なくとも一つ求めるローカルピ
ーク検出手段と、上記ローカルピークと、聴覚特性に基
づく略臨界帯域内で当該ローカルピークと不協和性を示
す周波数成分との相対的な大きさを変更する周波数成分
変更手段とを有するものである。ここで、音響時間信号
情報から得られた周波数成分について、ローカルピーク
と、聴覚特性に基づく略臨界帯域内で当該ローカルピー
クと不協和性を示す周波数成分との相対的な大きさを変
更するようにする。また、周波数成分は複数であり、こ
れらのうちの少なくとも一つのローカルピークについ
て、当該ローカルピークと、聴覚特性に基づく略臨界帯
域内で当該ローカルピークと不協和性を示す周波数成分
との相対的な大きさを変更するようにする。このとき、
ローカルピークに対して不協和性を示す周波数成分とし
て、上記ローカルピークから略臨界帯域幅の10%から
50%の周波数差を持つ周波数成分を選択する。また、
例えば周波数成分サンプル数の異なる周波数成分の属性
の大きさの2つの移動ピーク値の差により、周波数成分
の相対的な大きさを変更する周波数領域を決定する。さ
らに、時間信号情報の短時間エネルギを保存するように
周波数成分の相対的な大きさを変更し、例えば当該時間
信号情報の短時間エネルギを保存するように少なくとも
一つのローカルピークの周波数成分の相対的な大きさを
変更する。また、ローカルピークに対して不協和性を示
す周波数成分として、略臨界帯域幅の50%幅の移動ピ
ーク値と略臨界帯域幅の10%幅の移動ピーク値との差
値が所定のスレッショールドを超える領域の周波数成分
を選択する。
【0007】すなわち、本発明の信号変換方法及び装置
は、入力音響時間信号をフィルタ処理若しくは直交変換
を用いることにより、周波数成分を得る。次に、これら
の周波数成分の隣接した成分毎の移動ピーク値を、臨界
帯域に関係した2つの異なる周波数幅で得て、この2種
類の移動ピーク値の差が生じる周波数帯域の周波数成分
の大きさを小さくすることにより、ローカルピーク周波
数成分と他の周波数成分との間の不協和度を低減させ
る。入力音響時間信号を周波数軸上に展開するにあたっ
ては、フィルタなどにより複数の周波数帯域の時間軸上
成分を得た後、直交変換等によるブロック化周波数分析
手法を用いるか、いわゆるQMF(Quadrature Mirror F
ilter)や、CQF(Conjugate Quadrature Filter)など
の帯域分割フィルタをツリー構造に従属接続することに
より、低域から高域にかけて、徐々に周波数分解能が低
下し、逆に時間分解能が向上する帯域分割を行う。
【0008】この時、低域の方が高域よりも長い時間の
ブロックでブロック化して直交変換若しくは時間軸上複
数サンプルのピーク値を取るようにしてもよい。ブロッ
クの周波数帯域幅及び時間幅は聴覚的に最適になるよう
に臨界帯域幅を充分満足する周波数分解能を与えるよう
にする。それぞれのブロックにおいて、分析により得ら
れているスペクトルは、その大きさと周波数により、マ
スキングスレッショールド(マスキングのしきい値)以
上か否かが判定され、マスキングスレッショールド以下
の場合には強さ,位相などの属性が変更されないように
する。このことは最小可聴限についても同様であり、最
小可聴限を下回る周波数成分については、たとえ移動ピ
ーク値の差がゼロではなくても変更しないようにする。
更に、以上のように処理した音響信号情報を前記スーパ
ービットマッピング処理することによってビット長を減
ずることは、限られた語長で記録再生伝送等を行う場合
に、聴感的な音質の劣化をできるだけ防ぐ上で有効であ
る。以上述べた様に本発明は、聴覚的な方法で音響信号
情報の周波数成分をコントロールすることにより上述の
課題を解決する。
【0009】また、本発明の記録媒体は、上記信号変換
方法に基づいて変換された変換データ(圧縮データ)が
記録されてなるものである。
【0010】
【作用】本発明によれば、聴覚的に裏付けのある臨界帯
域内の周波数成分間の調和関係をコントロールすること
で、音声及び音響信号の音質を人間にとって有益なよう
に調整することができる。また、マスキングスレッショ
ールド及び最小可聴限以下の周波数成分については変更
を加えないようにすることは、音質的に無関係な不必要
な処理をできるだけ行わず、接続歪みなど余計な副作用
を防ぐ上で有効である。さらに、コンパクトディスクに
記録されるディジタルサンプルデータが16ビットの語
長の分解能しかないにもかかわらず、聴覚的な周波数成
分の変更とスーパービットマッピング処理を組み合わせ
て16ビット音響信号情報を作りだしコンパクトディス
クなどに記録することは、既に量子化雑音が付加された
音響信号情報及び、聴覚的に望ましくない周波数成分を
含む音響信号情報をコンパクトディスク、ディジタルオ
ーディオテープ等に記録する上で有効である。
【0011】
【実施例】以下、本発明の実施例について図面を参照し
ながら説明する。
【0012】本発明の信号変換方法が適用される本実施
例の信号処理装置は、図1に示すように、音響時間信号
情報を複数の周波数成分に変換する変換手段としての後
述する帯域分割フィルタ2,3,4及びMDCT回路5
a,5b,5c,5dと、当該変換手段から得られた複
数の周波数成分の少なくとも一つのローカルピークにつ
いて、当該ローカルピークと、聴覚特性に基づく略臨界
帯域内で当該ローカルピークと不協和性を示す周波数成
分との相対的な大きさを変更する周波数成分変更手段と
しての後述する周波数成分変更回路6及びマスク回路1
0,周波数移動ピーク検出回路12,不協和周波数検出
回路11,マスキングスレッショールドカーブ検出回路
16,最小可聴カーブ発生回路17とを有するものであ
る。
【0013】先ず、図1は、本発明に係る信号変換方法
を実現する本実施例の信号処理装置の一実施例の概略構
成を示すブロック回路図である。以下、図1の具体的な
構成について説明する。
【0014】すなわち、本実施例の信号処理装置は、音
声若しくは音響信号情報(音響時間信号情報)等の入力
ディジタル信号を、複数の周波数帯域に分割すると共
に、最低域の隣接した2帯域の帯域幅は同じで、より高
い周波数帯域ではその内の高い周波数帯域ほどバンド幅
を広く選定し、各周波数帯域毎に直交変換を行って、得
られた周波数軸上のスペクトルデータから、周波数領域
の移動ピークカーブと周波数領域のマスキングカーブの
情報を求める。
【0015】上記周波数領域の移動ピークカーブの情報
からは、周波数成分間の調和関係から周波数成分を変更
することにより好ましい音質の変化が期待できる周波数
帯域を得る。また、周波数領域のマスキングカーブの情
報からは周波数領域の移動ピークカーブの情報から求ま
った周波数成分を変更することにより好ましい音質の変
化が期待できる周波数帯域のうち、マスキングにより実
質的に音質変化が期待できない周波数領域を求めて、周
波数成分を変化させる周波数帯域から除外する。最小可
聴限を下回る周波数成分についても変更の対象から除外
する。このようにして求められた周波数成分を変化させ
る周波数帯域内の周波数成分の大きさを小さくするか又
は除去する。
【0016】次に、周波数成分を逆直交変換して時間信
号情報を得、全帯域を合成フィルタでまとめることで全
帯域時間信号情報を得る。さらに、量子化を行うにあっ
たては、20kHz以下の帯域内の量子化雑音スペクト
ルを聴感的に最適化するスーパービットマッピング処理
を行う。
【0017】より詳細に図1において説明すると、入力
端子1には、例えばサンプリング周波数が44.1kH
zの時、0〜22kHzのオーデイオPCM信号が供給
されている。この入力信号は、例えばいわゆる上記CQ
F等の帯域分割フイルタ2により0〜11kHz帯域と
11k〜22kHz帯域とに分割され、0〜11kHz
帯域の信号は同じくCQFフイルタ等の帯域分割フイル
タ3により0〜5.5kHz帯域と5.5k〜11kH
z帯域とに分割される。更に0〜5.5kHz帯域の信
号は同じくCQF等の帯域分割フイルタ4により0〜
2.75kHz帯域と2.75〜5.5kHz帯域とに
分割される。
【0018】帯域分割フイルタ2からの11k〜22k
Hz帯域の信号は直交変換回路の一例であるMDCT
(モディファイド離散コサイン変換)回路5aに送ら
れ、帯域分割フイルタ3からの5.5k〜11kHz帯
域の信号はMDCT回路5bに送られ、帯域分割フイル
タ4からの2.75kHz〜5.5kHz帯域の信号は
MDCT回路5cに送られ、帯域分割フイルタ4からの
0kHz〜2.75kHz帯域の信号はMDCT回路5
dに送られることにより、それぞれMDCT処理され
る。もちろん、これら直交変換回路としては、上記MD
CT以外にも高速フーリエ変換(FFT),離散コサイ
ン変換(DCT)などの直交変換を用いることができ
る。
【0019】ここで、上述したような帯域分割フィルタ
による入力ディジタル信号を複数の周波数帯域に分割す
る手法としては、例えば、上記CQFなどのフィルタを
用いる手法があり、これは、例えば、 Mark J. T. Smit
h and Thomas P. Barnwell,"Exact Reconstruction Tec
hniques for Tree-Structured Subband Coders,"IEEE T
rans. ASSP, Vol ASSP-34 No 3, June 1986, pp. 434-4
41. に述べられている。また、1976 R.E.Crochiere Dig
ital coding of speech in subbands BellSyst.Tech.
J. Vol.55,No.8 1976 には、QMFなどのフィルタを用
いた手法が述べられている。更にICASSP 83,BOSTON Pol
yphase Quadrature filters-A newsubband coding tech
nique Joseph H. Rothweiler には等バンド幅のフィル
タ分割手法が述べられている。
【0020】また、上述した直交変換としては、例え
ば、入力オーディオ信号を所定単位時間(フレーム)で
ブロック化し、当該ブロック毎に例えば高速フーリエ変
換(FFT)、コサイン変換(DCT)、モディファイ
ドDCT変換(MDCT)等を行うことで、時間軸を周
波数軸に変換するような直交変換がある。上記MDCT
についてはICASSP 1987Subband/Transform Coding Usin
g Filter Bank DesignsBased on Time Domain Aliasing
Cancellation J.P.Princen A.B.Bradley Univ.of Surr
ey Royal Melbourne Inst.of Tech.に述べられている。
【0021】ここで、上記各MDCT回路5a、5b、
5c、5dに供給する各帯域毎のブロックについての標
準的な入力信号に対する具体例を図2に示す。
【0022】この図2の具体例において、上述した4つ
のフイルタ出力信号は、各帯域ごとに別々の直交変換ブ
ロックサイズを持ち、それぞれの周波数での臨界帯域幅
を充分満足するような周波数分析を行う。これにより周
波数が高くなるほど周波数分解能は低くなるが、その代
わりに時間分解能が向上する。本実施例では、周波数分
解は臨界帯域をそれぞれ略10分割する程度に選んでい
る。このことにより臨界帯域内の周波数成分の大きさの
コントロールが臨界帯域内周波数をかなり自由に限定し
て行うことができる様にしている。
【0023】すなわち、本実施例では、0Hzから2.
75kHzまでの帯域は、直交変換の時間ブロックサイ
ズを46.4msecとして、この帯域の最も狭い臨界
帯域幅100Hzの10分の1の概略10Hzの周波数
分解能が得られるようにしている。同様にして、2.7
5kHzから5.5kHz帯域は11.6msecの直
交変換の時間ブロックサイズを用いて40Hzの周波数
分解能を、5.5kHzから11kHz帯域は5.8m
secの直交変換の時間ブロックサイズを用いて80H
zの周波数分解能を、11kHzから22kHz帯域は
2.9msecの直交変換の時間ブロックサイズを用い
て160Hzの周波数分解能を得ている。なお、11k
Hzにおける臨界帯域幅は概略3kHzであるから、更
に直交変換ブロックサイズを半分にして320Hzの周
波数分解能とすることは時間分解能を更に上げるうえで
有効である。表1には臨界帯域の中心周波数と帯域幅を
示している。
【0024】
【表1】
【0025】再び図1に戻って、各MDCT回路5a,
5b,5c,5dにてMDCT処理されて得られた周波
数成分或いはMDCT係数データは、ローカルピーク周
波数成分と不協和の関係を持つ周波数成分の存在する周
波数領域を確定する周波数移動ピーク検出回路12及び
不協和周波数検出回路11と、マスキングスレショール
ドカーブを求めるマスキングスレショールドカーブ検出
回路16に供給される。
【0026】ここで、上記周波数移動ピーク検出回路1
2の動作を以下に説明する。図3においては、判り易い
ように、3個の隣接周波数成分に関する移動ピーク値の
取り方を説明している。
【0027】先ず、成分s1を中心とした移動ピーク値
は、当該成分s1とその両隣の成分を含めた各成分s
0,s1,s2の中の最大の大きさを持つ成分の大きさ
で移動ピーク値が定義される。次に、成分s2を中心と
した移動ピーク値は、当該成分s2とその両隣の成分を
含めた各成分s1,s2,s3の中の最大の大きさを持
つ成分の大きさで移動ピーク値が定義される。このよう
にして次々にピーク値を求めて行くことにより、移動ピ
ークカーブが得られる。
【0028】図3では判り易いように、周波数成分は全
て同じ帯域幅を持ち、且つ移動ピークを求めるときの周
波数幅も等しくして図示してあるが、本実施例では、図
4に示すように、高域になるに従い、周波数成分の持つ
帯域幅は広がり且つその周波数での臨界帯域幅の10%
若しくは50%幅の周波数幅での移動ピーク値が求めら
れる。なお、図4において、図中BE1〜BE4はそれ
ぞれ帯域を示し、図中曲線P10は臨界帯域幅の10%幅
の移動ピークカーブを、曲線P50は臨界帯域幅の50%
幅の移動ピークカーブを示し、曲線SDは周波数成分分
布を、CBは各周波数における臨界帯域幅を示してい
る。ここでもしもピーク値が重複して定義された周波数
帯域ではピーク値の大きいほうが選ばれる。
【0029】なお、上記臨界帯域幅は、協和性、雑音の
大きさの感覚、マスキング特性など人間の聴覚特性を良
く理解できる物理量であり、本発明に関しては協和性に
ついての説明を図5を用いて説明する。図5は2つの周
波数成分の周波数差が、横軸(臨界帯域幅で正規化され
た周波数を示す軸)に示された周波数だけあるとき、こ
の2つの周波数成分がどの程度の協和性もしくは不協和
性を示すかを縦軸に表している。この結果によれば、2
つの周波数成分の周波数差が、臨界帯域幅の10%から
50%までの間(不協和音帯域NHB)では不協和の感
覚が生じ(不協和音レベルNHL)、0%から10%及
び50%から100%の周波数差(協和音帯域HB)で
は協和の感覚が生じる(協和音レベルHL)。なお、こ
の臨界帯域幅は、前記表1のように高域ほど帯域幅が広
くなっている。
【0030】次に不協和帯域を検出する具体的手段を図
6を用いて説明する。図1における各MDCT回路5
a,5b,5c,5dにてMDCT処理されて得られた
周波数成分或いはMDCT係数データは、絶対値を取ら
れた後、図6に示す不協和帯域検出手段としての不協和
周波数検出回路11の入力端子41に与えられる。ここ
で、より長い時間幅を持つ低域側特性は、各高域時間に
共通に使用される。
【0031】上記入力端子41に与えられた周波数成分
から2つの異なった周波数幅を持った移動ピーク特性が
得られる。すなわち、臨界帯域幅の10%幅の移動ピー
ク値を与える臨界帯域幅の10%幅の移動ピーク検出回
路42と臨界帯域幅の50%幅の移動ピーク値を与える
臨界帯域幅の50%幅の移動ピーク検出回路43によっ
て2つの異なった周波数幅を持った移動ピーク特性が得
られる。
【0032】これら臨界帯域幅の10%幅の移動ピーク
値を与える臨界帯域幅の10%幅の移動ピーク検出回路
42と臨界帯域幅の50%幅の移動ピーク値を与える臨
界帯域幅の50%幅の移動ピーク検出回路43で得られ
た移動ピークカーブは、その差を差検出回路44によっ
て求められ、出力端子45から取り出される。
【0033】このようにして求められた移動ピーク値の
差が、あるスレッショールドを越える周波数領域を不協
和周波数領域と定義する。
【0034】しかしながら、その他の聴覚的効果すなわ
ちマスキング効果,等ラウドネス,最小可聴限を考える
とき、以上のようにして求められた不協和周波数領域に
含まれる周波数成分全てを操作の対象とする必要はな
い。すなわち、マスキング効果、等ラウドネス、最小可
聴限を考慮したときに、聴覚的に聞こえることがないと
判断される周波数成分は操作の対象から外してもほとん
ど影響がなく、また、等ラウドネスを考えたときに、効
果的である帯域のみを操作の対象とすることは演算量の
減少に役立つ。
【0035】図1におけるマスク機能を有するマスク回
路10、マスキングカーブ算出機能を有するマスキング
スレショールドカーブ検出回路16、最小可聴限情報を
記憶する最小可聴カーブ発生回路17は、以上説明した
様に、マスキング効果、最小可聴限を考慮したときに、
聴覚的に聞こえることがないと判断される周波数成分を
操作の対象から外す為に用いられる。
【0036】以下、より詳細に上記マスク回路10での
マスク機能と、マスキングスレショールドカーブ検出回
路16でのマスキングカーブ算出機能と、最小可聴カー
ブ発生回路17での最小可聴限記憶機能につき説明す
る。
【0037】図7は上記マスキングスレショールドカー
ブ検出回路16でのマスキングカーブ算出機能の一具体
例の概略構成を示すブロック回路図である。この図7に
おいて、入力端子71には、図1における各MDCT回
路5a,5b,5c,5dからの周波数成分データが供
給されている。
【0038】この周波数軸上の入力データは、臨界帯域
毎のエネルギ算出回路72に送られて、ここで各臨界帯
域のエネルギが、各臨界帯域内の周波数成分の各振幅値
の総和を計算することにより求められる。この各臨界地
域毎のエネルギの代わりに、振幅値のピーク値、平均値
等が用いられることもある。このエネルギ算出回路72
からの出力として、例えば各バンドの総和値のスペクト
ルを図8に図中SBとして示している。ただし、この図
8では、図示を簡略化するため、分割帯域数を12バン
ド(B1 〜B12)で表現している。
【0039】ここで、上記スペクトルSBのいわゆるマ
スキングに於ける影響を考慮するために、該スペクトル
SBに所定の重み付け関数を掛けて加算するような畳込
み(コンボリユーション)処理を施す。このため、上記
帯域毎のエネルギ算出回路72の出力すなわち該スペク
トルSBの各値は、畳込みフイルタ回路73に送られ
る。該畳込みフイルタ回路73は、例えば、入力データ
を順次遅延させる複数の遅延素子と、これら遅延素子か
らの出力にフイルタ係数(重み付け関数)を乗算する複
数の乗算器(例えば各バンドに対応する25個の乗算
器)と、各乗算器出力の総和をとる総和加算器とから構
成されるものである。この畳込み処理により、例えば図
8のB6で示されるバンドのスペクトルSBに対しては
図8の図中点線で示す部分の総和がとられる。なお、上
記マスキングとは、人間の聴覚上の特性により、ある信
号によって他の信号がマスクされて聞こえなくなる現象
をいうものであり、このマスキング効果には、時間軸上
のオーデイオ信号による継時マスキング効果と、周波数
軸上の信号による同時刻マスキング効果とがある。これ
らのマスキング効果により、マスキングされる部分に信
号情報もしくはノイズがあったとしても、これらは聞こ
えないことになる。このため、実際のオーデイオ信号で
は、このマスキングされる範囲内の信号情報及びノイズ
は操作対象とする必要がない。
【0040】なお、上記畳込みフイルタ回路73の各乗
算器の乗算係数(フイルタ係数)の一具体例を示すと、
任意のバンドに対応する乗算器Mの係数を1とすると
き、乗算器M−1で係数0.15を、乗算器M−2で係
数0.0019を、乗算器M−3で係数0.00000
86を、乗算器M+1で係数0.4を、乗算器M+2で
係数0.06を、乗算器M+3で係数0.007を各遅
延素子の出力に乗算することにより、上記スペクトルS
Bの畳込み処理が行われる。ただし、Mは1〜25の任
意の整数である。
【0041】次に、上記畳込みフイルタ回路73の出力
は引算器74に送られる。該引算器74は、上記畳込ん
だ領域での後述する操作対象から外すことが可能な信号
情報もしくはノイズレベルに対応するレベルαを求める
ものである。なお、当該操作対象から外すことが可能な
信号情報もしくはノイズレベルに対応するレベルαは、
後述するように、逆コンボリユーション処理を行うこと
によって、クリテイカルバンド(臨界帯域幅)の各バン
ド毎の操作対象から外すことが可能な信号情報もしくは
ノイズレベルとなるようなレベルである。ここで、上記
引算器74には、上記レベルαを求めるための許容関数
(マスキングレベルを表現する関数)が供給される。こ
の許容関数を増減させることで上記レベルαの制御を行
っている。当該許容関数は、次に説明するような(n−
ai)関数発生回路75から供給されているものであ
る。
【0042】すなわち、操作対象から外すことが可能な
信号情報もしくはノイズレベルに対応するレベルαは、
臨界帯域の帯域の低域から順に与えられる番号をiとす
ると、次の(1)式で求めることができる。 α=S−(n−ai) ・・・(1) この(1)式において、n,aは定数でa>0、Sは畳
込み処理されたバークスペクトルの強度であり、(1)
式中(n-ai)が許容関数となる。本実施例ではn=38,
a=1としている。
【0043】このようにして、上記レベルαが求めら
れ、このデータは、割算器76に伝送される。当該割算
器76では、上記畳込みされた領域での上記レベルαを
逆コンボリユーションするためのものである。したがっ
て、この逆コンボリユーション処理を行うことにより、
上記レベルαからマスキングスペクトルが得られるよう
になる。すなわち、このマスキングスペクトルが、操作
対象から外すことが可能な信号情報もしくはノイズスペ
クトルとなる。
【0044】なお、上記逆コンボリユーション処理は、
複雑な演算を必要とするが、本実施例では簡略化した割
算器76を用いて逆コンボリユーションを行っている。
【0045】次に、上記マスキングスペクトルは、合成
回路77を介して減算器78に伝送される。ここで、当
該減算器78には、上記臨界帯域毎のエネルギ検出回路
72からの出力、すなわち前述したスペクトルSBが、
遅延回路79を介して供給されている。したがって、こ
の減算器78で上記マスキングスペクトルとスペクトル
SBとの減算演算が行われることで、図9に示すよう
に、上記スペクトルSBは、該マスキングスペクトルM
Sのレベルで示すレベル以下がマスキングされることに
なる。
【0046】当該減算器78からの出力は、操作対象か
ら外すことが可能な信号情報若しくはノイズレベル補正
回路(図示は省略している)を介し、出力端子81を介
して取り出され、上記マスク回路10に送られて、ここ
で不協和周波数領域のうちで操作対象から外すことが可
能な周波数領域を除外する。
【0047】なお、遅延回路79は上記合成回路77以
前の各回路での遅延量を考慮してエネルギ検出回路72
からのスペクトルSBを遅延させるために設けられてい
る。
【0048】ところで、上述した合成回路77での合成
の際には、最小可聴カーブ発生回路17から供給される
図10に示すような人間の聴覚特性であるいわゆる最小
可聴限カーブRCを示すデータと、上記マスキングスペ
クトルMSとを合成することができる。この最小可聴カ
ーブにおいて、信号もしくは雑音絶対レベルがこの最小
可聴限カーブ以下ならば該信号及び雑音は聞こえないこ
とになる。この最小可聴限カーブは、例えば再生時の再
生ボリュームの違いで異なるものとなるが、現実的なデ
ィジタルシステムでは、例えば16ビットダイナミック
レンジへの音楽のはいり方にはさほど違いがないので、
例えば4kHz付近の最も耳に聞こえやすい周波数帯域
の量子化雑音が聞こえないとすれば、他の周波数帯域で
はこの最小可聴限カーブのレベル以下の量子化雑音は聞
こえないと考えられる。したがって、このように例えば
システムの持つワードレングスの4kHz付近の雑音が
聞こえない使い方をすると仮定し、この最小可聴限カー
ブRCとマスキングスペクトルMSとを共に合成するこ
とで、操作対象から外すことが可能な信号情報もしくは
ノイズレベルを得るようにすると、この場合の操作対象
から外すことが可能な信号情報もしくはノイズレベル
は、図10中の斜線で示す部分までとすることができる
ようになる。
【0049】なお、本実施例では、上記最小可聴限カー
ブの4kHzのレベルを、例えば20ビット相当の最低
レベルに合わせている。また、この図10は、信号スペ
クトルSSも同時に示している。
【0050】また、上記操作対象から外すことが可能な
信号情報もしくはノイズレベル補正回路では、図示を省
略する補正情報出力回路から送られてくる例えば等ラウ
ドネスカーブの情報に基づいて、上記減算器78からの
出力における操作対象から外すことが可能な信号情報も
しくはノイズレベルを補正している。ここで、等ラウド
ネスカーブとは、人間の聴覚特性に関する特性曲線であ
り、例えば1kHzの純音と同じ大きさに聞こえる各周
波数での音の音圧を求めて曲線で結んだもので、ラウド
ネスの等感度曲線とも呼ばれる。またこの等ラウドネス
曲線は、図10に示した最小可聴カーブRCと略同じ曲
線を描くものである。この等ラウドネス曲線において
は、例えば4kHz付近では1kHzのところより音圧
が8〜10dB下がっても1kHzと同じ大きさに聞こ
え、逆に、10kHz付近では1kHzでの音圧よりも
約15dB高くないと同じ大きさに聞こえない。このた
め、上記最小可聴カーブのレベルを越えた信号もしくは
雑音は、該等ラウドネス曲線に応じたカーブで与えられ
る周波数特性でその大きさを評価されるのが良いことが
わかる。このようなことから、上記等ラウドネス曲線を
考慮して、演算量を削減するために操作対象から外すこ
とが可能な信号情報もしくはノイズを選定することは、
人間の聴覚特性に適合していることがわかる。
【0051】図1に戻って、上記マスク回路10は、以
上に説明した聴覚的効果を用いて、不必要な周波数帯域
での周波数成分の変更を行わないようにする。このマス
ク回路10は出力としてローカルピーク成分との間で不
協和な関係を持つ周波数成分のうち聴覚的な音質向上に
効果的な操作が得られる成分情報を出す。図1の周波数
成分変更回路6は、この情報を基にして対象となる周波
数成分の大きさを変更する。
【0052】図11には、上記周波数成分変更回路6に
おいて周波数成分の大きさを変更する様子を示してい
る。この図11において、図中Band1〜Band4はマスク
回路10により指定された周波数成分の大きさを変更す
る周波数領域であり、その変更の程度は各バンドの中央
部ほど大きくなっている。これは前記図5に示された不
協和度が周波数差により異なることを利用したものであ
る。また、図中Sp1〜Sp4は、各ローカルピークス
ペクトルの位置の利得を表しており、不協和周波数帯域
の周波数成分が小さくなったことにより、全体のエネル
ギが減少することを補償するためにこの周波数位置のス
ペクトルの大きさを大きくすることを示している。
【0053】このようにして周波数成分の大きさを変更
した周波数成分変更回路6の出力は、前記MDCTの逆
変換を行うIMDCT回路9a,9b,9c,9dによ
って、周波数軸上から時間軸上へと変換される。これら
IMDCT回路9a,9b,9c,9dからのIMDC
T出力信号は、前記CQFとは逆の周波数合成(ICQ
F)機能を有する帯域合成フィルタ13,14,15に
より周波数合成され全帯域時間信号となる。
【0054】これら帯域合成フィルタ13,14,15
による全帯域信号は、周波数成分の変更によってダイナ
ミックレンジが、元の入力信号情報に比較して大きくな
っていることがあるので、コンパクトディスクに記録す
る場合には、16ビットへの再量子化が必要となること
がある。なお、本件出願人は、先に、入力されたディジ
タルオーデイオ信号をオーディオ帯域内でのノイズシェ
イピングによって等ラウドネス特性に近いノイズ周波数
特性を与える再量子化を行いコンパクトディスクに16
ビット再量子化信号を記録するような技術を、例えば前
述の特開平2−20812号公報、特開平2−1855
52号公報、特開平2−185556号公報にて開示し
ている。
【0055】本発明ではこのような場合、本発明によっ
て処理された信号を更に上記ノイズシェイピングするこ
とによって16ビットを越える特性をもつコンパクトデ
ィスク記録信号を得ることができる。
【0056】以下、図1において上記ノイズシェイピン
グを行うノイズシェイパの動作を説明する。上記帯域合
成フィルタ15から加算回路18に供給された信号は、
帰還フィルタ21の出力信号との差をとられる。加算回
路18の出力は再量子化器19及び第2の加算回路20
に供給される。再量子化器19は、入力信号語長よりも
少ない語長で出力されることで少ない情報量で信号を伝
送記録等を行おうとするものである。この再量子化器1
9の出力は当該ノイズシェイパの出力端子22及び第2
の加算回路20に供給される。第2の加算回路20は再
量子化器19の入力及び出力の信号の差を得るものであ
り、出力として量子化誤差が抽出される。第2の加算回
路20の出力は帰還フィルタ21に供給される。
【0057】ここで、当該帰還フィルタ21について図
12にて詳細に説明する。この図12において、端子5
0を介して帰還フィルタ21に供給された信号は、遅延
素子52,53,54,55の直列回路に順次シフトし
てゆく。各遅延素子52,53,54,55の出力は、
乗算素子56,57,58,59と接続されており、こ
れら乗算素子56,57,58,59において各対応す
る係数入力端子62,63,64,65から供給される
フィルタ係数との積がとられる。これらの乗算素子5
6,57,58,59の出力は、加算素子60で加算さ
れて帰還フィルタの出力端子61に導かれる。
【0058】以上の加算回路18、再量子化器19、第
2の加算回路20、及び帰還フイルタ21より構成され
るノイズシェイパによって等ラウドネス特性に近いノイ
ズ周波数特性が与えられたディジタルオーデイオ信号
は、出力端子22より出力される。この出力信号は、所
定の誤り訂正処理等がなされ、記録媒体(光磁気ディス
ク、半導体メモリ、ICメモリーカード、光ディスク)
に記録される。
【0059】なお、本発明は上記実施例のみに限定され
るものではなく、画像信号情報などにも適用できる。
【0060】
【発明の効果】本発明によれば、上述したようなことか
ら、音響時間信号情報を聴覚的な原理を用いて瞬時瞬時
に人間にとって音質的に高品質に心地好く聞こえる音を
作り出すことができる。また、既にディジタル化されて
量子化雑音が付加した音響時間信号情報から量子化雑音
の聴覚的な影響を減ずることにより、品質の向上を図る
ことができ、既にディジタル化されて量子化雑音が付加
されたオーディオ信号情報から量子化雑音の聴覚的な影
響を減じた後、コンパクトディスクのようなオーディオ
機器の音質を向上させる技術として例えば等ラウドネス
特性やマスキング特性に合うように量子化雑音のスペク
トルを変更することによって聴感上の雑音レベルを低減
させる技術を用いて、16ビットの語長を持つコンパク
トディスクに記録するときに、聴覚的な処理によって音
質を向上させたデータを作ることができる。これによ
り、16ビットを越える語長を有するディジタル信号を
16ビット長を有するコンパクトディスクの為に再量子
化する場合、音質向上を図ることができる。さらに、本
発明によれば、既に量子化雑音が付加されたオーディオ
信号情報について、聴覚的に音質を等価的に16ビット
以上に一度向上させ、再び16ビットに再量子化する
際、聴覚的に重要な周波数帯域のS/Nを16ビット以
上に保ったまま16ビットとすることで、音質の向上を
図ることが可能となる。
【図面の簡単な説明】
【図1】本発明の信号処理方法(時間信号情報特性変更
方法)を実現する本実施例の信号処理装置(時間信号情
報特性変更装置)の概略構成例を示すブロック回路図で
ある。
【図2】本発明に係る各帯域毎の時間ブロックを示す図
である。
【図3】本発明に係る周波数移動ピークを示す図であ
る。
【図4】本発明に係る周波数移動ピーク周波数特性の例
を示す図である。
【図5】協和度と臨界帯域の関係を示す図である。
【図6】本発明実施例装置の不協和帯域検出回路の構成
例を示すブロック回路図である。
【図7】本実施例装置のマスキングスレッショールドカ
ーブ検出回路の構成例を示すブロック回路図である。
【図8】各臨界帯域の信号成分の総和値を示す図であ
る。
【図9】各臨界帯域の信号成分の総和値とマスキングス
レショールドを示す図である。
【図10】各臨界帯域の信号成分の総和値とマスキング
スレショールド、最小可聴限を示す図である。
【図11】周波数成分の大きさを変える例を示す図であ
る。
【図12】ノイズシェーピングの為の帰還フィルタの構
成例を示す図である。
【符号の説明】
1,41,71・・・入力端子 2,3,4・・・・・帯域分割フィルタ(CQF) 5a,5b,5c,5d・・・・MDCT回路 6・・・・・・・・・周波数成分変更回路 10・・・・・・・・マスク回路 11・・・・・・・・不協和周波数検出回路 12・・・・・・・・周波数移動ピーク検出回路 13,14,15・・帯域合成フィルタ 16・・・・・・・・マスキングスレッショールドカー
ブ検出回路16 17・・・・・・・・最小可聴カーブ発生回路 18,20・・・・・加算回路 19・・・・・・・・再量子化器 21・・・・・・・・帰還フィルタ 22,45,61,81・・・出力端子 42・・・・・・・・臨界帯域の10%幅の移動ピーク
検出回路 43・・・・・・・・臨界帯域の50%幅の移動ピーク
検出回路 44・・・・・・・・差検出回路 52,53,54,55・・・遅延素子 56,57,58,59・・・乗算素子 60・・・・・・・・加算素子 72・・・・・・・・臨界帯域のエネルギ算出回路 73・・・・・・・・畳み込みフィルタ回路 75・・・・・・・・関数発生回路 74・・・・・・・・引算器 76・・・・・・・・割算器 77・・・・・・・・合成回路 78・・・・・・・・減算回路
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) H03M 7/30 G10L 13/00

Claims (8)

    (57)【特許請求の範囲】
  1. 【請求項1】 音響時間信号情報を周波数に変換して得
    られる周波数成分を用いて当該音響時間信号を変換する
    信号変換方法において、 周波数成分のローカルピークを少なくとも一つ求め、上記ローカルピークと、 聴覚特性に基づく略臨界帯域内
    当該ローカルピークと不協和性を示す周波数成分との
    相対的な大きさを変更することを特徴とする信号変換方
    法。
  2. 【請求項2】 音響時間信号情報を周波数に変換して得
    られる周波数成分を用いて当該音響時間信号を変換する
    信号変換装置において、 周波数成分のローカルピークを少なくとも一つ求めるロ
    ーカルピーク検出手段と、上記ローカルピークと、 聴覚特性に基づく略臨界帯域内
    当該ローカルピークと不協和性を示す周波数成分との
    相対的な大きさを変更する周波数成分変更手段とを有す
    ることを特徴とする信号変換装置。
  3. 【請求項3】 上記周波数成分変更手段は、上記ローカ
    ルピークに対して不協和性を示す周波数成分として、上
    記ローカルピークから略臨界帯域幅の10%から50%
    の周波数差を持つ周波数成分を選択することを特徴とす
    る請求項2記載の信号変換装置。
  4. 【請求項4】 上記周波数成分変更手段は、異なる周波
    数幅で求めた2つの移動ピーク値の差により、上記ロー
    カルピークと不協和性を示す周波数成分の領域を決定す
    ることを特徴とする請求項2記載の信号変換装置。
  5. 【請求項5】 上記周波数成分変更手段は、時間信号情
    報の短時間エネルギを保存するように周波数成分の相対
    的な大きさを変更することを特徴とする請求項2記載の
    信号変換装置。
  6. 【請求項6】 上記周波数成分変更手段は、時間信号情
    報の短時間エネルギを保存するように少なくとも一つの
    ローカルピークの周波数成分の大きさを変更することを
    特徴とする請求項5記載の信号変換装置。
  7. 【請求項7】 上記周波数成分変更手段は、上記ローカ
    ルピークと不協和性を示す周波数成分として、略臨界帯
    域幅の50%幅の移動ピーク値略臨界帯域幅の10%
    幅の移動ピーク値との差が所定のスレッショールドを超
    える領域の周波数成分を選択することを特徴とする請求
    項2記載の信号変換装置。
  8. 【請求項8】 請求項記載の信号変換方法に基づいて
    変換された変換データを記録してなることを特徴とする
    記録媒体。
JP8759293A 1993-04-14 1993-04-14 信号変換方法及び装置、並びに記録媒体 Expired - Fee Related JP3225680B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP8759293A JP3225680B2 (ja) 1993-04-14 1993-04-14 信号変換方法及び装置、並びに記録媒体
TW083103252A TW232116B (en) 1993-04-14 1994-04-12 Method or device and recording media for signal conversion
EP94912684A EP0649137A4 (en) 1993-04-14 1994-04-14 SIGNAL TRANSFORMATION METHOD AND APPARATUS AND RECORDING MEDIUM.
US08/351,386 US5737717A (en) 1993-04-14 1994-04-14 Method and apparatus for altering frequency components of a transformed signal, and a recording medium therefor
PCT/JP1994/000627 WO1994024666A1 (en) 1993-04-14 1994-04-14 Method and apparatus for transforming signals, and recording medium
KR1019940704551A KR100310547B1 (ko) 1993-04-14 1994-04-14 신호변환방법및장치와,기록매체
KR1019947004551A KR950702059A (ko) 1993-04-14 1994-12-14 신호 변환 방법 및 장치와 기록 매체(Signal transforming method, signal transforming apparatus, and recording medium)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8759293A JP3225680B2 (ja) 1993-04-14 1993-04-14 信号変換方法及び装置、並びに記録媒体

Publications (2)

Publication Number Publication Date
JPH06303103A JPH06303103A (ja) 1994-10-28
JP3225680B2 true JP3225680B2 (ja) 2001-11-05

Family

ID=13919273

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8759293A Expired - Fee Related JP3225680B2 (ja) 1993-04-14 1993-04-14 信号変換方法及び装置、並びに記録媒体

Country Status (1)

Country Link
JP (1) JP3225680B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106601268B (zh) * 2016-12-26 2020-11-27 腾讯音乐娱乐(深圳)有限公司 一种多媒体数据处理方法及装置

Also Published As

Publication number Publication date
JPH06303103A (ja) 1994-10-28

Similar Documents

Publication Publication Date Title
US5553193A (en) Bit allocation method and device for digital audio signals using aural characteristics and signal intensities
CA2088202C (en) Apparatus and method for data compression using signal-weighted quantizing bit allocation
US5621856A (en) Digital encoder with dynamic quantization bit allocation
US5583967A (en) Apparatus for compressing a digital input signal with signal spectrum-dependent and noise spectrum-dependent quantizing bit allocation
US5752224A (en) Information encoding method and apparatus, information decoding method and apparatus information transmission method and information recording medium
JP3765622B2 (ja) オーディオ符号化復号化システム
US6097880A (en) Digital signal processing method, digital signal processing apparatus, digital signal recording method, digital signal recording apparatus, recording medium, digital signal transmission method and digital signal transmission apparatus
JP2001142498A (ja) ディジタル信号処理装置および処理方法、ディジタル信号記録装置および記録方法、並びに記録媒体
US5754127A (en) Information encoding method and apparatus, and information decoding method and apparatus
KR100556505B1 (ko) 재생 및 기록 장치, 디코딩 장치, 기록 장치, 재생 및 기록 방법, 디코딩 방법, 및 기록 방법
US6167093A (en) Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission
KR100310547B1 (ko) 신호변환방법및장치와,기록매체
JP3557674B2 (ja) 高能率符号化方法及び装置
US5642383A (en) Audio data coding method and audio data coding apparatus
JP3186331B2 (ja) 信号変換方法又は装置、並びに記録媒体
JP3225680B2 (ja) 信号変換方法及び装置、並びに記録媒体
JP3291948B2 (ja) 高能率符号化方法及び装置、並びに伝送媒体
JPH06318876A (ja) 信号変換方法及び装置、並びに記録媒体
JP3879249B2 (ja) エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置
EP0649137A1 (en) Method and apparatus for transforming signals, and recording medium
JPH11330974A (ja) エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置
JP3227948B2 (ja) 復号化装置
JP3227945B2 (ja) 符号化装置
JPH06324093A (ja) オーディオ信号のスペクトル表示装置
JP3513879B2 (ja) 情報符号化方法及び情報復号化方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010731

LAPS Cancellation because of no payment of annual fees