JP3925993B2

JP3925993B2 - 信号処理装置

Info

Publication number: JP3925993B2
Application number: JP23341697A
Authority: JP
Inventors: 吉彦竹中; 純一今村
Original assignee: Pioneer Corp
Current assignee: Pioneer Corp
Priority date: 1997-08-29
Filing date: 1997-08-29
Publication date: 2007-06-06
Anticipated expiration: 2017-08-29
Also published as: EP0899892A3; JPH1173726A; DE69828849T2; EP0899892B1; EP0899892A2; US6034315A; DE69828849D1

Description

【０００１】
【発明の属する技術分野】
本発明はミニディスク（Mini Disc、以下「ＭＤ」という。）に関し、より詳細にはＭＤへのオーディオ信号の記録時における信号処理に関する。
【０００２】
【従来の技術】
ＭＤにおいては、コンパクトディスク（Compact Disc、以下「ＣＤ」という。）に比べて情報を約１／５に圧縮するために、ＡＴＲＡＣ（Adaptive TRansform Acoustic Coding）と呼ばれるオーディオデータ高能率符号化方式を採用している。ＡＴＲＡＣにおける考え方は、人間の聴覚特性を考慮し、人間が感知できないような信号の冗長部分を除去して圧縮を行うというものである。言い換えれば、元信号と圧縮後の信号に差異が生じる（即ち、量子化雑音が生じる）ことを前提とし、その雑音を人間が感知できないように制御しつつ圧縮を行うのである。
【０００３】
具体的には、ＡＴＲＡＣでは人間の聴覚上の性質に関連する等ラウドネス特性（最小可聴限曲線）やマスキング効果などを利用して高能率符号化を行う。これについて例を挙げて説明する。図７（Ａ）において、曲線１００は最小可聴限曲線を示し、この曲線より下側のレベルの音は人間の耳には聞こえないとされる。いま、入力信号に図中の音Ａ及び音Ｂが含まれているとすると、音Ｂは人間の耳に聞こえるが、音Ａは最小可聴限曲線の下側に位置するので人間の耳には聞こえない。従って、ＡＴＲＡＣではこの音Ｂは有効な信号として記録するが、音Ａは記録を行わない（間引いてしまう）。或いは、量子化ビット配分を極端に減少させて符号化を行う。
【０００４】
図７（Ｂ）には、最小可聴限曲線１００に加え、音Ｃによるマスキング特性１１０を示す。音Ｂは最小可聴限特性１００より上側に位置するが、その近傍にある音Ｃによりマスクされて人間の耳には聞こえない。従って、ＡＴＲＡＣでは音Ｂも冗長部分として取り除いて圧縮を行う。
【０００５】
【発明が解決しようとする課題】
上述のように、ＡＴＲＡＣにおける信号圧縮の手法は、圧縮処理におけるパラメータである最小可聴限曲線、マスキング特性などをどのように設定するかに依存する。この点、従来においてはこれらそれぞれについて、予め決定された一つの特性のみを使用してＡＴＲＡＣによる符号化を行うのが一般的であった。
【０００６】
しかし、ＡＴＲＡＣにより圧縮符号化を行う際に使用する最小可聴限曲線やマスキング特性の設定に依存して、記録される信号、即ち音楽の感じはかなり異なったものとなる。従って、種々のジャンル、曲調の音楽を一つの特性のみを使用して記録すると、原音（原曲）に対して必ずしも最適の圧縮符号化がされるとは限らず、記録、再生した曲に迫力が感じられない、高域が耳障りであるなどというように曲に合った記録ができないことが生じうる。
【０００７】
本発明は、以上の点に鑑みてなされたものであり、記録する曲の曲調に応じて最適な特性を使用して圧縮符号化を行うことが可能な音楽信号の信号処理装置を提供することを課題とする。
【０００８】
【課題を解決するための手段】
上記課題を解決するため、請求項１に記載の発明は、信号処理装置において、入力デジタルオーディオ信号からスペクトル信号を生成し、生成されたスペクトル信号を、圧縮符号化する符号化手段と、前記入力デジタルオーディオ信号から、前記入力デジタルオーディオ信号を複数の帯域に分割する帯域分割手段と、帯域分割された各々の帯域の信号のピークレベルを検出する手段と、検出されたピークレベルの変動に基づきその信号により構成される曲の曲調を判断する判断手段と、を具備する特性制御手段と、を備え、前記符号化手段は前記特性制御手段により判断される前記曲調に基づき、前記帯域分割された周波数帯域毎に最小可聴限曲線の選択、または前記帯域分割された周波数帯域毎にマスキング特性の緩急の選択、をして符号化を行うように構成する。
【０００９】
上記のように構成された信号処理装置によれば、入力デジタルオーディオ信号は符号化手段に入力されてスペクトル信号に変換され、その後圧縮のための特性に基づいて圧縮符号化される。一方、入力デジタルオーディオ信号は特性制御手段にも入力され、その信号により構成される曲の曲調が判断される。特性制御手段は、判断した曲調に応じて、あるパラメータについて予め用意された複数の特性からその曲調に最適な特性を選択する。符号化手段は、こうして曲調制御手段により選択された特性に基づいて、その曲調に適合した圧縮符号化を行う。
上記のように構成された情報処理装置によれば、入力デジタルオーディオ信号は帯域分割手段により複数の帯域に分割され、それぞれの帯域についてピークレベルが検出され、検出されたピークレベルに基づいて曲調が判断される。
上記のように構成された信号処理装置によれば、入力オーディオ信号の曲調に応じて選択された最適な最小可聴限特性、マスキング特性に基づいてエンコーダによる符号化が実行される。
【００１０】
請求項２記載の発明は、請求項１記載の信号処理装置において、前記特性制御手段は、継続的に曲調の判断を行い、リアルタイムで前記特性の選択を行うように構成する。
【００１１】
上記のように構成された信号処理装置によれば、入力信号の符号化中にリアルタイムで曲調が判断され、特性が選択される。即ち、入力オーディオ信号の曲調に応じて適宜特性が変更されながら圧縮符号化が行われるので、一つの曲中などにおいても曲調の変化に追従して最適な特性を使用して符号化が達成される。
【００１６】
【発明の実施の形態】
以下、図面を参照して本発明の好適な実施の形態について説明する。
【００１７】
原理説明
まず、本発明の原理について簡単に説明する。前述のように、ＡＴＲＡＣによる符号化においては、符号化の際に使用するパラメータ、具体的には、最小可聴限曲線、マスキング特性、符号化すべき信号を時間的に切り分ける際の時間幅（後述のサウンドグループ）などを実際にどう設定するかが重要であり、その設定により記録される音楽の感じもかなり異なってくる。この点に鑑み、本発明では記録されるべき音楽信号の曲調をリアルタイムで分析、判断し、その結果に応じて、各パラメータ毎にその音楽信号の符号化に最適な特性を予め用意された複数の特性から選択して使用するように構成する。これにより、記録される音楽の種類、曲調に応じた最適な特性を使用して最適な圧縮符号化が可能となる。
【００１８】
ＭＤ記録装置
次に、本発明の好適な実施形態について図面を参照して説明する。図１は、本発明の実施形態に係るＭＤ記録装置１の信号処理系を示すブロック図である。
【００１９】
ＭＤ記録装置１において、ＭＤディスク１８に記録されるべき入力信号Ｓ1はＡ／Ｄ変換器８に入力され、サンプリング周波数４４．１ｋＨｚ、１６から２０ビットで標本化、量子化されてデジタル信号Ｓ2として出力される。デジタル信号Ｓ2は、ＡＴＲＡＣエンコーダ１０及び曲調分析部１２へ送られる。
【００２０】
図２に曲調分析部１２の構成を示す。曲調分析部１２は、ローパスフィルタ２０及び複数のバンドパスフィルタ２１、２２を有し、Ａ／Ｄ変換器８から入力されたデジタル信号Ｓ2を帯域分割する。分割する帯域の好ましい例は、ＡＴＲＡＣエンコーダ１０内で帯域分割される３帯域（即ち、低域：０〜約５．５kHz、中域：約５．５〜１１kHz、高域：約１１〜２２kHz）と一致させることである。これは、ＡＴＲＡＣエンコーダ内では、この３帯域に信号を帯域分割した後、最小可聴限曲線などを当てはめて圧縮符号化を行うからである。但し、３帯域以上のもっと細かい帯域に分割して、より細かな周波数帯毎に分析を行うことも可能である。また、各フィルタとしては、ＱＭＦ（Quadrature Mirror Filter）を使用することが好ましい。これは、帯域分割により生じるエイリアシング成分を帯域合成時にキャンセルすることができるからである。但し、他のフィルタ構成を使用することも可能である。
【００２１】
こうして帯域分割された信号は、夫々レベル検出回路２３、２４、２５へ入力される。レベル検出回路２３、２４、２５は、夫々入力された信号の所定時間幅ごとに信号中のピーク（最大）レベルを検出し、ＣＰＵ１４へ送る。この際ピークレベルを検出する時間幅は、好ましくはＡＴＲＡＣエンコーダ１０内で音楽信号を時間分割する最小単位である１つのサウンドグループ（符号化ブロックとも呼ぶ、最大１１．６msec）とすることが好ましい。その理由は、後段のＡＴＲＡＣエンコーダ１０はこの単位で信号の圧縮符号化を行うため、それと同一の単位で曲調を分析することが適切だからである。但し、各マイコン、ＬＳＩなどの間の通信に時間を要することから１つのサウンドグループ単位での分析が不可能な場合には、数個のサウンドグループに相当する時間幅を単位として曲調の判断を行う。
【００２２】
ＣＰＵ１４は、各レベル検出回路２３、２４、２５からの検出信号を受け取り、その内容に基づいてＡＴＲＡＣエンコーダ１０内の符号化で使用すべき各パラメータ（サウンドグループのビット配分及び時間幅、最小可聴限曲線、マスキング特性）についての特性を決定し、適当な特性を選択する選択信号ＳｃをＡＴＲＡＣエンコーダ１０へ供給する。
【００２３】
ＣＰＵ１４は、各レベル検出回路から送られる各帯域毎のピークレベル信号のある時間範囲における推移から、例えば、低レベルの高域信号が多い、中域信号のレベル変化が小さい、などの曲調を判断し、個々の場合に最適と考えられるサウンドグループのビット配分及び時間幅、最小可聴限特性及びマスキング特性を決定する。なお、その決定方法の詳細については更に後述する。
【００２４】
ＡＴＲＡＣエンコーダ１０は、各パラメータについて、符号化の際に使用する複数の特性を予め用意しており、外部からの制御信号Ｓｃによりそれらを選択できるように構成されている。各パラメータについての複数の特性としては、以下のようなものが予め用意される。まず、サウンドグループの時間幅については、ＡＴＲＡＣ上規定されている最大値である１１．６msecの他、これより短い複数の時間幅を選択することができる。また、サウンドグループのビット配分も任意に決めることができる。最小可聴限曲線については全般的にレベルの高い曲線、全般的にレベルの低い曲線、高域側を多少高め（又は低め）にした曲線などの複数の特性が用意される。マスキング特性としては、急峻な特性（即ち、近傍の信号がマスクされにくい）特性や緩やかな特性（近傍の信号がマスクされやすい）などが用意されている。そして、ＣＰＵ１４から供給される制御信号Ｓｃに基づいて、各パラメータについて夫々最適なものを一つずつ選択して圧縮符号化を行う。従って、入力信号の曲調に基づいて、符号化時にＡＴＲＡＣエンコーダ１０内で使用される特性は必要に応じて時々刻々と変更されることになる。
【００２５】
こうして符号化された信号Ｓ3は記録部１６に送られ、ＭＤディスク１８に記録される。
【００２６】
次に、曲調分析部１２及びＣＰＵ１４により行われる、各パラメータについての特性の決定方法について説明する。ＡＴＲＡＣエンコーダ１０において変更可能な特性は、上述のように、サウンドグループのビット配分及び時間幅、最小可聴限曲線及びマスキング特性である。これらについて順に説明する。
【００２７】
（１）サウンドグループのビット配分及び時間幅
ＡＴＲＡＣでは、符号化されるべき入力信号は、まず、所定の時間幅に切り分けられる。この切り分けられた時間窓の一単位をサウンドグループ（又は、符号化ブロック）といい、ＡＴＲＡＣ上では最大１１．６msecと規定されている。従って、この最大値以下の範囲で複数の時間幅を使用して符号化を行うことができる。また、各サウンドグループに対する量子化ビット数の配分も任意に決定することができる。
【００２８】
図３は、サウンドグループのビット配分を変更した例であり、図３（Ａ）はビット配分の少ない場合、図３（Ｂ）はビット配分の多い場合である。ビット配分を増加させることにより、量子化雑音の少ない符号化が可能となる。
【００２９】
図４は、サウンドグループの時間幅を変更した例であり、図４（Ｂ）は図４（Ａ）に比べて時間幅を小さく設定している。このため、レベル方向のビット配分量が増加し、原音により近いレベルの符号化（記録）データが得られている。従って、例えばクラシック系の音楽において、曲の余韻の部分を重要視する場合などには、この時間幅を短く設定することにより余韻部分を原音に忠実な、歪感の少ない音とすることができる。
【００３０】
（２）最小可聴限曲線
最小可聴限曲線とは、人間の耳に聞こえる音圧レベルを周波数に対してプロットした曲線である。即ち、この曲線よりレベルの低い音は人間の耳には聞こえないとされる。ＡＴＲＡＣエンコーダでは、この曲線を複数用意し、いずれか一つを選択して圧縮符号化を行う。符号化の際には、基本的にこの曲線よりもレベルの低い音（信号）を取り除き、又は相当小さい量子化ビット数で符号化する。なお、最小可聴限曲線又は後述のマスキング特性によって、符号化されない信号と適当な量子化ビット数では符号化されない信号の両方を含めて、以下「符号化されない」と表現することとする。
【００３１】
図５（Ａ）及び（Ｂ）にある同一の信号（即ち、同一のスペクトル）を異なる２つの最小可聴限曲線を用いて符号化する場合を示す。図３（Ａ）の曲線はレベルの高い最小可聴限曲線であり、図５（Ｂ）の曲線はレベルの低い最小可聴限曲線である。図から分かるように、図５（Ａ）の曲線を使用すると符号化されない信号が、図５（Ｂ）の曲線を使用すると符号化されることになる。ＡＴＲＡＣでは、入力信号を低域、中域、高域の３帯域に分割した後に圧縮符号化を行うので、いずれかの帯域の信号に対して使用する最小可聴限曲線を低く設定すれば、その帯域の信号を多く記録することができる。例えば、通常の音楽では高域信号は中域、低域信号と比較して信号レベルが低い（低レベルの信号が多く含まれている）のが一般的である。従って、ロック系の音楽など、高域信号もある程度重視したいような場合には、高域信号の符号化に使用する最小可聴限曲線としてレベルの低いものを選択すれば高域の豊富な記録を行うことができる。また、クラシック系の曲などで特に高域信号が重要でないという場合には、高域の最小可聴限曲線を高めに設定し、代わりに中域の曲線を低めに設定して中域の音の厚みを増すようにすることもできる。
【００３２】
ロック系であるとか、クラシック系であるという曲調については、ＣＰＵ１４が曲調分析部１２から受け取るデータにより判断する。例えば、高域において比較的高いピークレベルの信号が周期的に現れるような場合はロック系の曲調であると判断し、中域において平均して高いレベルの信号が連続的に、急峻な変化なく現れるような場合はクラシック系の曲調と判断することができる。なお、これらはあくまでも一例であり、種々の基準に従って曲調を判断することができる。
【００３３】
（３）マスキング特性
マスキング特性とは、ある音Ｃについて、それと近い周波数でそれよりレベルの大きい音Ｄが同時に存在する場合に、音Ｃが音Ｄの存在によって聞こえなくなくことをいう（図６（Ａ）参照）。図６（Ａ）及び（Ｂ）に同一のスペクトルについて異なるマスキング特性を適用した場合を示す。図６（Ａ）のマスキング特性は比較的緩やかな特性であり、図６（Ｂ）の特性は比較的急峻な特性である。図示のように、図６（Ａ）の緩やかな特性を使用すると音Ｃは符号化されないこととなるが、図６（Ｂ）の急峻な特性を使用すると音Ｃも符号化されることとなる。従って、例えばロック系の音楽のように比較的高レベルの信号が頻繁に現れる場合には、図６（Ｂ）のようにマスキング特性を急峻にして高レベルの信号の近傍の音がマスクされにくくしたほうが良い場合がある。
【００３４】
以上説明したように、本発明においては、ＭＤに記録されるべき信号の曲調を判断し、その結果に基づいて、ＡＴＲＡＣにおいて使用される複数のパラメータの特性（最小可聴限特性、マスキング特性など）のうち最適なものを選択、変更するように構成している。また、この曲調の判断及び特性の選択、変更は、好ましくは１つのサウンドグループである所定の時間を単位として継続的に行う。従って、一つの楽曲中に曲調が変化する場合でも、その変化に追従するように特性が時々刻々と変化することになるので、個々の曲の曲調に適合した符号化、記録を行うことが可能となる。
【００３５】
【発明の効果】
請求項１記載の発明によれば、特性制御手段は入力オーディオ信号の曲調に基づいて複数の特性のうち最適なものを選択し、符号化手段は選択された特性に基づいて入力オーディオ信号の圧縮符号化を行う。従って、入力信号の曲調に適合した特性を使用して圧縮符号化を行うことができる。
また、入力デジタル信号が複数の帯域に分割されて曲調が判断されるので各帯域の信号成分に基づいて細かな曲調判断が可能となる。また、ピークレベルに基づいて曲調判断を行うので比較的単純な回路により構成することができる。
さらに、入力オーディオ信号の曲調に応じて選択された最適な最小可聴限特性、マスキング特性に基づいてエンコーダによる最適な符号化が実行される。
【００３６】
請求項２記載の発明によれば、入力オーディオ信号の曲調に応じて適宜特性が変更されながら圧縮符号化が行われるので、一つの曲中などにおいても曲調の変化に追従して最適な特性を使用して符号化が達成される。
【図面の簡単な説明】
【図１】本発明の実施形態に係るＭＤ記録装置の信号記録系の構成を示すブロック図である。
【図２】図１に示す曲調分析部の構成を示すブロック図である
【図３】ビット配分を変化させた場合のＡＴＲＡＣによる符号化処理を示す図である。
【図４】サウンドグループのビット配分を変化させた場合のＡＴＲＡＣによる符号化処理を示す図である。
【図５】サウンドグループの時間幅を変化させた場合のＡＴＲＡＣによる符号化処理を示す図である。
【図６】マスキング特性を変化させた場合のＡＴＲＡＣによる符号化処理を示す図である。
【図７】ＡＴＲＡＣにおける圧縮処理の考え方を説明する図である。
【符号の説明】
１…ＭＤ記録装置
８…Ａ／Ｄ変換器
１０…ＡＴＲＡＣエンコーダ
１２…曲調分析部
１４…ＣＰＵ
１６…記録部
１８…ＭＤディスク
２０…ローパスフィルタ
２１、２２…バンドパスフィルタ
２３、２４、２５…レベル検出回路

Claims

入力デジタルオーディオ信号からスペクトル信号を生成し、生成されたスペクトル信号を、圧縮符号化する符号化手段と、
前記入力デジタルオーディオ信号から、前記入力デジタルオーディオ信号を複数の帯域に分割する帯域分割手段と、帯域分割された各々の帯域の信号のピークレベルを検出する手段と、検出されたピークレベルの変動に基づきその信号により構成される曲の曲調を判断する判断手段と、を具備する特性制御手段と、
を備え、
前記符号化手段は前記特性制御手段により判断される前記曲調に基づき、前記帯域分割された周波数帯域毎に最小可聴限曲線の選択、または前記帯域分割された周波数帯域毎にマスキング特性の緩急の選択、をして符号化を行う信号処理装置。
前記特性制御手段は、継続的に曲調の判断を行い、リアルタイムで前記特性の選択を行う請求項１記載の信号処理装置。