JP3925993B2 - 信号処理装置 - Google Patents

信号処理装置 Download PDF

Info

Publication number
JP3925993B2
JP3925993B2 JP23341697A JP23341697A JP3925993B2 JP 3925993 B2 JP3925993 B2 JP 3925993B2 JP 23341697 A JP23341697 A JP 23341697A JP 23341697 A JP23341697 A JP 23341697A JP 3925993 B2 JP3925993 B2 JP 3925993B2
Authority
JP
Japan
Prior art keywords
signal
encoding
tone
characteristic
music
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP23341697A
Other languages
English (en)
Other versions
JPH1173726A (ja
Inventor
吉彦 竹中
純一 今村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Corp
Original Assignee
Pioneer Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Corp filed Critical Pioneer Corp
Priority to JP23341697A priority Critical patent/JP3925993B2/ja
Priority to US09/143,618 priority patent/US6034315A/en
Priority to DE69828849T priority patent/DE69828849T2/de
Priority to EP98116365A priority patent/EP0899892B1/en
Publication of JPH1173726A publication Critical patent/JPH1173726A/ja
Application granted granted Critical
Publication of JP3925993B2 publication Critical patent/JP3925993B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/036Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal of musical genre, i.e. analysing the style of musical pieces, usually for selection, filtering or classification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10592Audio or video recording specifically adapted for recording or reproducing multichannel signals
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S84/00Music
    • Y10S84/09Filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

【0001】
【発明の属する技術分野】
本発明はミニディスク(Mini Disc、以下「MD」という。)に関し、より詳細にはMDへのオーディオ信号の記録時における信号処理に関する。
【0002】
【従来の技術】
MDにおいては、コンパクトディスク(Compact Disc、以下「CD」という。)に比べて情報を約1/5に圧縮するために、ATRAC(Adaptive TRansform Acoustic Coding)と呼ばれるオーディオデータ高能率符号化方式を採用している。ATRACにおける考え方は、人間の聴覚特性を考慮し、人間が感知できないような信号の冗長部分を除去して圧縮を行うというものである。言い換えれば、元信号と圧縮後の信号に差異が生じる(即ち、量子化雑音が生じる)ことを前提とし、その雑音を人間が感知できないように制御しつつ圧縮を行うのである。
【0003】
具体的には、ATRACでは人間の聴覚上の性質に関連する等ラウドネス特性(最小可聴限曲線)やマスキング効果などを利用して高能率符号化を行う。これについて例を挙げて説明する。図7(A)において、曲線100は最小可聴限曲線を示し、この曲線より下側のレベルの音は人間の耳には聞こえないとされる。いま、入力信号に図中の音A及び音Bが含まれているとすると、音Bは人間の耳に聞こえるが、音Aは最小可聴限曲線の下側に位置するので人間の耳には聞こえない。従って、ATRACではこの音Bは有効な信号として記録するが、音Aは記録を行わない(間引いてしまう)。或いは、量子化ビット配分を極端に減少させて符号化を行う。
【0004】
図7(B)には、最小可聴限曲線100に加え、音Cによるマスキング特性110を示す。音Bは最小可聴限特性100より上側に位置するが、その近傍にある音Cによりマスクされて人間の耳には聞こえない。従って、ATRACでは音Bも冗長部分として取り除いて圧縮を行う。
【0005】
【発明が解決しようとする課題】
上述のように、ATRACにおける信号圧縮の手法は、圧縮処理におけるパラメータである最小可聴限曲線、マスキング特性などをどのように設定するかに依存する。この点、従来においてはこれらそれぞれについて、予め決定された一つの特性のみを使用してATRACによる符号化を行うのが一般的であった。
【0006】
しかし、ATRACにより圧縮符号化を行う際に使用する最小可聴限曲線やマスキング特性の設定に依存して、記録される信号、即ち音楽の感じはかなり異なったものとなる。従って、種々のジャンル、曲調の音楽を一つの特性のみを使用して記録すると、原音(原曲)に対して必ずしも最適の圧縮符号化がされるとは限らず、記録、再生した曲に迫力が感じられない、高域が耳障りであるなどというように曲に合った記録ができないことが生じうる。
【0007】
本発明は、以上の点に鑑みてなされたものであり、記録する曲の曲調に応じて最適な特性を使用して圧縮符号化を行うことが可能な音楽信号の信号処理装置を提供することを課題とする。
【0008】
【課題を解決するための手段】
上記課題を解決するため、請求項1に記載の発明は、信号処理装置において、入力デジタルオーディオ信号からスペクトル信号を生成し、生成されたスペクトル信号を、圧縮符号化する符号化手段と、前記入力デジタルオーディオ信号から、前記入力デジタルオーディオ信号を複数の帯域に分割する帯域分割手段と、帯域分割された各々の帯域の信号のピークレベルを検出する手段と、検出されたピークレベルの変動に基づきその信号により構成される曲の曲調を判断する判断手段と、を具備する特性制御手段と、を備え、前記符号化手段は前記特性制御手段により判断される前記曲調に基づき、前記帯域分割された周波数帯域毎に最小可聴限曲線の選択、または前記帯域分割された周波数帯域毎にマスキング特性の緩急の選択、をして符号化を行うように構成する。
【0009】
上記のように構成された信号処理装置によれば、入力デジタルオーディオ信号は符号化手段に入力されてスペクトル信号に変換され、その後圧縮のための特性に基づいて圧縮符号化される。一方、入力デジタルオーディオ信号は特性制御手段にも入力され、その信号により構成される曲の曲調が判断される。特性制御手段は、判断した曲調に応じて、あるパラメータについて予め用意された複数の特性からその曲調に最適な特性を選択する。符号化手段は、こうして曲調制御手段により選択された特性に基づいて、その曲調に適合した圧縮符号化を行う。
上記のように構成された情報処理装置によれば、入力デジタルオーディオ信号は帯域分割手段により複数の帯域に分割され、それぞれの帯域についてピークレベルが検出され、検出されたピークレベルに基づいて曲調が判断される。
上記のように構成された信号処理装置によれば、入力オーディオ信号の曲調に応じて選択された最適な最小可聴限特性、マスキング特性に基づいてエンコーダによる符号化が実行される。
【0010】
請求項2記載の発明は、請求項1記載の信号処理装置において、前記特性制御手段は、継続的に曲調の判断を行い、リアルタイムで前記特性の選択を行うように構成する。
【0011】
上記のように構成された信号処理装置によれば、入力信号の符号化中にリアルタイムで曲調が判断され、特性が選択される。即ち、入力オーディオ信号の曲調に応じて適宜特性が変更されながら圧縮符号化が行われるので、一つの曲中などにおいても曲調の変化に追従して最適な特性を使用して符号化が達成される。
【0016】
【発明の実施の形態】
以下、図面を参照して本発明の好適な実施の形態について説明する。
【0017】
原理説明
まず、本発明の原理について簡単に説明する。前述のように、ATRACによる符号化においては、符号化の際に使用するパラメータ、具体的には、最小可聴限曲線、マスキング特性、符号化すべき信号を時間的に切り分ける際の時間幅(後述のサウンドグループ)などを実際にどう設定するかが重要であり、その設定により記録される音楽の感じもかなり異なってくる。この点に鑑み、本発明では記録されるべき音楽信号の曲調をリアルタイムで分析、判断し、その結果に応じて、各パラメータ毎にその音楽信号の符号化に最適な特性を予め用意された複数の特性から選択して使用するように構成する。これにより、記録される音楽の種類、曲調に応じた最適な特性を使用して最適な圧縮符号化が可能となる。
【0018】
MD記録装置
次に、本発明の好適な実施形態について図面を参照して説明する。図1は、本発明の実施形態に係るMD記録装置1の信号処理系を示すブロック図である。
【0019】
MD記録装置1において、MDディスク18に記録されるべき入力信号S1はA/D変換器8に入力され、サンプリング周波数44.1kHz、16から20ビットで標本化、量子化されてデジタル信号S2として出力される。デジタル信号S2は、ATRACエンコーダ10及び曲調分析部12へ送られる。
【0020】
図2に曲調分析部12の構成を示す。曲調分析部12は、ローパスフィルタ20及び複数のバンドパスフィルタ21、22を有し、A/D変換器8から入力されたデジタル信号S2を帯域分割する。分割する帯域の好ましい例は、ATRACエンコーダ10内で帯域分割される3帯域(即ち、低域:0〜約5.5kHz、中域:約5.5〜11kHz、高域:約11〜22kHz)と一致させることである。これは、ATRACエンコーダ内では、この3帯域に信号を帯域分割した後、最小可聴限曲線などを当てはめて圧縮符号化を行うからである。但し、3帯域以上のもっと細かい帯域に分割して、より細かな周波数帯毎に分析を行うことも可能である。また、各フィルタとしては、QMF(Quadrature Mirror Filter)を使用することが好ましい。これは、帯域分割により生じるエイリアシング成分を帯域合成時にキャンセルすることができるからである。但し、他のフィルタ構成を使用することも可能である。
【0021】
こうして帯域分割された信号は、夫々レベル検出回路23、24、25へ入力される。レベル検出回路23、24、25は、夫々入力された信号の所定時間幅ごとに信号中のピーク(最大)レベルを検出し、CPU14へ送る。この際ピークレベルを検出する時間幅は、好ましくはATRACエンコーダ10内で音楽信号を時間分割する最小単位である1つのサウンドグループ(符号化ブロックとも呼ぶ、最大11.6msec)とすることが好ましい。その理由は、後段のATRACエンコーダ10はこの単位で信号の圧縮符号化を行うため、それと同一の単位で曲調を分析することが適切だからである。但し、各マイコン、LSIなどの間の通信に時間を要することから1つのサウンドグループ単位での分析が不可能な場合には、数個のサウンドグループに相当する時間幅を単位として曲調の判断を行う。
【0022】
CPU14は、各レベル検出回路23、24、25からの検出信号を受け取り、その内容に基づいてATRACエンコーダ10内の符号化で使用すべき各パラメータ(サウンドグループのビット配分及び時間幅、最小可聴限曲線、マスキング特性)についての特性を決定し、適当な特性を選択する選択信号ScをATRACエンコーダ10へ供給する。
【0023】
CPU14は、各レベル検出回路から送られる各帯域毎のピークレベル信号のある時間範囲における推移から、例えば、低レベルの高域信号が多い、中域信号のレベル変化が小さい、などの曲調を判断し、個々の場合に最適と考えられるサウンドグループのビット配分及び時間幅、最小可聴限特性及びマスキング特性を決定する。なお、その決定方法の詳細については更に後述する。
【0024】
ATRACエンコーダ10は、各パラメータについて、符号化の際に使用する複数の特性を予め用意しており、外部からの制御信号Scによりそれらを選択できるように構成されている。各パラメータについての複数の特性としては、以下のようなものが予め用意される。まず、サウンドグループの時間幅については、ATRAC上規定されている最大値である11.6msecの他、これより短い複数の時間幅を選択することができる。また、サウンドグループのビット配分も任意に決めることができる。最小可聴限曲線については全般的にレベルの高い曲線、全般的にレベルの低い曲線、高域側を多少高め(又は低め)にした曲線などの複数の特性が用意される。マスキング特性としては、急峻な特性(即ち、近傍の信号がマスクされにくい)特性や緩やかな特性(近傍の信号がマスクされやすい)などが用意されている。そして、CPU14から供給される制御信号Scに基づいて、各パラメータについて夫々最適なものを一つずつ選択して圧縮符号化を行う。従って、入力信号の曲調に基づいて、符号化時にATRACエンコーダ10内で使用される特性は必要に応じて時々刻々と変更されることになる。
【0025】
こうして符号化された信号S3は記録部16に送られ、MDディスク18に記録される。
【0026】
次に、曲調分析部12及びCPU14により行われる、各パラメータについての特性の決定方法について説明する。ATRACエンコーダ10において変更可能な特性は、上述のように、サウンドグループのビット配分及び時間幅、最小可聴限曲線及びマスキング特性である。これらについて順に説明する。
【0027】
(1)サウンドグループのビット配分及び時間幅
ATRACでは、符号化されるべき入力信号は、まず、所定の時間幅に切り分けられる。この切り分けられた時間窓の一単位をサウンドグループ(又は、符号化ブロック)といい、ATRAC上では最大11.6msecと規定されている。従って、この最大値以下の範囲で複数の時間幅を使用して符号化を行うことができる。また、各サウンドグループに対する量子化ビット数の配分も任意に決定することができる。
【0028】
図3は、サウンドグループのビット配分を変更した例であり、図3(A)はビット配分の少ない場合、図3(B)はビット配分の多い場合である。ビット配分を増加させることにより、量子化雑音の少ない符号化が可能となる。
【0029】
図4は、サウンドグループの時間幅を変更した例であり、図4(B)は図4(A)に比べて時間幅を小さく設定している。このため、レベル方向のビット配分量が増加し、原音により近いレベルの符号化(記録)データが得られている。従って、例えばクラシック系の音楽において、曲の余韻の部分を重要視する場合などには、この時間幅を短く設定することにより余韻部分を原音に忠実な、歪感の少ない音とすることができる。
【0030】
(2)最小可聴限曲線
最小可聴限曲線とは、人間の耳に聞こえる音圧レベルを周波数に対してプロットした曲線である。即ち、この曲線よりレベルの低い音は人間の耳には聞こえないとされる。ATRACエンコーダでは、この曲線を複数用意し、いずれか一つを選択して圧縮符号化を行う。符号化の際には、基本的にこの曲線よりもレベルの低い音(信号)を取り除き、又は相当小さい量子化ビット数で符号化する。なお、最小可聴限曲線又は後述のマスキング特性によって、符号化されない信号と適当な量子化ビット数では符号化されない信号の両方を含めて、以下「符号化されない」と表現することとする。
【0031】
図5(A)及び(B)にある同一の信号(即ち、同一のスペクトル)を異なる2つの最小可聴限曲線を用いて符号化する場合を示す。図3(A)の曲線はレベルの高い最小可聴限曲線であり、図5(B)の曲線はレベルの低い最小可聴限曲線である。図から分かるように、図5(A)の曲線を使用すると符号化されない信号が、図5(B)の曲線を使用すると符号化されることになる。ATRACでは、入力信号を低域、中域、高域の3帯域に分割した後に圧縮符号化を行うので、いずれかの帯域の信号に対して使用する最小可聴限曲線を低く設定すれば、その帯域の信号を多く記録することができる。例えば、通常の音楽では高域信号は中域、低域信号と比較して信号レベルが低い(低レベルの信号が多く含まれている)のが一般的である。従って、ロック系の音楽など、高域信号もある程度重視したいような場合には、高域信号の符号化に使用する最小可聴限曲線としてレベルの低いものを選択すれば高域の豊富な記録を行うことができる。また、クラシック系の曲などで特に高域信号が重要でないという場合には、高域の最小可聴限曲線を高めに設定し、代わりに中域の曲線を低めに設定して中域の音の厚みを増すようにすることもできる。
【0032】
ロック系であるとか、クラシック系であるという曲調については、CPU14が曲調分析部12から受け取るデータにより判断する。例えば、高域において比較的高いピークレベルの信号が周期的に現れるような場合はロック系の曲調であると判断し、中域において平均して高いレベルの信号が連続的に、急峻な変化なく現れるような場合はクラシック系の曲調と判断することができる。なお、これらはあくまでも一例であり、種々の基準に従って曲調を判断することができる。
【0033】
(3)マスキング特性
マスキング特性とは、ある音Cについて、それと近い周波数でそれよりレベルの大きい音Dが同時に存在する場合に、音Cが音Dの存在によって聞こえなくなくことをいう(図6(A)参照)。図6(A)及び(B)に同一のスペクトルについて異なるマスキング特性を適用した場合を示す。図6(A)のマスキング特性は比較的緩やかな特性であり、図6(B)の特性は比較的急峻な特性である。図示のように、図6(A)の緩やかな特性を使用すると音Cは符号化されないこととなるが、図6(B)の急峻な特性を使用すると音Cも符号化されることとなる。従って、例えばロック系の音楽のように比較的高レベルの信号が頻繁に現れる場合には、図6(B)のようにマスキング特性を急峻にして高レベルの信号の近傍の音がマスクされにくくしたほうが良い場合がある。
【0034】
以上説明したように、本発明においては、MDに記録されるべき信号の曲調を判断し、その結果に基づいて、ATRACにおいて使用される複数のパラメータの特性(最小可聴限特性、マスキング特性など)のうち最適なものを選択、変更するように構成している。また、この曲調の判断及び特性の選択、変更は、好ましくは1つのサウンドグループである所定の時間を単位として継続的に行う。従って、一つの楽曲中に曲調が変化する場合でも、その変化に追従するように特性が時々刻々と変化することになるので、個々の曲の曲調に適合した符号化、記録を行うことが可能となる。
【0035】
【発明の効果】
請求項1記載の発明によれば、特性制御手段は入力オーディオ信号の曲調に基づいて複数の特性のうち最適なものを選択し、符号化手段は選択された特性に基づいて入力オーディオ信号の圧縮符号化を行う。従って、入力信号の曲調に適合した特性を使用して圧縮符号化を行うことができる。
また、入力デジタル信号が複数の帯域に分割されて曲調が判断されるので各帯域の信号成分に基づいて細かな曲調判断が可能となる。また、ピークレベルに基づいて曲調判断を行うので比較的単純な回路により構成することができる。
さらに、入力オーディオ信号の曲調に応じて選択された最適な最小可聴限特性、マスキング特性に基づいてエンコーダによる最適な符号化が実行される。
【0036】
請求項2記載の発明によれば、入力オーディオ信号の曲調に応じて適宜特性が変更されながら圧縮符号化が行われるので、一つの曲中などにおいても曲調の変化に追従して最適な特性を使用して符号化が達成される。
【図面の簡単な説明】
【図1】本発明の実施形態に係るMD記録装置の信号記録系の構成を示すブロック図である。
【図2】図1に示す曲調分析部の構成を示すブロック図である
【図3】ビット配分を変化させた場合のATRACによる符号化処理を示す図である。
【図4】サウンドグループのビット配分を変化させた場合のATRACによる符号化処理を示す図である。
【図5】サウンドグループの時間幅を変化させた場合のATRACによる符号化処理を示す図である。
【図6】マスキング特性を変化させた場合のATRACによる符号化処理を示す図である。
【図7】ATRACにおける圧縮処理の考え方を説明する図である。
【符号の説明】
1…MD記録装置
8…A/D変換器
10…ATRACエンコーダ
12…曲調分析部
14…CPU
16…記録部
18…MDディスク
20…ローパスフィルタ
21、22…バンドパスフィルタ
23、24、25…レベル検出回路

Claims (2)

  1. 入力デジタルオーディオ信号からスペクトル信号を生成し、生成されたスペクトル信号を、圧縮符号化する符号化手段と、
    前記入力デジタルオーディオ信号から、前記入力デジタルオーディオ信号を複数の帯域に分割する帯域分割手段と、帯域分割された各々の帯域の信号のピークレベルを検出する手段と、検出されたピークレベルの変動に基づきその信号により構成される曲の曲調を判断する判断手段と、を具備する特性制御手段と、
    を備え、
    前記符号化手段は前記特性制御手段により判断される前記曲調に基づき、前記帯域分割された周波数帯域毎に最小可聴限曲線の選択、または前記帯域分割された周波数帯域毎にマスキング特性の緩急の選択、をして符号化を行う信号処理装置。
  2. 前記特性制御手段は、継続的に曲調の判断を行い、リアルタイムで前記特性の選択を行う請求項1記載の信号処理装置。
JP23341697A 1997-08-29 1997-08-29 信号処理装置 Expired - Fee Related JP3925993B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP23341697A JP3925993B2 (ja) 1997-08-29 1997-08-29 信号処理装置
US09/143,618 US6034315A (en) 1997-08-29 1998-08-28 Signal processing apparatus and method and information recording apparatus
DE69828849T DE69828849T2 (de) 1997-08-29 1998-08-28 Signalverarbeitungsgerät und -verfahren sowie Informationsaufzeichnungsgerät
EP98116365A EP0899892B1 (en) 1997-08-29 1998-08-28 Signal processing apparatus and method, and information recording apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23341697A JP3925993B2 (ja) 1997-08-29 1997-08-29 信号処理装置

Publications (2)

Publication Number Publication Date
JPH1173726A JPH1173726A (ja) 1999-03-16
JP3925993B2 true JP3925993B2 (ja) 2007-06-06

Family

ID=16954729

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23341697A Expired - Fee Related JP3925993B2 (ja) 1997-08-29 1997-08-29 信号処理装置

Country Status (4)

Country Link
US (1) US6034315A (ja)
EP (1) EP0899892B1 (ja)
JP (1) JP3925993B2 (ja)
DE (1) DE69828849T2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY121856A (en) * 1998-01-26 2006-02-28 Sony Corp Reproducing apparatus.
US6226618B1 (en) * 1998-08-13 2001-05-01 International Business Machines Corporation Electronic content delivery system
AT500124A1 (de) 2000-05-09 2005-10-15 Tucmandl Herbert Anlage zum komponieren
US6673995B2 (en) * 2000-11-06 2004-01-06 Matsushita Electric Industrial Co., Ltd. Musical signal processing apparatus
JP4074508B2 (ja) * 2002-11-29 2008-04-09 アルプス電気株式会社 再生出力用音データの通信方法
US7297860B2 (en) * 2004-11-12 2007-11-20 Sony Corporation System and method for determining genre of audio
JP4399440B2 (ja) 2006-06-30 2010-01-13 株式会社コナミデジタルエンタテインメント 音楽ジャンル判別装置及びこれを備えたゲーム機
JP6586804B2 (ja) * 2015-07-14 2019-10-09 富士通株式会社 符号化装置、符号化方法、及びプログラム
JP6816277B2 (ja) 2017-07-03 2021-01-20 パイオニア株式会社 信号処理装置、制御方法、プログラム及び記憶媒体

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3158557B2 (ja) * 1991-09-27 2001-04-23 ソニー株式会社 再生装置
JP3088580B2 (ja) * 1993-02-19 2000-09-18 松下電器産業株式会社 変換符号化装置のブロックサイズ決定法
EP0653846B1 (en) * 1993-05-31 2001-12-19 Sony Corporation Apparatus and method for coding or decoding signals, and recording medium
JP3404837B2 (ja) * 1993-12-07 2003-05-12 ソニー株式会社 多層符号化装置
EP0688113A2 (en) * 1994-06-13 1995-12-20 Sony Corporation Method and apparatus for encoding and decoding digital audio signals and apparatus for recording digital audio
US5699479A (en) * 1995-02-06 1997-12-16 Lucent Technologies Inc. Tonality for perceptual audio compression based on loudness uncertainty

Also Published As

Publication number Publication date
EP0899892A3 (en) 2002-06-12
JPH1173726A (ja) 1999-03-16
DE69828849T2 (de) 2006-04-27
EP0899892B1 (en) 2005-02-02
EP0899892A2 (en) 1999-03-03
US6034315A (en) 2000-03-07
DE69828849D1 (de) 2005-03-10

Similar Documents

Publication Publication Date Title
JP3274285B2 (ja) オーディオ信号の符号化方法
JP5124068B2 (ja) ディジタル・サウンド・レコーディングの音量調整の方法
JP3328532B2 (ja) デジタルデータの符号化方法
JP3173218B2 (ja) 圧縮データ記録方法及び装置、圧縮データ再生方法、並びに記録媒体
KR100310214B1 (ko) 신호인코딩또는디코딩장치와레코딩매체
JP2008511844A (ja) 音声信号を安定して分類する装置および方法、音声信号データベースを構築して動作させる方法、およびコンピュータプログラム
JP2008191659A (ja) 音声強調方法及び音声再生システム
KR20060004695A (ko) 오디오 신호의 대역을 확장하기 위한 방법 및 장치
JP3925993B2 (ja) 信号処理装置
JP2001134295A (ja) 符号化装置および符号化方法、記録装置および記録方法、送信装置および送信方法、復号化装置および符号化方法、再生装置および再生方法、並びに記録媒体
US6128593A (en) System and method for implementing a refined psycho-acoustic modeler
JP3605706B2 (ja) 音響信号再生方法及び装置
US7305346B2 (en) Audio processing method and audio processing apparatus
JP3560087B2 (ja) 音信号処理装置およびサラウンド再生方法
De Koning et al. On psychoacoustic noise shaping for audio requantization
JP4311541B2 (ja) オーディオ信号圧縮装置
JP4822697B2 (ja) ディジタル信号符号化装置およびディジタル信号記録装置
JP2816052B2 (ja) オーディオデータ圧縮装置
KR100188145B1 (ko) 다이나믹 크로스 페이딩을 이용한 키 제어기
JP3408140B2 (ja) 情報符号化方法
JP2000293199A (ja) 音声符号化方法および記録再生装置
JP3354472B2 (ja) 情報符号化方法
JP3089690B2 (ja) ディジタルデータの高能率符号化方法
JP2000250569A (ja) 圧縮オーディオ信号補正器、および圧縮オーディオ信号再生装置
JPH07261799A (ja) 直交変換符号化装置及び方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050824

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050927

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061128

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070227

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070227

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110309

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120309

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130309

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140309

Year of fee payment: 7

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees