JP2000101439A - 情報処理装置および方法、情報記録装置および方法、記録媒体、並びに提供媒体 - Google Patents

情報処理装置および方法、情報記録装置および方法、記録媒体、並びに提供媒体

Info

Publication number
JP2000101439A
JP2000101439A JP26911498A JP26911498A JP2000101439A JP 2000101439 A JP2000101439 A JP 2000101439A JP 26911498 A JP26911498 A JP 26911498A JP 26911498 A JP26911498 A JP 26911498A JP 2000101439 A JP2000101439 A JP 2000101439A
Authority
JP
Japan
Prior art keywords
search condition
data
receiving
unit
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP26911498A
Other languages
English (en)
Inventor
Yasuhiro Tokuri
康裕 戸栗
Kenzo Akagiri
健三 赤桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP26911498A priority Critical patent/JP2000101439A/ja
Priority to US09/397,234 priority patent/US6532445B1/en
Priority to KR19990040891A priority patent/KR100661040B1/ko
Priority to EP19990118810 priority patent/EP0989754A2/en
Publication of JP2000101439A publication Critical patent/JP2000101439A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • G06F16/433Query formulation using audio data
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • G11B2020/00014Time or data compression or expansion the compressed signal being an audio signal
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data
    • G11B2020/10555Audio or video recording specifically adapted for audio data wherein the frequency, the amplitude, or other characteristics of the audio signal is taken into account
    • G11B2020/10564Audio or video recording specifically adapted for audio data wherein the frequency, the amplitude, or other characteristics of the audio signal is taken into account frequency
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

(57)【要約】 【課題】 信号特性を検索条件として、AVデータを効率
よく検索する。 【解決手段】 ステップS3において、比較判定部は、
符号化オーディオデータのスペクトル係数と、サンプル
波形のスペクトル係数との相関係数(類似度)を演算
し、演算した相関係数の値がステップS1で設定した閾
値よりも大きいものを抽出して検索結果とする。ステッ
プS4において、比較判定部は、検索結果が満足できる
ものであるか否かを判定する。ステップS3で検索され
た符号化オーディオデータの数が所定の閾値以上であっ
て、検索結果が満足できるものではないと判定された場
合、ステップS5に進む。ステップS5において、比較
判定部は、検索条件であるサンプル波形の周波数帯域の
数がその最大値よりも小さいか否かを判定し、周波数帯
域の数がその最大値よりも小さいと判定した場合、ステ
ップS6において、検索条件であるサンプル波形の周波
数帯域の数を1だけインクリメントしてステップS3に
戻る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報処理装置およ
び方法、情報記録装置および方法、記録媒体、並びに提
供媒体に関し、特に、信号特性に基づいて、圧縮符号化
されたオーディオデータを検索する情報処理装置および
方法、情報記録装置および方法、記録媒体、並びに提供
媒体に関する。
【0002】
【従来の技術】近年、高能率符号化技術に発達により、
音声データおよび画像データを圧縮符号化して保管する
ことが一般化し、多数の符号化されたデータの中から所
望のデータを効率よく検索する方法が必要とされてい
る。
【0003】図23は、従来のオーディオデータ検索装
置の機能的な構成を示している。このオーディオデータ
検索装置のデータベース156には、圧縮符号化された
オーディオデータ(以下、符号化オーディオデータと記
述する)と、符号化オーディオデータに対応付けられ
た、オーディオデータの属性情報(例えば、標題、作者
名、作成日付、および内容の分類区分等)が記述されて
いる検索用テキストデータベースが、予め記録されてい
る。
【0004】検索条件入力部151は、ユーザによる検
索条件(属性情報、およびサンプル波形の信号特性)の
入力を受け付けて、属性情報を属性検索部152に供給
し、信号特性を比較判定部155に供給する。
【0005】属性検索部152は、検索条件入力部15
1から入力された属性情報(例えば、作者名)に適合す
るものをデータベース156に記憶されている検索用テ
キストデータベースの中から検索し、それに対応する符
号化オーディオデータを抽出して候補選定部153に出
力する。
【0006】候補選定部153は、属性検索部152か
ら入力された符号化オーディオデータを、順次、復号部
154に出力する。復号部154は、候補選定部153
から入力された符号化オーディオデータを復号し、比較
判定部155に出力する。
【0007】比較判定部155は、復号部154から入
力されたオーディオデータと、検索条件入力部から供給
されたサンプル波形の信号特性(例えば、波形振幅等)
との類似の程度を求め、類似度が所定の閾値以上であれ
ば、そのオーディオデータを検索結果として出力する。
なお、類似度を求めるには、例えば、サンプル波形と検
索されたオーディオデータとの波形振幅、振幅平均値、
電力分布、または周波数スペクトル等の相関係数を演算
する方法がある。
【0008】次に、図23のデータベース156に予め
記録されている符号化オーディオデータを生成する符号
化装置について説明するが、その前に、オーディオデー
タを効率よく圧縮符号化する方法について説明する。オ
ーディオデータを効率よく圧縮符号化する方法は、大別
すると帯域分割符号化方式と変換符号化方式に分けるこ
とができる。また、両者を組み合わせた方式も存在す
る。
【0009】帯域分割符号化方式は、離散時間波形信号
(例えば、オーディオデータ)を直交ミラーフィルタQM
F(Quadrature Mirror Filter)などの帯域分割フィルタ
により複数の周波数帯域に分割し、各帯域毎に最適な符
号化を施す方式であり、サブバンド符号化とも呼ばれて
いる。なお、直交ミラーフィルタの詳細は、例えば、P.
L.Chu,"Quadrature mirror filter design for an arbi
trary number ofequal bandwidth channels",IEEE Tran
s.Acoust.Speech,Signal Processing,vol.ASSP-33,pp20
3-128,Feb.1985に記載されている。
【0010】変換符号化方式は、ブロック符号化方式と
も呼ばれ、離散時間波形信号を所定の標本化単位にブロ
ック化し、このブロック(フレームとも記述する)の信
号を周波数スペクトルに変換した後、符号化する方式で
ある。周波数スペクトルに変換する方法の種類として
は、例えば、離散フーリエ変換DFT(Discrete Fourier T
ransform)、離散コサイン変換DCT(Discrete Cosine Tra
nsform)、または修正離散コサイン変換MDCT(Modified D
iscrete Cosine Transform)等がある。修正離散コサイ
ン変換は、時間軸上の隣接ブロックと変換区間を重複さ
せることで、ブロック歪みの少ない効率的な変換を行う
ことができる。なお、その詳細は、例えば、"Analysis/
Synthesis Filter Bank Design Based on Time Domain
Aliasing Cancellation":J.P.Princen,A.B.Bradley,IEE
E Transactions,ASSP-34,No.5,Oct.1986.pp1153-1161お
よび"Subband/Transform Coding Using Filter Band De
sign Based on Time DomainAliasing Cancellation":J.
J.Princern,A.W.Johnson and A.B.Bradley(ICASSP 198
7)に記載されている。
【0011】帯域分割符号化方式においては周波数帯域
毎に分割された信号を、一方、変換符号化方式において
は周波数スペクトルに変換された信号を、量子化してか
ら符号化することにより、いわゆるマスキング効果等の
聴覚的な性質を利用して量子化雑音が発生する帯域を制
限することができる。また、この量子化の前に、それぞ
れの信号を正規化することにより、効率的な符号化を行
うことができる。
【0012】例えば、帯域分割符号化方式において量子
化を行う場合、帯域分割幅を人間の聴覚特性を考慮して
周波数の高域ほど帯域幅が広くなるような臨界帯域(ク
リティカルバンド)と呼ばれる帯域幅で分割することが
望ましい。
【0013】周波数帯域に分割された信号は、各帯域毎
にビット割り当て(ビットアロケーション)が行われて
符号化される。例えば、各帯域毎の信号の振幅絶対値に
基づいて動的にビット割り当てを行えば、量子化雑音ス
ペクトルが平坦となり、雑音エネルギが最小となる。な
お、この方法は、"Adaptive Transform Coding of Spee
ch Signals":R.Zelinski and P.Noll,IEEE Transaction
s of Accoustics Speech and signal Processing,vol.A
SSP-25,No.4,August 1997.に記載されている。ただし、
この方法においては、マスキング効果が利用されていな
いので、聴覚的には最適ではない問題がある。
【0014】また、例えば、各帯域毎に良好なS/N比と
なるような固定化されたビット割り当てを行えば、聴覚
的にはマスキング効果を得られるが、例えば、正弦波の
特性を測定する場合、ビット割り当てが固定されている
ために特性値が良好に得られない問題がある。なお、こ
の方法は、"The critical band coder-digital encodin
g of the perceptual requirements of the auditory s
ystem":M.A.Kransner,MIT,(ICASSP 1980)に記載されて
いる。
【0015】これらの問題を解決するために、ビット割
り当てに使用できる全ビットを、動的な割り当て分と固
定的な割り当て分とに分割し、その分割比率を、例え
ば、入力信号のスペクトル分布が滑らかなときほど、固
定的なビット割り当て分の比率を大きくするように、分
割比率を入力信号に依存させることにより効率的な符号
化を行う方法もある。
【0016】ところで、オーディオ信号の量子化および
符号化において、オーディオ波形の一部で振幅が急激に
増加、または減少するような振幅急変点(以下、アタッ
クと記述する)が存在する波形は、アタックにおいて量
子化誤差が増大する。また、変換符号化方式により符号
化された信号においては、アタックにおけるスペクトル
係数の量子化誤差が、逆スペクトル変換時(復号時)
に、時間領域上でブロック全体に広がってしまう。この
影響により、振幅の急増点の直前や急減点の直後に、い
わゆるプリエコーと呼ばれる聴覚上耳障りな雑音が発生
する。
【0017】このプリエコーを防ぐには、例えば、波形
信号のアタックを予め検知し、アタックが存在するブロ
ックの振幅を均等化するように、アタックの前後の信号
のゲインを増幅、または減衰する方法(ゲインコントロ
ール)がある。この方法の符号化時においては、ゲイン
コントロールが施された波形信号とともに、ゲインの位
置およびゲインコントロールされたレベルの情報が符号
化される。また、復号時においては、ゲインの位置およ
びゲインコントロールされたレベルの情報に基づいて、
符号時とは逆のゲインコントロールが施されて波形信号
が復号される。なお、このゲインコントロールを行う方
法は、分割された周波数帯域毎に実施することも可能で
ある。
【0018】図24は、図23のデータベース156に
予め記録されている符号化オーディオデータを生成する
符号化装置の構成を示している。この符号化装置は、上
述した変換符号化方式によりオーディオデータを圧縮符
号化するものである。
【0019】スペクトル変換部161は、入力されたオ
ーディオ波形信号を所定のスペクトル変換処理(例え
ば、離散コサイン変換処理)により、スペクトル係数に
変換して量子化部162に出力する。量子化部162
は、スペクトル変換部161から入力されたスペクトル
係数に正規化および量子化を施して、得られた量子化ス
ペクトル係数と量子化パラメータ(正規化係数および量
子化幅係数)をハフマン符号化部163に出力する。ハ
フマン符号化部163は、量子化部162から入力され
た量子化スペクトル係数および量子化パラメータを可変
長符号化してビット多重化部164に出力する。ビット
多重化部164は、ハフマン符号化部163から入力さ
れた符号化されている量子化スペクトル係数および量子
化パラメータと、その他の符号化パラメータとを、所定
のビットストリーム形式に多重化して出力する。
【0020】図25は、図24の符号化装置により生成
された符号化オーディオデータを復号する、図23の復
号部154の構成を示している。図24のビット多重化
部164に対応するビット分解部171は、入力された
符号化オーディオデータを符号化スペクトル係数および
符号化パラメータに分解し、ハフマン復号部172に出
力する。ハフマン復号部172は、符号化スペクトル係
数および符号化パラメータに、図24のハフマン符号化
部163の符号化に対応する復号を施し、得られた量子
化スペクトル係数と量子化パラメータを逆量子化部17
3に出力する。逆量子化部173は、量子化パラメータ
に基づいて量子化スペクトル係数を逆量子化して逆正規
化し、得られたスペクトル係数を逆スペクトル変換部1
74に出力する。逆スペクトル変換部174は、逆量子
化部173から入力されたスペクトル係数に、図24の
スペクトル変換部161のスペクトル変換処理に対応す
る逆スペクトル変換処理を施して、得られたオーディオ
波形信号を出力する。
【0021】
【発明が解決しようとする課題】ところで、上述した従
来のオーディオデータ検索装置による検索では、圧縮符
号化されているオーディオデータを検索するには、それ
を完全に復号する必要があり、復号された情報を記録す
る膨大なメモリと、復号にかかる膨大な処理時間が必要
となる課題があった。
【0022】本発明はこのような状況に鑑みてなされた
ものであり、検索条件に対応して符号化されているAVデ
ータの一部を復号することにより、AVデータを効率よく
検索できるようにするものである。
【0023】
【課題を解決するための手段】請求項1に記載の情報処
理装置は、検索条件を受け付ける受付手段と、受付手段
が受け付けた検索条件に対応して符号化されているAVデ
ータの一部を復号する復号手段と、受付手段が受け付け
た検索条件と復号手段で復号されたAVデータとの相関係
数を演算する演算手段と、演算手段が演算した相関係数
を所定の閾値と比較する比較手段と、検索条件または閾
値をインクリメントするインクリメント手段とを備える
ことを特徴とする。
【0024】請求項6に記載の情報処理方法は、検索条
件を受け付ける受付ステップと、受付ステップで受け付
けた検索条件に対応して符号化されているAVデータの一
部を復号する復号ステップと、受付ステップで受け付け
た検索条件と復号ステップで復号されたAVデータとの相
関係数を演算する演算ステップと、演算ステップで演算
した相関係数を所定の閾値と比較する比較ステップと、
検索条件または閾値をインクリメントするインクリメン
トステップとを含むことを特徴とする。
【0025】請求項7に記載の提供媒体は、検索条件を
受け付ける受付ステップと、受付ステップで受け付けた
検索条件に対応して符号化されているAVデータの一部を
復号する復号ステップと、受付ステップで受け付けた検
索条件と復号ステップで復号されたAVデータとの相関係
数を演算する演算ステップと、演算ステップで演算した
相関係数を所定の閾値と比較する比較ステップと、検索
条件または閾値をインクリメントするインクリメントス
テップとを含む処理を情報処理装置に実行させるコンピ
ュータが読み取り可能なプログラムを提供することを特
徴とする。
【0026】請求項8に記載の情報処理装置は、検索条
件を受け付ける受付手段と、受付手段が受け付けた検索
条件に対応して信号特性が階層的に記録されているAVデ
ータから信号特性の一部を抽出する抽出手段と、受付手
段が受け付けた検索条件と抽出手段が抽出した信号特性
との相関係数を演算する演算手段と、演算手段が演算し
た相関係数を所定の閾値と比較する比較手段と、検索条
件または閾値をインクリメントするインクリメント手段
とを備えることを特徴とする。
【0027】請求項13に記載の情報処理方法は、検索
条件を受け付ける受付ステップと、受付ステップで受け
付けた検索条件に対応して信号特性が階層的に記録され
ているAVデータから信号特性の一部を抽出する抽出ステ
ップと、受付ステップで受け付けた検索条件と抽出ステ
ップで抽出した信号特性との相関係数を演算する演算ス
テップと、演算ステップで演算した相関係数を所定の閾
値と比較する比較ステップと、検索条件または閾値をイ
ンクリメントするインクリメントステップとを含むこと
を特徴とする。
【0028】請求項14に記載の提供媒体は、検索条件
を受け付ける受付ステップと、受付ステップで受け付け
た検索条件に対応して信号特性が階層的に記録されてい
るAVデータから信号特性の一部を抽出する抽出ステップ
と、受付ステップで受け付けた検索条件と抽出ステップ
で抽出した信号特性との相関係数を演算する演算ステッ
プと、演算ステップで演算した相関係数を所定の閾値と
比較する比較ステップと、検索条件または閾値をインク
リメントするインクリメントステップとを含む処理を情
報処理装置に実行させるコンピュータが読み取り可能な
プログラムを提供することを特徴とする。
【0029】請求項15に記載の情報記録装置は、入力
されたAVデータの信号特性を検出する検出手段と、検出
手段が検出した信号特性を階層的に記録する記録手段と
を備えることを特徴とする。
【0030】請求項20に記載の情報記録方法は、入力
されたAVデータの信号特性を検出する検出ステップと、
検出ステップで検出した信号特性を階層的に記録する記
録ステップとを含むことを特徴とする。
【0031】請求項21に記載の提供媒体は、入力され
たAVデータの信号特性を検出する検出ステップと、検出
ステップで検出した信号特性を階層的に記録する記録ス
テップとを含む処理を情報記録装置に実行させるコンピ
ュータが読み取り可能なプログラムを提供することを特
徴とする。
【0032】請求項22に記載の記録媒体は、信号特性
が階層的に構成されているAVデータが記録されているこ
とを特徴とする。
【0033】請求項1に記載の情報処理装置、請求項6
に記載の情報処理方法、および請求項7に記載の提供媒
体においては、検索条件を受け付けられ、受け付けられ
た検索条件に対応して符号化されているAVデータの一部
が復号されて、受け付けられた検索条件と復号されたAV
データとの相関係数が演算され、所定の閾値と比較され
る。さらに、検索条件または閾値がインクリメントされ
る。
【0034】請求項8に記載の情報処理装置、請求項1
3に記載の情報処理方法、および請求項14に記載の提
供媒体においては、検索条件が受け付けられ、受け付け
られた検索条件に対応して信号特性が階層的に記録され
ているAVデータから信号特性の一部が抽出されて、受け
付けられた検索条件と抽出された信号特性との相関係数
が演算され、所定の閾値と比較される。さらに、検索条
件または閾値がインクリメントされる。
【0035】請求項15に記載の情報記録装置、請求項
20に記載の情報記録方法、および請求項21に記載の
提供媒体においては、入力されたAVデータの信号特性が
検出されて、検出された信号特性が階層的に記録され
る。
【0036】請求項22に記載の記録媒体においては、
信号特性が階層的に構成されているAVデータが記録され
る。
【0037】
【発明の実施の形態】以下に本発明の実施の形態を説明
するが、特許請求の範囲に記載の発明の各手段と以下の
実施の形態との対応関係を明らかにするために、各手段
の後の括弧内に、対応する実施の形態(但し一例)を付
加して本発明の特徴を記述すると、次のようになる。但
し勿論この記載は、各手段を記載したものに限定するこ
とを意味するものではない。
【0038】請求項1に記載の情報処理装置は、検索条
件を受け付ける受付手段(例えば、図2の平均値計算部
15)と、受付手段が受け付けた検索条件に対応して符
号化されているAVデータの一部を復号する復号手段(例
えば、図2のビット抽出部11)と、受付手段が受け付
けた検索条件と復号手段で復号されたAVデータとの相関
係数を演算する演算手段(例えば、図6のステップS
3)と、演算手段が演算した相関係数を所定の閾値と比
較する比較手段(例えば、図6のステップS3)と、検
索条件または閾値をインクリメントするインクリメント
手段(例えば、図6のステップS6)とを備えることを
特徴とする。
【0039】請求項8に記載の情報処理装置は、検索条
件を受け付ける受付手段(例えば、図9の平均値計算部
53)と、受付手段が受け付けた検索条件に対応して信
号特性が階層的に記録されているAVデータから信号特性
の一部を抽出する抽出手段(例えば、図9の記録データ
読込部51)と、受付手段が受け付けた検索条件と抽出
手段が抽出した信号特性との相関係数を演算する演算手
段(例えば、図6のステップS3)と、演算手段が演算
した相関係数を所定の閾値と比較する比較手段(例え
ば、図6のステップS3)と、検索条件または閾値をイ
ンクリメントするインクリメント手段(例えば、図6の
ステップS6)とを備えることを特徴とする。
【0040】請求項15に記載の情報記録装置は、入力
されたAVデータの信号特性を検出する検出手段(例え
ば、図8(B)のスペクトル変換部41)と、検出手段が
検出した信号特性を階層的に記録する記録手段(例え
ば、図8(B)の媒体記録部34)とを備えることを特徴
とする。
【0041】本発明を適用したオーディオデータ検索装
置の構成について、図1を参照して説明する。このオー
ディオデータ検索装置のバス6には、CPU1、ROM2、RA
M3、ハードディスク(HDD)4、およびインタフェース(I
/F)5が接続されている。
【0042】CPU1は、ROM2に格納されているBIOS(Ba
sic Input/Output System)プログラムに基づいて、ハ
ードディスク4に記憶されている検索プログラムをRAM
3に転送させて記憶させるようになされている。さら
に、CPU1は、RAM3から検索プログラムを読み出して実
行するようになされている。
【0043】ハードディスク4は、上述した検索プログ
ラムとともに、検索対象となる圧縮符号化されたオーデ
ィオデータを記憶するようになれている。インタフェー
ス5は、検索条件の入力を受け付けるようになされてい
る。また、インタフェース5は、検索された結果をディ
スプレイ、またはスピーカ等(いずれも図示せず)に出
力するようになされている。
【0044】なお、このオーディオデータ検索装置は、
検索プログラムに基づいて、オーディオデータの属性情
報(テキスト情報)、および信号特性を検索条件として
検索を行うようになされているが、オーディオデータの
属性情報を検索条件とする検索については、従来の検索
方法と同様であるので、以下の説明においては、オーデ
ィオデータの信号特性を検索条件として検索を行う部分
について説明する。
【0045】図2は、オーディオデータ検索装置の機能
ブロックの構成例を示している。この構成例において
は、図3に示すような波形信号のブロック単位の振幅平
均値を検索条件として符号化オーディオデータが検索さ
れる。
【0046】ビット抽出部11は、ハードディスク4に
記憶されている符号化オーディオデータを順次読み出
し、その中から符号化スペクトル係数の直流成分だけを
抽出してハフマン復号部12に出力する。ハフマン復号
部12は、ビット抽出部11から入力された符号化スペ
クトル係数の直流成分を復号し、得られた量子化スペク
トル係数の直流成分を逆量子化部13に出力する。逆量
子化部13は、ハフマン復号部12から入力された量子
化スペクトル係数の直流成分を逆量子化し、得られたス
ペクトル係数の直流成分を比較判定部14に出力する。
【0047】なお、ここで得られたスペクトル係数の直
流成分は、符号化時における離散コサイン変換の特性に
より、符号化前の元の波形信号の各ブロック毎の振幅平
均値と理論的に等しいことが知られている。したがっ
て、スペクトル係数の直流成分を、さらに逆スペクトル
変換する必要はない。
【0048】平均値計算部15は、検索条件として入力
されたサンプル波形の所定のブロック単位の振幅平均値
を演算して比較判定部14に出力する。
【0049】比較判定部14は、逆量子化部13から入
力されたスペクトル係数の直流成分と、平均値計算部1
5から入力されたサンプル波形の所定のブロック単位の
振幅平均値との相関係数を演算することにより、スペク
トル係数の直流成分の、サンプル波形の振幅平均値に対
する類似度を求める。さらに、比較判定部14は、求め
た類似度と所定の閾値とを比較することにより、両者の
一致、または不一致を判定し、その結果を出力する。な
お、比較判定部14は、類似度の値を出力するようにし
てもよい。
【0050】以上のように、図2の構成例においては、
符号化スペクトル係数の直流成分だけを復号しているの
で、従来の検索方法のように、全ての符号化スペクトル
係数を符号化し、さらに逆スペクトル変換して得られた
波形信号と、サンプル信号を比較する場合に比べて、そ
の処理時間が少ない。また、上述した閾値を徐々に増加
させることにより、検索結果を絞り込むことが可能であ
る。
【0051】図4は、オーディオデータ検索装置の機能
ブロックの他の構成例を示している。この構成例におい
ては、図5に示すように、波形信号のフレーム単位のス
ペクトル係数の一部を検索条件として符号化オーディオ
データが検索される。
【0052】ビット抽出部21は、ハードディスク4に
記憶されている符号化オーディオデータを順次読み出
し、その中から検索条件に対応する周波数帯域の一部
(例えば、図5に示すように周波数の低域側から4番目
までの帯域)の符号化スペクトル係数を抽出してハフマ
ン復号部22に出力する。ハフマン復号部22は、ビッ
ト抽出部21から入力された一部の符号化スペクトル係
数を復号し、得られた量子化スペクトル係数を逆量子化
部23に出力する。逆量子化部23は、ハフマン復号部
22から入力された量子化スペクトル係数を逆量子化
し、得られた一部の周波数帯域のスペクトル係数を比較
判定部24に出力する。
【0053】スペクトル変換部25は、検索条件として
入力されたサンプル波形の任意の周波数帯域のスペクト
ル係数を演算して比較判定部24に出力する。
【0054】比較判定部24は、逆量子化部23から入
力された一部の周波数帯域のスペクトル係数と、スペク
トル変換部25から入力されたサンプル波形の任意の周
波数帯域のスペクトル係数との相関係数を演算すること
により両者の類似度を求める。さらに、比較判定部24
は、求めた類似度と所定の閾値とを比較することによ
り、両者の一致、または不一致を判定し、その結果を出
力する。なお、比較判定部24は、類似度の値を出力す
るようにしてもよい。
【0055】この構成例において検索結果をさらに絞り
込む場合、検索条件となるサンプル波形の周波数帯域の
数、および類似判定の閾値を徐々に増加させて検索を行
えば、検索結果を階層的な詳細度で絞り込むことが可能
である。
【0056】この検索結果の絞り込み処理について、図
6のフローチャートを参照して説明する。ステップS1
において、比較判定部24は、類似度の判定基準となる
閾値を所定の値に初期化する。ステップS2において、
比較判定部24は、検索条件となるサンプル波形の周波
数帯域の数(スペクトル数)を所定の値に初期化する。
【0057】この検索条件の設定に対応し、データベー
ス(ハードディスク4)に記憶されている符号化オーデ
ィオデータが順次読み出され、それらから、検索条件に
対応する周波数帯域のスペクトル係数が、ビット抽出部
21乃至逆量子化部23により復号されて比較判定部2
4に出力される。一方、スペクトル変換部25は、サン
プル波形のスペクトル係数を演算して比較判定部24に
出力する。
【0058】ステップS3において、比較判定部24
は、逆量子化部23から入力された、符号化オーディオ
データのスペクトル係数と、スペクトル変換部25から
入力されたサンプル波形のスペクトル係数との相関係数
(類似度)を演算し、演算した相関係数の値がステップ
S1で設定した閾値よりも大きいものを抽出して検索結
果とする。
【0059】ステップS4において、比較判定部24
は、例えば、ステップS3で検索された符号化オーディ
オデータの数が所定の値以下であるか否かを判定するこ
とにより、検索結果が満足できるものであるか否かを判
定する。ステップS3で検索された符号化オーディオデ
ータの数が所定の値以上であって、検索結果が満足でき
るものではないと判定された場合、ステップS5に進
む。
【0060】ステップS5において、比較判定部24
は、検索条件として設定されているサンプル波形の周波
数帯域の数が、その最大値よりも小さいか否かを判定す
る。検索条件であるサンプル波形の周波数帯域の数(ス
ペクトル数)がその最大値よりも小さいと判定された場
合、ステップS6において、検索条件であるサンプル波
形の周波数帯域の数(スペクトル数)を1だけインクリ
メントしてステップS3に戻る。
【0061】その後、ステップS3乃至S6の処理が繰
り返され、ステップS5において、検索条件であるサン
プル波形の周波数帯域の数が、その最大値よりも小さく
ない(等しい)と判定された場合、ステップS7におい
て、比較判定部24は、類似度の判定基準となる閾値を
所定の値だけインクリメントする。
【0062】その後、ステップS2乃至S7の処理が繰
り返され、ステップS4において、ステップS3で検索
された符号化オーディオデータの数が所定の値以下であ
り、検索結果が満足できるものであると判定された場
合、検索結果の絞り込み処理を終了する。
【0063】図7は、データベースとなる記録媒体に記
録されているオーディオデータのフォーマットの例を示
している。このフォーマットにおいて、各オーディオデ
ータ(データレコード1乃至M)は、各オーディオデー
タを識別するデータ識別番号、属性情報が記述されてい
る属性情報ブロック、並びにオーディオデータの信号特
性が記述されている信号特性情報ブロックから構成され
る。
【0064】属性情報ブロックに記述されてる属性情報
は、例えば、オーディオデータの作者名、曲名、歌手
名、分類、著作権情報、および製作年月日等のテキスト
データである。
【0065】信号特性情報ブロックは、フレーム総数N
を記述する領域、および各フレームのスペクトル係数を
記述する領域(フレームデータ領域)から構成される。
【0066】フレームデータ領域には、分割された周波
数帯域の総数Wと、各周波数帯域のスペクトル係数X1
乃至XWが低い周波数帯域側から順に記述されている。
【0067】なお、このフレームデータ領域には、周波
数帯域の総数Wを1としてスペクトル係数X1に、この
フレームのスペクトル係数の直流成分を記述するように
してもよい。
【0068】図8は、図7に示したフォーマットのオー
ディオデータを記録媒体に記録する情報記録装置の構成
例を示している。図8(A)は、従来の情報符号化装置
(図24)により生成された符号化オーディオデータを
入力信号とする構成例である。入力された符号化オーデ
ィオデータは、ビット抽出部31により所定の符号化ス
ペクトル係数が抽出され、ハフマン復号部32により復
号され、逆量子化部33により逆量子化されて、得られ
たスペクトル係数が媒体記録部34により、図7に示し
たフォーマットで記録媒体35に記録される。
【0069】図8(B)は、オーディオ波形信号を入力信
号とする構成例である。入力されたオーディオ波形信号
は、スペクトル変換部41により、ブロック化され、ブ
ロック単位でスペクトル係数に変換される。得られたス
ペクトル係数は媒体記録部34により、図7に示したフ
ォーマットで記録媒体35に記録される。
【0070】図9は、図7に示したフォーマットのフレ
ームデータ領域に、周波数帯域の総数Wを1としてスペ
クトル係数X1にそのフレームのスペクトル係数の直流
成分を記述した記録媒体35をデータベースとするオー
ディオデータ検索装置の機能ブロックの構成例を示して
いる。
【0071】記録データ読込部51は、記録媒体35に
記録されているオーディオデータの信号特性情報ブロッ
クの中の検索条件に対応するフレームデータ領域のスペ
クトル係数X1(そのフレームのスペクトル係数の直流
成分)を読み込んで比較判定部52に出力する。なお、
スペクトル係数の直流成分は、符号化時における離散コ
サイン変換の特性により、符号化前の元の波形信号の各
ブロック毎の振幅平均値と等しい。
【0072】平均値計算部53は、検索条件として入力
されたサンプル波形のブロック単位の振幅平均値を演算
して比較判定部52に出力する。
【0073】比較判定部52は、記録データ読込部51
から入力されたスペクトル係数の直流成分と、平均値計
算部53から入力されたサンプル波形のブロック単位の
振幅平均値との相関係数を演算することにより、スペク
トル係数の直流成分の、サンプル波形の振幅平均値に対
する類似度を求める。さらに、比較判定部52は、求め
た類似度と所定の閾値とを比較することにより、両者の
一致、または不一致を判定してその結果を出力する。な
お、比較判定部52は、類似度の値を出力するようにし
てもよい。
【0074】以上のように、図9の構成例においては、
符号化スペクトル係数の直流成分だけを復号しているの
で、従来の検索方法のように、全ての符号化スペクトル
係数を符号化し、さらに逆スペクトル変換して得られた
波形信号と、サンプル信号を比較する場合に比べて、そ
の処理時間が少ない。また、上述した閾値を徐々に増加
させることにより、検索結果を絞り込むことが可能であ
る。
【0075】図10は、図7に示したフォーマットのオ
ーディオデータが記録されている記録媒体35をデータ
ベースとするオーディオデータ検索装置の機能ブロック
の構成例を示している。
【0076】記録データ読込部61は、記録媒体35に
記録されているオーディオデータの信号特性情報ブロッ
クの中のフレームデータ領域から、検索条件に対応する
周波数帯域のスペクトル係数だけを読み込んで比較判定
部62に出力する。すなわち、検索結果を絞り込む段階
において、読み込まれるスペクトル係数の数が徐々に増
加される。
【0077】スペクトル変換部63は、検索条件として
入力されたサンプル波形の周波数帯域のスペクトル係数
を演算して比較判定部62に出力する。
【0078】比較判定部62は、記録データ読込部61
から入力された検索条件に対応する周波数帯域のスペク
トル係数と、スペクトル変換部63から入力されたサン
プル波形のスペクトル係数との相関係数を演算すること
により両者の類似度を求める。さらに、比較判定部62
は、求めた類似度と所定の閾値とを比較することによ
り、両者の一致、または不一致を判定してその結果を出
力する。なお、比較判定部62は、類似度の値を出力す
るようにしてもよい。
【0079】この構成において検索結果をさらに絞り込
む場合、検索条件となるサンプル波形の周波数帯域の
数、および類似判定の閾値を徐々に増加させて検索を行
えば、検索結果を階層的な詳細度で絞り込むことが可能
である。
【0080】図11は、図7に示したフォーマットの変
形例を示しており、この変形例のフレームデータ領域に
は、分割された周波数帯域の総数W、各周波数帯域の符
号化スペクトルY1乃至YW、および符号化スペクトルY
1乃至YWを復号するための情報(スペクトルの正規化係
数、量子化幅係数、およびハフマンコード符号帳の番号
等)が記述されている。
【0081】図12は、図11に示したフォーマットの
オーディオデータが記録されている記録媒体35をデー
タベースとするオーディオデータ検索装置の機能ブロッ
クの構成例を示している。記録データ読込部71は、記
録媒体35に記録されているオーディオデータの信号特
性情報ブロックの中のフレームデータ領域から、検索条
件に対応する周波数帯域の符号化スペクトル、およびス
ペクトル復号用情報を読み込んでハフマン復号部72に
出力する。出力された符号化スペクトルは、スペクトル
復号用情報に基づいて、ハフマン復号部72で復号さ
れ、逆量子化部73で逆量子化されて、得られたスペク
トル係数は比較判定部74に出力される。
【0082】スペクトル変換部75は、検索条件として
入力されたサンプル波形の周波数帯域毎のスペクトル係
数を演算して比較判定部74に出力する。
【0083】比較判定部74は、逆量子化部73から入
力された検索条件に対応する周波数帯域のスペクトル係
数と、スペクトル変換部75から入力されたサンプル波
形のスペクトル係数との相関係数を演算することにより
類似度を求める。さらに、比較判定部74は、求めた類
似度と所定の閾値とを比較することにより、両者の一
致、または不一致を判定してその結果を出力する。な
お、比較判定部74は、類似度の値を出力するようにし
てもよい。
【0084】この構成において検索結果をさらに絞り込
む場合、検索条件となるサンプル波形の周波数帯域の
数、および類似判定の閾値を徐々に増加させて検索を行
えば、検索結果を階層的な詳細度で絞り込むことが可能
である。
【0085】図13は、オーディオデータ検索装置のさ
らに他の構成例を示している。この構成例においては、
図14に示すような波形信号の振幅急変点(アタック)
を検索条件として符号化オーディオデータが検索され
る。なお検索される符号化オーディオデータには、アタ
ック情報(アタックの位置、およびレベル)が格納され
ているものとする。
【0086】ビット抽出部81は、ハードディスク4に
記憶されている符号化オーディオデータを順次読み出
し、その中から符号化されているアタック情報を抽出し
て、アタック復元部82に出力する。なお、ここでは全
てのアタック情報が抽出されるのではなく、例えば、所
定のフレーム毎に、フレームの最初の窓区間の最初のア
タック情報のように、検索条件に対応した一部のアタッ
ク特性が抽出される。
【0087】アタック復元部82は、ビット抽出部81
から入力されたアタック情報を復元し、得られたアタッ
クの位置およびレベルを比較判定部83に出力する。
【0088】アタック検出部84は、検索条件として入
力されたサンプル波形のアタック情報を検出して比較判
定部83に出力する。
【0089】比較判定部83は、アタック復元部82か
ら入力されたアタック情報と、アタック検出部84から
入力されたサンプル波形のアタック情報との相関係数を
演算することにより、両者の類似度を求める。さらに、
比較判定部83は、求めた類似度と所定の閾値とを比較
することにより、両者の一致、または不一致を判定して
その結果を出力する。なお、比較判定部83は、類似度
の値を出力するようにしてもよい。
【0090】なお、図13の構成例においては、検索条
件であるアタック情報を抽出する範囲を徐々に増加させ
ることにより、検索結果を絞り込むことが可能である。
【0091】図15は、データベースとなる記録媒体に
記録されているオーディオデータのフォーマットの例を
示している。このフォーマットにおいて、各オーディオ
データ(データレコード1乃至M)は、各オーディオデ
ータを識別するデータ識別番号、属性情報が記述されて
いる属性情報ブロック、並びにオーディオデータの信号
特性が記述されている信号特性情報ブロックから構成さ
れる。
【0092】属性情報ブロックに記述されてる属性情報
は、例えば、オーディオデータの作者名、曲名、歌手
名、分類、著作権情報、および製作年月日等のテキスト
データである。
【0093】信号特性情報ブロックは、フレーム総数N
を記述する領域、および各フレームの信号特性を記述す
る領域(フレームデータ領域)から構成される。フレー
ムデータ領域には、そのフレームに設定された区間窓の
総数Wと、各区間窓のアタック情報が記述され、さらに
各区間窓のアタック情報には、その区間窓に存在するア
タックの総数Tと各アタックの位置およびレベルが記述
されている。なお、アタックの位置は、そのアタックの
フレーム区間内および窓区間内における相対位置で表さ
れる。また、アタックレベルは、そのアタックの振幅急
変度により表される。
【0094】図16は、図15に示したフォーマットの
オーディオデータを記録媒体に記述する情報記録装置の
構成例を示している。図16(A)は、アタック情報が符
号化されている符号化オーディオデータを入力信号とす
る構成例である。ビット抽出部91は、入力された符号
化オーディオデータから所定の符号化されているアタッ
ク情報を抽出する。抽出された符号化されているアタッ
ク情報は、アタック復元部92により復元されて、得ら
れたアタックの位置およびレベルが媒体記録部93によ
り、図15に示したフォーマットで記録媒体94に記録
される。
【0095】図16(B)は、オーディオ波形信号を入力
信号とする構成例である。アタック検出部101は、入
力されたオーディオ波形信号からアタックを検出し、そ
の位置とレベルが、媒体記録部93により、図15に示
したフォーマットで記録媒体94に記録される。
【0096】図17は、図15に示したフォーマットの
オーディオデータが記録されている記録媒体94をデー
タベースとするオーディオデータ検索装置の機能ブロッ
クの構成例を示している。
【0097】記録データ読込部111は、記録媒体94
に記録されているオーディオデータの信号特性情報ブロ
ックの中から、検索条件(例えば、所定のフレーム毎
に、最初の区間窓の最初のアタック情報)に対応する一
部のアタック情報だけを読み込んで比較判定部112に
出力する。
【0098】アタック検出部113は、検索条件として
入力されたサンプル波形のアタックを検出してその位置
とレベルを比較判定部112に出力する。
【0099】比較判定部112は、記録データ読込部1
11から入力された、検索条件に対応するアタック情報
と、アタック検出部113から入力されたサンプル波形
のアタック情報との相関係数を演算することにより両者
の類似度を求める。さらに、比較判定部112は、求め
た類似度と所定の閾値とを比較することにより、両者の
一致、または不一致を判定してその結果を出力する。な
お、比較判定部112は、類似度の値を出力するように
してもよい。
【0100】この構成例において検索結果を絞り込む場
合、例えば、区間窓の数を増やして、検索条件となるサ
ンプル波形から検出するアタック情報を徐々に増加させ
るとともに、類似判定の閾値を徐々に増加させて検索を
行えば、検索結果を階層的な詳細度で絞り込むことが可
能である。
【0101】図18は、オーディオデータ検索装置の機
能ブロックのさらに他の構成例を示している。この構成
例においては、図19に示すような波形信号の周波数帯
域毎のアタックを検索条件としてオーディオ符号化デー
タが検索される。なお検索される符号化オーディオデー
タには、周波数帯域毎のアタック情報(アタックの位
置、およびレベル)が格納されているものとする。
【0102】ビット抽出部121は、ハードディスク4
に記憶されている符号化オーディオデータを順次読み出
し、その中から符号化されているアタック情報を抽出し
て、アタック復元部122に出力する。なお、ここでは
全てのアック情報が抽出されるのではなく、検索条件
(例えば、所定のフレーム毎に、最低周波数帯域の最初
の区間窓の最初のアタック情報)に対応した一部のアタ
ック特性が抽出される。
【0103】アタック復元部122は、ビット抽出部1
21から入力された符号化されているアタック情報を復
元し、得られたアタックの位置およびレベルを比較判定
部123に出力する。
【0104】帯域分割部124は、検索条件として入力
されたサンプル波形を所定の周波数帯域に分割してアタ
ック検出部125に出力する。アタック検出部125
は、帯域分割部124から入力された帯域分割されたサ
ンプル波形から、各帯域のアタック情報を検出して、そ
の位置とレベルを比較判定部123に出力する。
【0105】比較判定部123は、アタック復元部12
2から入力された周波数帯域毎のアタック情報と、アタ
ック検出部125から入力されたサンプル波形の周波数
帯域毎のアタック情報との相関係数を演算することによ
り、両者の類似度を求める。さらに、比較判定部123
は、求めた類似度と所定の閾値とを比較することによ
り、両者の一致、または不一致を判定してその結果を出
力する。なお、比較判定部123は、類似度の値を出力
するようにしてもよい。
【0106】なお、図18の構成においては、検索条件
であるアタック情報を抽出する周波数帯域の数等を徐々
に増加させることにより、検索結果を絞り込むことが可
能である。
【0107】図20は、データベースとなる記録媒体に
記録されているオーディオデータのフォーマットの例を
示している。このフォーマットにおいて、各オーディオ
データ(データレコード1乃至M)は、オーディオデー
タを識別するデータ識別番号、属性情報が記述されてい
る属性情報ブロック、並びにオーディオデータの信号特
性が記述されている信号特性情報ブロックから構成され
る。
【0108】属性情報ブロックに記述されてる属性情報
は、例えば、オーディオデータの作者、曲名、歌手名、
分類、著作権情報、および製作年月日等のテキストデー
タである。
【0109】信号特性情報ブロックは、フレーム総数N
を記述する領域、および各フレームの信号特性を記述す
る領域(フレームデータ領域)から構成される。
【0110】フレームデータ領域には、分割された周波
数帯域の総数Kと、周波数帯域別のアタック情報が記述
されている。
【0111】周波数帯域別のアタック情報には、そのフ
レームに設定された区間窓の総数Wと、各区間窓のアタ
ック情報が記述され、各区間窓のアタック情報には、ア
タックの総数Tと各アタックの位置およびレベルが記述
されている。
【0112】なお、図20に示したフォーマットのオー
ディオデータを記録媒体に記述する情報記録装置の構成
は、図16に示した情報記録装置の構成と同様であるの
で、その説明を省略する。
【0113】図21は、図20に示したフォーマットの
オーディオデータが記録されている記録媒体94をデー
タベースとするオーディオデータ検索装置の機能ブロッ
クの構成例を示している。
【0114】記録データ読込部131は、記録媒体94
に記録されているオーディオデータの信号特性情報ブロ
ックの中から、検索条件(例えば、所定のフレーム毎
に、最低周波数帯域の最初の窓区間の最初のアタック情
報)に対応する一部のアタック情報だけを読み込んで比
較判定部132に出力する。
【0115】帯域分割部133は、検索条件として入力
されたサンプル波形を所定の周波数帯域に分割して、ア
タック検出部134に出力する。アタック検出部134
は、周波数帯域別のアタックを検出して、その位置とレ
ベルを比較判定部132に出力する。
【0116】比較判定部132は、記録データ読込部1
31から入力された検索条件に対応する周波数帯域別の
アタック情報と、アタック検出部134から入力された
サンプル波形の周波数帯域別のアタック情報との相関係
数を演算することにより、両者の類似度を求める。さら
に、比較判定部132は、求めた類似度と所定の閾値と
を比較することにより、両者の一致、または不一致を判
定してその結果を出力する。なお、比較判定部132
は、類似度の値を出力するようにしてもよい。
【0117】この構成において検索結果を絞り込む場
合、例えば、検索条件の周波数帯域の数を徐々に増加さ
せるとともに、類似判定の閾値を徐々に増加させて検索
を行えば、検索結果を階層的な詳細度で絞り込むことが
可能である。
【0118】なお、本実施の形態においては、記録媒体
に記録されている符号化オーディオデータをデータベー
スとして検索するようにしたが、順次入力されてくるオ
ーディオデータのビットストリームをデータベースとし
て検索することも可能である。
【0119】図22は、そのようなオーディオ符号化デ
ータのビットストリームのフォーマットを一例を示して
いる。このビットストリームは、全体ヘッダに続いて各
フレームのデータが、順次、格納されている。各フレー
ムのデータは、フレームヘッダ、スペクトル復号情報、
および符号化スペクトルから構成されている。スペクト
ル復号情報には、スペクトルの復号に必要な正規化係数
および量子化幅係数、並びにアタック情報等が格納され
ており、さらに、アタック情報には、アタック数、アタ
ックの位置、およびレベルが格納されている。
【0120】また、本発明は、オーディオデータの検索
だけでなく、ビデオデータの検索にも適用することが可
能である。
【0121】なお、上記各処理を行うコンピュータプロ
グラムは、磁気ディスク、CD-ROM等の情報記録媒体より
なる提供媒体のほか、インターネット、デジタル衛星な
どのネットワーク提供媒体を介してユーザに提供するこ
とができる。
【0122】
【発明の効果】以上のように、請求項1に記載の情報処
理装置、請求項6に記載の情報処理方法、および請求項
7に記載の提供媒体によれば、検索条件に対応して符号
化されているAVデータの一部を復号し、復号したAVデー
タと検索条件との相関係数を演算して所定の閾値と比較
し、さらに、検索条件または閾値をインクリメントする
ようにしたので、信号特性を検索条件として、AVデータ
を効率よく検索することが可能となる。
【0123】請求項8に記載の情報処理装置、請求項1
3に記載の情報処理方法、および請求項14に記載の提
供媒体によれば、検索条件に対応して信号特性が階層的
に記録されているAVデータから信号特性の一部を抽出
し、抽出した信号特性と検索条件との相関係数を演算し
て所定の閾値と比較し、さらに検索条件または閾値をイ
ンクリメントするようにしたので、信号特性を検索条件
として、AVデータを効率よく検索することが可能とな
る。
【0124】請求項15に記載の情報記録装置、請求項
20に記載の情報記録方法、および請求項21に記載の
提供媒体によれば、入力されたAVデータの信号特性を検
出し、検出した信号特性を階層的に記録するようにした
ので、信号特性の一部を抽出することが可能となる。
【0125】請求項22に記載の記録媒体によれば、信
号特性が階層的に構成されているAVデータが記録されて
いるので、信号特性の一部を抽出することが可能とな
る。
【図面の簡単な説明】
【図1】本発明を適用したオーディオデータ検索装置の
構成例を示すブロック図である。
【図2】図1のオーディオデータ検索装置の機能的な構
成例を示すブロック図である。
【図3】検索条件を説明する図である。
【図4】図1のオーディオデータ検索装置の機能的な構
成例を示すブロック図である。
【図5】検索条件を説明する図である。
【図6】検索結果の絞り込み処理を説明するフローチャ
ートである。
【図7】信号特性が階層的に記録されている記録媒体の
フォーマットの例を示す図である。
【図8】図7に示したフォーマットで信号特性を記録す
る情報記録装置の構成例を示している。
【図9】図1のオーディオデータ検索装置の機能的な構
成例を示すブロック図である。
【図10】図1のオーディオデータ検索装置の機能的な
構成例を示すブロック図である。
【図11】信号特性が階層的に記録されている記録媒体
のフォーマットの例を示す図である。
【図12】図1のオーディオデータ検索装置の機能的な
構成例を示すブロック図である。
【図13】図1のオーディオデータ検索装置の機能的な
構成例を示すブロック図である。
【図14】検索条件を説明する図である。
【図15】信号特性が階層的に記録されている記録媒体
のフォーマットの例を示す図である。
【図16】図15に示したフォーマットで信号特性を記
録する情報記録装置の構成例を示している。
【図17】図1のオーディオデータ検索装置の機能的な
構成例を示すブロック図である。
【図18】図1のオーディオデータ検索装置の機能的な
構成例を示すブロック図である。
【図19】検索条件を説明する図である。
【図20】信号特性が階層的に記録されている記録媒体
のフォーマットの例を示す図である。
【図21】図1のオーディオデータ検索装置の機能的な
構成例を示すブロック図である。
【図22】信号特性が階層的に格納されているビットス
トリームのフォーマットの例を示す図である。
【図23】従来のオーディオデータ検索装置の構成例を
示すブロック図である。
【図24】従来の符号化装置の構成を示すブロック図で
ある。
【図25】図23の復号部154の構成を示すブロック
図である。
【符号の説明】
1 CPU, 2 ROM, 3 RAM, 4 ハードディス
ク, 5 インタフェース, 6 バス, 11 ビッ
ト抽出部, 12 ハフマン復号部, 13逆量子化
部, 14 比較判定部, 15 平均値計算部, 2
1 ビット抽出部, 22 ハフマン復号部, 23
逆量子化部, 24 比較判定部, 25 スペクトル
変換部, 31 ビット抽出部, 32 ハフマン復号
部, 33 逆量子化部, 34 媒体記録部, 35
記録媒体, 41 スペクトル変換部, 51 記録
データ読込部, 52 比較判定部, 53 平均値計
算部, 61 記録データ読込部, 62 比較判定
部, 63 スペクトル判定部, 71 データ読込
部, 72 ハフマン復号部, 73 逆量子化部,7
4 比較判定部, 75 スペクトル変換部, 81
ビット抽出部, 82アタック復元部, 83 比較判
定部, 84 アタック検出部, 91 ビット抽出
部, 92 アタック復元部, 93 媒体記録部,
94 記録媒体, 101 アタック検出部, 111
記録データ読込部, 112 比較判定部, 113
アタック検出部, 121 ビット抽出部, 122
アタック復元部, 123 比較判定部, 124
帯域分割部, 125 アタック検出部, 131 記
録データ読込部, 132 比較判定部, 133 帯
域分割部, 134 アタック検出部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04N 7/13 Z

Claims (22)

    【特許請求の範囲】
  1. 【請求項1】 符号化されているAVデータを検索する情
    報処理装置において、 検索条件を受け付ける受付手段と、 前記受付手段が受け付けた検索条件に対応して前記符号
    化されているAVデータの一部を復号する復号手段と、 前記受付手段が受け付けた検索条件と前記復号手段で復
    号されたAVデータとの相関係数を演算する演算手段と、 前記演算手段が演算した前記相関係数を所定の閾値と比
    較する比較手段と、 前記検索条件または前記閾値をインクリメントするイン
    クリメント手段とを備えることを特徴とする情報処理装
    置。
  2. 【請求項2】 前記検索条件は、ブロック毎のスペクト
    ル係数の平均値であることを特徴とする請求項1に記載
    の情報処理装置。
  3. 【請求項3】 前記検索条件は、周波数帯域毎のスペク
    トル係数値であることを特徴とする請求項1に記載の情
    報処理装置。
  4. 【請求項4】 前記検索条件は、ブロック毎のアタック
    情報であることを特徴とする請求項1に記載の情報処理
    装置。
  5. 【請求項5】 前記検索条件は、周波数帯域毎のアタッ
    ク情報であることを特徴とする請求項1に記載の情報処
    理装置。
  6. 【請求項6】 符号化されているAVデータを検索する情
    報処理方法において、 検索条件を受け付ける受付ステップと、 前記受付ステップで受け付けた検索条件に対応して前記
    符号化されているAVデータの一部を復号する復号ステッ
    プと、 前記受付ステップで受け付けた検索条件と前記復号ステ
    ップで復号されたAVデータとの相関係数を演算する演算
    ステップと、 前記演算ステップで演算した前記相関係数を所定の閾値
    と比較する比較ステップと、 前記検索条件または前記閾値をインクリメントするイン
    クリメントステップとを含むことを特徴とする情報処理
    方法。
  7. 【請求項7】 符号化されているAVデータを検索する情
    報処理装置に、 検索条件を受け付ける受付ステップと、 前記受付ステップで受け付けた検索条件に対応して前記
    符号化されているAVデータの一部を復号する復号ステッ
    プと、 前記受付ステップで受け付けた検索条件と前記復号ステ
    ップで復号されたAVデータとの相関係数を演算する演算
    ステップと、 前記演算ステップで演算した前記相関係数を所定の閾値
    と比較する比較ステップと、 前記検索条件または前記閾値をインクリメントするイン
    クリメントステップとを含む処理を実行させるコンピュ
    ータが読み取り可能なプログラムを提供することを特徴
    とする提供媒体。
  8. 【請求項8】 信号特性が階層的に記録されているAVデ
    ータを検索する情報処理装置において、 検索条件を受け付ける受付手段と、 前記受付手段が受け付けた検索条件に対応して前記信号
    特性が階層的に記録されているAVデータから信号特性の
    一部を抽出する抽出手段と、 前記受付手段が受け付けた検索条件と前記抽出手段が抽
    出した信号特性との相関係数を演算する演算手段と、 前記演算手段が演算した前記相関係数を所定の閾値と比
    較する比較手段と、 前記検索条件または前記閾値をインクリメントするイン
    クリメント手段とを備えることを特徴とする情報処理装
    置。
  9. 【請求項9】 前記検索条件は、ブロック毎のスペクト
    ル係数の平均値であることを特徴とする請求項8に記載
    の情報処理装置。
  10. 【請求項10】 前記検索条件は、周波数帯域毎のスペ
    クトル係数値であることを特徴とする請求項8に記載の
    情報処理装置。
  11. 【請求項11】 前記検索条件は、ブロック毎のアタッ
    ク情報であることを特徴とする請求項8に記載の情報処
    理装置。
  12. 【請求項12】 前記検索条件は、周波数帯域毎のアタ
    ック情報であることを特徴とする請求項8に記載の情報
    処理装置。
  13. 【請求項13】 信号特性が階層的に記録されているAV
    データを検索する情報処理方法において、 検索条件を受け付ける受付ステップと、 前記受付ステップで受け付けた検索条件に対応して前記
    信号特性が階層的に記録されているAVデータから信号特
    性の一部を抽出する抽出ステップと、 前記受付ステップで受け付けた検索条件と前記抽出ステ
    ップで抽出した信号特性との相関係数を演算する演算ス
    テップと、 前記演算ステップで演算した前記相関係数を所定の閾値
    と比較する比較ステップと、 前記検索条件または前記閾値をインクリメントするイン
    クリメントステップとを含むことを特徴とする情報処理
    方法。
  14. 【請求項14】 信号特性が階層的に記録されているAV
    データを検索する情報処理装置に、 検索条件を受け付ける受付ステップと、 前記受付ステップで受け付けた検索条件に対応して前記
    信号特性が階層的に記録されているAVデータから信号特
    性の一部を抽出する抽出ステップと、 前記受付ステップで受け付けた検索条件と前記抽出ステ
    ップで抽出した信号特性との相関係数を演算する演算ス
    テップと、 前記演算ステップで演算した前記相関係数を所定の閾値
    と比較する比較ステップと、 前記検索条件または前記閾値をインクリメントするイン
    クリメントステップとを含む処理を実行させるコンピュ
    ータが読み取り可能なプログラムを提供することを特徴
    とする提供媒体。
  15. 【請求項15】 入力されたAVデータの信号特性を検出
    する検出手段と、 前記検出手段が検出した信号特性を階層的に記録する記
    録手段とを備えることを特徴とする情報記録装置。
  16. 【請求項16】 前記信号特性は、ブロック毎のスペク
    トル係数の平均値であることを特徴とする請求項15に
    記載の情報記録装置。
  17. 【請求項17】 前記信号特性は、周波数帯域毎のスペ
    クトル係数値であることを特徴とする請求項15に記載
    の情報記録装置。
  18. 【請求項18】 前記信号特性は、ブロック毎のアタッ
    ク情報であることを特徴とする請求項15に記載の情報
    記録装置。
  19. 【請求項19】 前記信号特性は、周波数帯域毎のアタ
    ック情報であることを特徴とする請求項15に記載の情
    報記録装置。
  20. 【請求項20】 入力されたAVデータの信号特性を検出
    する検出ステップと、 前記検出ステップで検出した信号特性を階層的に記録す
    る記録ステップとを含むことを特徴とする情報記録方
    法。
  21. 【請求項21】 入力されたAVデータの信号特性を検出
    する検出ステップと、 前記検出ステップで検出した信号特性を階層的に記録す
    る記録ステップとを含む処理を情報記録装置に実行させ
    るコンピュータが読み取り可能なプログラムを提供する
    ことを特徴とする提供媒体。
  22. 【請求項22】 信号特性が階層的に構成されているAV
    データが記録されていることを特徴とする記録媒体。
JP26911498A 1998-09-24 1998-09-24 情報処理装置および方法、情報記録装置および方法、記録媒体、並びに提供媒体 Withdrawn JP2000101439A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP26911498A JP2000101439A (ja) 1998-09-24 1998-09-24 情報処理装置および方法、情報記録装置および方法、記録媒体、並びに提供媒体
US09/397,234 US6532445B1 (en) 1998-09-24 1999-09-16 Information processing for retrieving coded audiovisual data
KR19990040891A KR100661040B1 (ko) 1998-09-24 1999-09-22 정보 처리 장치 및 방법, 정보 기록 장치 및 방법, 기록 매체 및 제공 매체
EP19990118810 EP0989754A2 (en) 1998-09-24 1999-09-23 Information processing apparatus and method, information recording apparatus and method, recording medium, and distribution medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26911498A JP2000101439A (ja) 1998-09-24 1998-09-24 情報処理装置および方法、情報記録装置および方法、記録媒体、並びに提供媒体

Publications (1)

Publication Number Publication Date
JP2000101439A true JP2000101439A (ja) 2000-04-07

Family

ID=17467878

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26911498A Withdrawn JP2000101439A (ja) 1998-09-24 1998-09-24 情報処理装置および方法、情報記録装置および方法、記録媒体、並びに提供媒体

Country Status (4)

Country Link
US (1) US6532445B1 (ja)
EP (1) EP0989754A2 (ja)
JP (1) JP2000101439A (ja)
KR (1) KR100661040B1 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002258873A (ja) * 2001-03-01 2002-09-11 Sony Corp 音楽認識装置及び音楽サービスシステム
JP2002304185A (ja) * 2001-04-04 2002-10-18 Video Research:Kk 著作権管理システム、著作権管理方法及びプログラム
JP2007206037A (ja) * 2006-02-06 2007-08-16 Nippon Telegr & Teleph Corp <Ntt> 信号測定分析装置
JP2007256487A (ja) * 2006-03-22 2007-10-04 Sanyo Electric Co Ltd 音楽信号蓄積装置および音楽信号蓄積プログラム
JP2008191675A (ja) * 2001-04-24 2008-08-21 Microsoft Corp デジタル信号をハッシュする方法
JP2009058548A (ja) * 2007-08-30 2009-03-19 Oki Electric Ind Co Ltd 音声検索装置
JP2011053563A (ja) * 2009-09-03 2011-03-17 Neikusu:Kk 音声データ内の音声キーワード照合システム、その方法及び音声データ内の音声キーワード照合プログラム
WO2013136846A1 (ja) * 2012-03-12 2013-09-19 クラリオン株式会社 音響信号処理装置および音響信号処理方法
US8595276B2 (en) 2004-04-30 2013-11-26 Microsoft Corporation Randomized signal transforms and their applications
CN111191671A (zh) * 2019-11-18 2020-05-22 广东浩迪智云技术有限公司 一种用电器波形检测方法、系统、电子设备及存储介质

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6711558B1 (en) 2000-04-07 2004-03-23 Washington University Associative database scanning and information retrieval
JP4053424B2 (ja) * 2001-01-17 2008-02-27 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ロバスト・チェックサム
GB0103242D0 (en) * 2001-02-09 2001-03-28 Radioscape Ltd Method of analysing a compressed signal for the presence or absence of information content
GB0103245D0 (en) * 2001-02-09 2001-03-28 Radioscape Ltd Method of inserting additional data into a compressed signal
JP2003143015A (ja) * 2001-11-07 2003-05-16 Sony Corp 信号処理方法及び装置並びに符号列生成方法及び装置
US20070277036A1 (en) 2003-05-23 2007-11-29 Washington University, A Corporation Of The State Of Missouri Intelligent data storage and processing using fpga devices
US10572824B2 (en) 2003-05-23 2020-02-25 Ip Reservoir, Llc System and method for low latency multi-functional pipeline with correlation logic and selectively activated/deactivated pipelined data processing engines
CN1707612B (zh) * 2004-06-08 2010-11-17 深圳市朗科科技有限公司 一种视听播放装置及其播放方法
US7917299B2 (en) 2005-03-03 2011-03-29 Washington University Method and apparatus for performing similarity searching on a data stream with respect to a query string
US8326819B2 (en) 2006-11-13 2012-12-04 Exegy Incorporated Method and system for high performance data metatagging and data indexing using coprocessors
US7660793B2 (en) 2006-11-13 2010-02-09 Exegy Incorporated Method and system for high performance integration, processing and searching of structured and unstructured data using coprocessors
JP5604275B2 (ja) * 2010-12-02 2014-10-08 富士通テン株式会社 相関低減方法、音声信号変換装置および音響再生装置
US9641892B2 (en) 2014-07-15 2017-05-02 The Nielsen Company (Us), Llc Frequency band selection and processing techniques for media source detection
CN105139863B (zh) * 2015-06-26 2020-07-21 司法鉴定科学研究院 一种音频频域连续性图谱计算方法
CN105100363A (zh) * 2015-06-29 2015-11-25 小米科技有限责任公司 信息处理方法、装置及终端
WO2018119035A1 (en) 2016-12-22 2018-06-28 Ip Reservoir, Llc Pipelines for hardware-accelerated machine learning
US11289070B2 (en) 2018-03-23 2022-03-29 Rankin Labs, Llc System and method for identifying a speaker's community of origin from a sound sample
WO2020014354A1 (en) * 2018-07-10 2020-01-16 John Rankin System and method for indexing sound fragments containing speech
US11699037B2 (en) 2020-03-09 2023-07-11 Rankin Labs, Llc Systems and methods for morpheme reflective engagement response for revision and transmission of a recording to a target individual
KR102550687B1 (ko) * 2021-02-01 2023-07-03 인하대학교 산학협력단 검색량 데이터와 var 분석을 이용한 탄소 배출권 가격 예측 시스템 및 그 방법

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55158715A (en) 1979-05-29 1980-12-10 Sony Corp Gain control circuit
US5042069A (en) 1989-04-18 1991-08-20 Pacific Communications Sciences, Inc. Methods and apparatus for reconstructing non-quantized adaptively transformed voice signals
JPH03285190A (ja) * 1990-03-30 1991-12-16 Toppan Printing Co Ltd 音源検出装置
CN1062963C (zh) 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
JP3134337B2 (ja) 1991-03-30 2001-02-13 ソニー株式会社 ディジタル信号符号化方法
JP3134338B2 (ja) 1991-03-30 2001-02-13 ソニー株式会社 ディジタル音声信号符号化方法
US5436653A (en) * 1992-04-30 1995-07-25 The Arbitron Company Method and system for recognition of broadcast segments
US5437050A (en) * 1992-11-09 1995-07-25 Lamb; Robert G. Method and apparatus for recognizing broadcast information using multi-frequency magnitude detection
JP3186292B2 (ja) 1993-02-02 2001-07-11 ソニー株式会社 高能率符号化方法及び装置
JP3186307B2 (ja) 1993-03-09 2001-07-11 ソニー株式会社 圧縮データ記録装置及び方法
JP3531177B2 (ja) 1993-03-11 2004-05-24 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法
US5581654A (en) 1993-05-25 1996-12-03 Sony Corporation Method and apparatus for information encoding and decoding
JP3125543B2 (ja) 1993-11-29 2001-01-22 ソニー株式会社 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体
KR100352351B1 (ko) 1994-02-05 2003-01-06 소니 가부시끼 가이샤 정보부호화방법및장치와정보복호화방법및장치
JP3186412B2 (ja) 1994-04-01 2001-07-11 ソニー株式会社 情報符号化方法、情報復号化方法、及び情報伝送方法
JPH07298271A (ja) * 1994-04-28 1995-11-10 Matsushita Electric Ind Co Ltd 動画像符号化における動きベクトル検出方法及び装置
JP3277692B2 (ja) 1994-06-13 2002-04-22 ソニー株式会社 情報符号化方法、情報復号化方法及び情報記録媒体
JP3498375B2 (ja) 1994-07-20 2004-02-16 ソニー株式会社 ディジタル・オーディオ信号記録装置
US5918222A (en) * 1995-03-17 1999-06-29 Kabushiki Kaisha Toshiba Information disclosing apparatus and multi-modal information input/output system
US6078915A (en) * 1995-11-22 2000-06-20 Fujitsu Limited Information processing system
JP3521596B2 (ja) 1996-01-30 2004-04-19 ソニー株式会社 信号符号化方法
DE69729495T2 (de) * 1996-03-08 2004-10-28 Matsushita Electric Industrial Co., Ltd., Kadoma Bildinformationsverarbeitungssystem und Mikroprozessor für die geschützte Reproduktion von audiovisuellen Daten
MY119560A (en) * 1996-05-27 2005-06-30 Nippon Telegraph & Telephone Scheme for detecting captions in coded video data without decoding coded video data
JPH1084284A (ja) 1996-09-06 1998-03-31 Sony Corp 信号再生方法および装置
US6295380B1 (en) * 1997-02-27 2001-09-25 Matsushita Electric Industrial Co., Ltd. Object data processing apparatus, object data recording apparatus, data storage media, data structure for transmission
TW384434B (en) * 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
US6027026A (en) * 1997-09-18 2000-02-22 Husain; Abbas M. Digital audio recording with coordinated handwritten notes

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002258873A (ja) * 2001-03-01 2002-09-11 Sony Corp 音楽認識装置及び音楽サービスシステム
JP4506004B2 (ja) * 2001-03-01 2010-07-21 ソニー株式会社 音楽認識装置
JP2002304185A (ja) * 2001-04-04 2002-10-18 Video Research:Kk 著作権管理システム、著作権管理方法及びプログラム
JP2008191675A (ja) * 2001-04-24 2008-08-21 Microsoft Corp デジタル信号をハッシュする方法
US8595276B2 (en) 2004-04-30 2013-11-26 Microsoft Corporation Randomized signal transforms and their applications
JP2007206037A (ja) * 2006-02-06 2007-08-16 Nippon Telegr & Teleph Corp <Ntt> 信号測定分析装置
JP2007256487A (ja) * 2006-03-22 2007-10-04 Sanyo Electric Co Ltd 音楽信号蓄積装置および音楽信号蓄積プログラム
JP2009058548A (ja) * 2007-08-30 2009-03-19 Oki Electric Ind Co Ltd 音声検索装置
JP2011053563A (ja) * 2009-09-03 2011-03-17 Neikusu:Kk 音声データ内の音声キーワード照合システム、その方法及び音声データ内の音声キーワード照合プログラム
WO2013136846A1 (ja) * 2012-03-12 2013-09-19 クラリオン株式会社 音響信号処理装置および音響信号処理方法
CN104185870A (zh) * 2012-03-12 2014-12-03 歌乐株式会社 声学信号处理装置和声学信号处理方法
US9280986B2 (en) 2012-03-12 2016-03-08 Clarion Co., Ltd. Acoustic signal processing device and acoustic signal processing method
CN111191671A (zh) * 2019-11-18 2020-05-22 广东浩迪智云技术有限公司 一种用电器波形检测方法、系统、电子设备及存储介质
CN111191671B (zh) * 2019-11-18 2023-11-14 广东浩迪智云技术有限公司 一种用电器波形检测方法、系统、电子设备及存储介质

Also Published As

Publication number Publication date
US6532445B1 (en) 2003-03-11
EP0989754A2 (en) 2000-03-29
KR20000023379A (ko) 2000-04-25
KR100661040B1 (ko) 2006-12-26

Similar Documents

Publication Publication Date Title
KR100661040B1 (ko) 정보 처리 장치 및 방법, 정보 기록 장치 및 방법, 기록 매체 및 제공 매체
JP5826291B2 (ja) 音声信号からの特徴フィンガープリントの抽出及びマッチング方法
KR100896737B1 (ko) 오디오 신호의 견고한 분류를 위한 장치 및 방법, 오디오신호 데이터베이스를 설정 및 운영하는 방법, 및 컴퓨터프로그램
US7752041B2 (en) Method and apparatus for encoding/decoding digital signal
US7460994B2 (en) Method and apparatus for producing a fingerprint, and method and apparatus for identifying an audio signal
US8612215B2 (en) Method and apparatus to extract important frequency component of audio signal and method and apparatus to encode and/or decode audio signal using the same
JP5265853B2 (ja) 処理装置、処理方法、記録媒体、符号化方法及び復号化方法
Tzanetakis et al. Sound analysis using MPEG compressed audio
JP2006048043A (ja) オーディオデータの高周波数の復元方法及びその装置
JP2006011456A (ja) 低ビット率符号化/復号化方法及び装置並びにコンピュータ可読媒体
KR20010021226A (ko) 디지털 음향 신호 부호화 장치, 디지털 음향 신호 부호화방법 및 디지털 음향 신호 부호화 프로그램을 기록한 매체
KR20090110244A (ko) 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치
US20040002854A1 (en) Audio coding method and apparatus using harmonic extraction
US8149927B2 (en) Method of and apparatus for encoding/decoding digital signal using linear quantization by sections
US20020169601A1 (en) Encoding device, decoding device, and broadcast system
US6772113B1 (en) Data processing apparatus for processing sound data, a data processing method for processing sound data, a program providing medium for processing sound data, and a recording medium for processing sound data
JP2003108197A (ja) オーディオ信号復号化装置およびオーディオ信号符号化装置
US20100185713A1 (en) Feature extraction apparatus, feature extraction method, and program thereof
Joseph et al. Wavelet energy based voice activity detection and adaptive thresholding for efficient speech coding
RU2409874C9 (ru) Сжатие звуковых сигналов
Ghouti et al. A robust perceptual audio hashing using balanced multiwavelets
JP2008107629A (ja) オーディオ信号の符号化復号化方法、この方法を実施するための装置及びプログラム
Yin et al. Robust online music identification using spectral entropy in the compressed domain

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060110