JP2007072023A - 情報処理装置及び情報処理方法 - Google Patents

情報処理装置及び情報処理方法 Download PDF

Info

Publication number
JP2007072023A
JP2007072023A JP2005257238A JP2005257238A JP2007072023A JP 2007072023 A JP2007072023 A JP 2007072023A JP 2005257238 A JP2005257238 A JP 2005257238A JP 2005257238 A JP2005257238 A JP 2005257238A JP 2007072023 A JP2007072023 A JP 2007072023A
Authority
JP
Japan
Prior art keywords
information
processing apparatus
music
information processing
audio data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005257238A
Other languages
English (en)
Inventor
Takashi Hasegawa
長谷川  隆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2005257238A priority Critical patent/JP2007072023A/ja
Priority to US11/515,906 priority patent/US20070051230A1/en
Priority to CNA2006101289917A priority patent/CN1928990A/zh
Publication of JP2007072023A publication Critical patent/JP2007072023A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/36Accompaniment arrangements
    • G10H1/361Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
    • G10H1/368Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems displaying animated or moving pictures synchronized with the music or audio part
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/066Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for pitch analysis as part of wider processing for musical purposes, e.g. transcription, musical performance evaluation; Pitch recognition, e.g. in polyphonic sounds; Estimation or use of missing fundamental
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/121Musical libraries, i.e. musical databases indexed by musical parameters, wavetables, indexing schemes using musical parameters, musical rule bases or knowledge bases, e.g. for automatic composing methods
    • G10H2240/131Library retrieval, i.e. searching a database or selecting a specific musical piece, segment, pattern, rule or parameter set
    • G10H2240/141Library retrieval matching, i.e. any of the steps of matching an inputted segment or phrase with musical database contents, e.g. query by humming, singing or playing; the steps may include, e.g. musical analysis of the input, musical feature extraction, query formulation, or details of the retrieval process

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

【課題】録画された音楽番組等において、番組中に演奏された音楽と他の音楽コンテンツとの同一性を判定したり、演奏された音楽に関する情報を取得したり、該演奏の音質を向上させたり、該演奏映像を音楽コンテンツに付与する音楽コンテンツ高付加価値化方法を提供する。
【解決手段】2つのコンテンツから音高列特徴情報並びに音量の時間変化規則性特徴情報を抽出し、音楽であるか否かを求め、音楽であると判定された部分に対して、該情報を該部分途中から比較することによりコンテンツ内の音楽の同一性を判定する。また、予め蓄積された複数の音楽コンテンツから構成されるデータベース上のコンテンツとの同一性判定によって、該データベースのどの音楽と同一か判定することによりコンテンツの音楽を同定することによりコンテンツ内の音楽を検索する。
【選択図】 図1

Description

本発明は、音響の特徴情報を用いて該音響と類似する音響を検索する情報処理装置及び情報処理方法並びにプログラムに関する。
従来から、与えられた音楽の音高と音量を求め、これらから曖昧度を含む論理式を構成し音楽の検索を行う方法が考案されていた(特許文献1参照)。
また、検索キーとして音楽に人手で付与されたインデックス、または曲頭の特徴量を用い、一の音楽コンテンツに二の音楽コンテンツを置換する方法も考案されていた(特許文献2)。
特開2001−52004号公報 特開2004−134010号公報
しかし、特許文献1では、検索にあたって音高と音量に基づいているため、音高が検出し難い曲(例えば、ラップ等)の検索の際には精度良く検索することが難しかった。また、検索キーの音楽とデータベースの音楽のテンポが異なる場合(ライブ映像とCD等)、ユーザが指定する曖昧度によって検索精度が変わる上に、ユーザが適切な値を入力しなければならず、使い勝手が十分ではなかった。
また、特許文献2では、検索キーとして音楽に人手で付与されたインデックス、または曲頭の特徴量を用いるため、音楽番組等、曲頭に音声や拍手等が混入している場合には精度の良い検索はできず、使い勝手が十分ではなかった。
本発明は、上記した課題に鑑みてなされたものであり、その目的は、音響検索における使い勝手を向上させることである。
上記課題を解決するために、本発明に係る情報処理装置は、音声データを含むデータが入力する入力部と、前記入力部から入力した音声データから音高列情報と音量の時間変化の規則性情報を含む特徴情報を抽出する抽出手段と、前記抽出手段により抽出した特徴情報と所定の音声データの特徴情報との類似性を判定する判定手段と、を備える構成とした。
また、音声データの類似性を判定する特徴情報である音高列情報は正規化された音量の時間変化の規則性情報により正規化されたものとした。これによりテンポの異なる音声データの類似性判定も精度良く行うことが可能となる。
さらに、抽出した特徴情報に基づき、音声データ中の所定部分が音楽であるか否かを判定する音楽判定手段を備えるものとした。これにより、曲頭に音声や拍手等が混入している場合でも音声データの類似性判定が精度よく行うことが可能となる。
本発明によれば、音響検索における使い勝手を向上させることができる。
以下、本発明の実施例を図示により説明する。
本発明を用いたコンテンツの音楽同一性判定方法の一実施例を、図1を用いて説明する。
まず、特徴抽出処理(102、112)により、2つの映像コンテンツ中の音響若しくは音響コンテンツ(101、111)から、音高列と音量時間変化規則性(103、113)が抽出される。次に、類似度計算処理(120)により、抽出された特徴量(103、113)を比較して、該2コンテンツ(101、111)の同一性(121)が判定される。ここで、音高列とは、ある時刻に発音されている音響のある周波数におけるパワーを列挙したもの、若しくはそれらの値から特定の規則で符号化した符号列のことである。
次に、図1における特徴抽出処理(102、112)の一実施例を、図2〜4を用いて説明する。
まず、音高列の抽出処理を、図2と図3を用いて説明する。
まず、コンテンツの音響情報(200)をフィルタバンク(210)に入力する。フィルタバンク(210)はバンドパスフィルタ(BPF;211〜215)128個から構成され、各BPFは音高0〜127の周波数をピークとするフィルタである。音高は88鍵ピアノの中央C音を60(214)とした半音階に対応し、例えば、音高0(211)は中央Cから5オクターブ下のC音、音高1(212)はC#音、音高12(213)は中央Cから4オクターブ下のC音、音高127(215)は中央Cから5オクターブ上のC音の上のG#音となる。音高Nの周波数F(N)は、301で表される。BPFを通過した音響は、当該BPFの音高Nに対応する周波数F(N)とその周辺の周波数成分のみを持つ音響である。
次に、BPFを通過した音響を、同じ音階同士足し合わせ、音階毎のパワーを求める(220)。例えば音階Cのパワーは、各オクターブにおけるC音の音高、すなわち0、12、24、36、48、60、72、84、96、108、120のパワーの和となる。ここで、時刻tにおける音階nのパワーP(n、t)は、BPF(m)の同時刻におけるパワーp(m、t)から、302を用いて求めることができる。また、該BPFのパワーは、同時刻周辺のBPFの出力x(t)〜x(t+Δt)から、303を用いて求めることができる。
以上の処理から求められた時刻毎の12次元ベクトル量であるP(n、t)(230)が音高列である。
次に、音量時間変化規則性の抽出処理を、図4を用いて説明する。
まず、コンテンツの音響情報(400)からピーク検出処理(401)によりピーク列(402)を求める。具体的には、303に準拠した方法によりコンテンツ音響のパワーを求め、該パワーの極大値が定められた値を超えた時刻をピークとし、ピーク列の要素とする。
次に、最初のピークと最後のピークの間の時間を求め(403)、該時間を等間隔に2〜ピーク数分割し(404)以下の処理を行う。N個に等分割した場合の推定ピーク位置(408)それぞれに対して(407)、該推定ピーク位置近傍に実際のピークが存在する数を求める(409)。分割数の中で実際のピークが推定ピーク位置に最も多く存在する分割数を求め(405)、該分割数に等分割した位置近傍に存在するピークのみから構成される集合を音量時間変化規則性Tとする(406)。
次に、図1における類似度計算処理(120)を、図5と図6を用いて説明する。
まず、2コンテンツの音量時間変化規則性の類似度を計算する(501)。次に、音量時間変化規則性を用いて各コンテンツの音高列を正規化する(502)。次に、正規化された音高列の類似度を計算し(503)、音量時間変化規則性類似度と正規化音高列類似度から同一性を計算する(504)。
音量時間変化規則性類似度は601で表される。ここで、tの右下に記載の付番はコンテンツ1若しくは2を表し、a並びにbは0〜Mの間の定数であり、コンテンツの中間部分の音量時間変化規則性のみを用いることを表す。これは、音楽番組やライブ等の音響情報の場合、コンテンツの開始ならびに終了付近は拍手やアナウンス等の音響が重ねられているため、類似度計算を行う際に精度を落とす要因となるためである。
次に、正規化音高列は602のように変換される。これは、音量時間変化規則性の各ピークの間の時間を1に正規化した音高列である。これにより、比較対象のコンテンツの間でテンポの差異があっても同一性判定が可能となる。更に、正規化音高列類似度は603に示す式で求められる。記号の意味は601に準ずる。同一性Sは前記2つの類似度の線形結合で求められる(604)。
次に、同一性を判定する一方のコンテンツが音楽番組やライブ等であり、音楽と音楽以外の部分が混在する場合、特徴抽出(図1の102)の際に非音楽部分を検出し、音楽部分のみに関して同一性判定を行う。そこで、非音楽部分を含むコンテンツとの同一性判定方法を、図7と図8を用いて説明する。
図7は非音楽部分の判定条件であり、左項(701)が音高列に関する判定条件、右項(702)が音量時間変化規則性に関する判定条件である。前記2つの判定がいずれも真であった場合に、時刻tは非音楽部分と判定する。ここで、左項(701)は各音階のパワーとパワーの平均値との差が全て一定値未満であることを表し、その場合に音響に音程が無いことになり、非音楽候補となる。また、右項(702)は推定ピーク位置数に対して実際に存在するピーク数が一定値より少ないことを表し、その場合にはリズム感が無いことになり、非音楽候補となる。図7の条件は、音程感もリズム感も無い音響は非音楽であることを表す。
例えば図8において、コンテンツ1(800)とコンテンツ2(810)の同一性を判定する場合、図7の条件によってコンテンツ1(800)の非音楽部分が801、803、805と判定された場合、同一性判定は802と810、及び804と810それぞれで行われる。
次に、上記音楽同一性判定方法を用いた音楽検索システム並びにその方法を、図9と図10を用いて説明する。
該システムは、検索を実行するためのプロセッサ(901)、検索されるコンテンツを入力するための装置(902)、検索結果を表示したりユーザインターフェイスを実現する装置(903)、プログラムを記憶若しくは途中結果を一時保存するためのメモリ(910)、音楽データベース(920)から構成される。ここで、コンテンツ入力装置(902)としては、ハードディスクやDVD等の蓄積デバイスや、ネットワーク上に蓄積されたコンテンツを入力するためのネットワーク接続装置、映像や音響を直接入力するためのカメラやマイク等が考えられる。また、メモリ(910)には音楽関連情報検索プログラム(911)並びに音楽同一性判定プログラム(912)が記憶されている。また、音楽データベースには複数の音楽(921)並びに該音楽の題名、演奏者、作曲者等の関連情報(922)が蓄積されている。
音楽検索を行う場合、まず、メモリ(910)より音楽関連情報検索プログラム(911)が起動され、プロセッサ(901)によって以下の処理が実行される。
コンテンツ入力装置(902)からコンテンツが入力される(1000)。次に、音楽同一性判定プログラム(912)を用いて、該コンテンツと音楽データベース(920)上の音楽(921)それぞれに関して(1001)、同一性が判定される(1002)。音楽iが同一と判定された場合(1003)、関連情報(922)からiに対応する値を検索結果表示装置(903)に出力する(1004)。
ここで、1004において、検索結果として関連情報の代わりに音楽i自身を出力する場合も考えられる。これは、例えば音楽番組内で演奏された音楽と同じ楽曲をCD音質で視聴する場合が考えられる。この場合、関連情報(922)は必要ない。
また、関連情報検索の場合には、音楽データベース(920)上の音楽(921)から予め特徴情報を抽出しておき、該データベースに蓄積しておくことも考えられる。この場合、音楽データベースは図11の1100に示すように、音楽から抽出された特徴(1101)と関連情報(1102)から構成される。一方、検索結果として音楽自身を出力する場合でも同様に予め特徴情報を抽出しておくことが考えられるが、この場合には、データベースは1110に示すように特徴(1111)と音楽(1112)から構成されることになる。
この場合の同一性判定処理を、図12を用いて説明する。
まず、特徴抽出処理(1202)により、検索されるコンテンツ(1201)から、特徴量(1203)が抽出される。次に、類似度計算処理(1220)により、抽出された特徴量(1203)と予めデータベース(1100若しくは1110)に蓄積された特徴量(1210)を比較して、データベース内の音楽との同一性(1221)が判定される。
次に、上記音楽検索方法を用いた音楽情報高付加価値化システム並びにその方法を、図13〜15を用いて説明する。
該システムは、検索を実行するためのプロセッサ(1301)、映像コンテンツを入力するための装置(1302)、変換結果を出力する装置(1303)、プログラムを記憶若しくは途中結果を一時保存するためのメモリ(1310)、音楽データベース(1320)から構成される。また、メモリ(1310)には、音楽情報高付加価値化プログラム(1311)、音楽検索プログラム(1312)、及び音楽同一性判定プログラム(1313)が記憶されている。また、音楽データベースには複数の音楽(1322)並びに該音楽から抽出された特徴(1321)が蓄積されている。
音楽情報高付加価値化を行う場合、まず、コンテンツ入力装置(1302)から入力された映像コンテンツから、音楽データベース(1320)に蓄積された音楽(1322)を、音楽検索プログラム(1312)を用いて検索する(1400)。音楽検索の方法は図9並びに図10を用いて説明した音楽関連情報検索の方法で、検索結果として関連情報の代わりに音楽i自身を出力する場合と同等の方法を用いる。次に、入力された映像の音量時間変化規則性と音楽iの該特徴量を用いて音量時間変化規則性補正を行う(1401)。次に、該補正量に従い、入力された映像の伸縮を行う。次に、映像コンテンツにデータベース中の音響を付与する場合、該映像の該当音楽部分の音響情報を該データベース中の音響と置換する(1403)。これにより、例えば音楽番組の演奏部分の音響を、データベース中のCD音質の音楽または、データベース中の音響に映像を付加する場合、該映像の該当音楽部分の動画像情報を、該データベース中の音響に付加する(1404)。
ここで、音量時間変化規則性補正量Aは1501で表される。これは、音量時間変化規則性のk番目のピークとk+1番目のピークの間が、音楽音響と合わせるためにはα(k)だけ映像を伸縮する必要があることを表す。
なお、映像に付与する、または映像が付加される音楽コンテンツは、本実施例のように音楽データベースに予め蓄積されている場合のほか、CD等の記録媒体から入力される場合、インターネット上のアーカイブに蓄積されている場合も考えられる。
次に、以上で述べた発明を適用したテレビ若しくはハードディスク/DVDレコーダの構成と動作例を,図16を用いて説明する。
該装置は,少なくとも,チューナ(1601)(テレビの場合)若しくはハードディスク/DVD等のコンテンツDB(1602)(ハードディスク/DVDレコーダの場合),及び映像は音量時間変化抽出装置(1603),音高列抽出装置(1604),音量時間変化規則性類似度計算装置(1605),音高列正規化装置(1606),正規化音高列類似度計算装置(1607),特徴同一性判定装置(1608),音楽データベース(1600)から構成される。また,音楽情報高付加価値化機能を有する場合,音量時間変化規則性補正装置(1609)も含む。
チューナ(1601)若しくはコンテンツDB(1602)より入力された映像及び音声を含むデータから,音量時間変化抽出装置(1603)並びに音高列抽出装置(1604)により特徴量が抽出される。次に,音量時間変化抽出装置(1603)から抽出された音量時間変化規則性特徴量と音楽データベース(1600)に蓄積された同特徴量から,音量時間変化規則性類似度計算装置(1605)により音量時間変化規則性類似度が計算される。また,音高列抽出装置(1604)から抽出された音高列特徴量は,音量時間変化規則性特徴量を用いて音高列正規化装置(1606)により正規化音高列特徴量に変換される。次に,正規化音高列特徴量と音楽データベース(1600)に蓄積された同特徴量から,正規化音高列類似度計算装置(1607)により正規化音高列類似度が計算される。次に,音量時間変化規則性類似度と正規化音高列類似度から,特徴同一性判定装置(1608)により,入力された映像と音楽データベース(1600)に蓄積された特徴に対応する音楽との同一性が判定される。更に,入力された映像に音楽データベース(1600)に蓄積された音響を付与する,または音楽データベース(1600)に蓄積された音響に入力された映像を付与する場合,音量時間変化抽出装置(1603)から抽出された音量時間変化規則性特徴量を用いて音量時間変化規則性補正装置(1609)により入力された映像を補正する。
次に,音楽データベースに蓄積される特徴を生成するための特徴生成装置の例を図17に示す。
音楽データベース(1700)に蓄積された音楽等のコンテンツ(1711)から,音高列抽出装置(1701)並びに音量時間変化抽出装置(1702)により特徴量が抽出される。次に,音高列抽出装置(1604)から抽出された音高列特徴量は,音量時間変化抽出装置(1702)から抽出された音量時間変化規則性特徴量を用いて音高列正規化装置(1703)により正規化音高列特徴量に変換される。音量時間変化抽出装置(1702)から抽出された音量時間変化規則性特徴量と音高列正規化装置(1703)から出力される正規化音高列特徴量が音楽データベース(1700)内のコンテンツ(1711)に対応する特徴(1712)として蓄積される。
音楽同一性判定方法の例。 音高列特徴量抽出処理の例。 音高の周波数、音階のパワー、音響のパワーの計算式の例。 音量時間変化規則性抽出処理の例。 類似度計算処理の例。 音量時間変化規則性類似度、正規化音高列、音高列類似度、類似度の計算式の例。 非音楽部分判定条件の例。 非音楽部分を含むコンテンツと音楽コンテンツの例の模式図。 音楽関連情報検索システムの例。 音楽関連情報検索の例。 図9における別の音楽データベース例。 音楽同一性判定方法の別の例。 音楽情報高付加価値化システムの例。 音楽情報高付加価値化方法の例。 音量時間変化規則性補正量の例。 本発明を適用したテレビ若しくはハードディスク/DVDレコーダの例。 音楽データベース向け特徴生成装置の例。
符号の説明
101、111、200、400、800、810、1201…コンテンツ
103、113、1101、1111、1203、1210、1321…特徴量
210…フィルタバンク
211〜215…バンドパスフィルタ
230、302…音高列
301…音高に対応する周波数
303…音響のパワー
402…ピーク列
408…推定ピーク位置
406…音量時間変化規則性
601…音量時間変化規則性類似度
602…正規化音高列
603…正規化音高列類似度
604…同一性
701、702…非音楽部分判定条件
801、803、805…コンテンツの非音楽部分
802、804…コンテンツの音楽部分
920、1100、1110、1320,1600,1700…音楽データベース
921、1112、1322…音楽
922、1102…音楽関連情報
1501…音量時間変化規則性補正量

Claims (16)

  1. 音声データを含むデータが入力される入力部と、
    前記入力部から入力した音声データから音高列情報と音量の時間変化の規則性情報を含む特徴情報を抽出する抽出手段と、
    前記抽出手段により抽出した特徴情報と所定の音声データの特徴情報との類似性を判定する判定手段と、を備えてなることを特徴とする情報処理装置。
  2. 請求項1に記載の情報処理装置において、
    前記音量の時間変化の規則性情報に基づいて前記音高列情報を正規化する音高列正規化手段を備え、
    前記判定手段は、音量の時間変化の規則性情報と前記音列正規化手段により正規化された正規化音高列情報を含む特徴情報と、所定の音声データの特徴情報と、の類似性を判定することを特徴とする情報処理装置。
  3. 請求項1に記載の情報処理装置において、
    前記抽出手段は、前記音声データ中の所定部分の前記特徴情報を抽出し、
    前記抽出手段により抽出した特徴情報に基づき前記所定部分は音楽であるか否かを判定する音楽判定手段を、備え
    前記音楽判定手段が音楽であると判定した前記所定部分について前記判定手段が類似性を判定することを特徴とする情報処理装置。
  4. 請求項1に記載の情報処理装置において、
    前記判定手段により判定された類似性に関する情報を出力する出力手段を備えていることを特徴とする情報処理装置。
  5. 請求項1または請求項4にいずれかに記載の情報処理装置において
    データが蓄積される蓄積手段を備え、
    前記所定の音声データの特徴情報は前記蓄積手段に蓄積されていることを特徴とする情報処理装置。
  6. 請求項7に記載の情報処理装置において、
    前記蓄積手段には、複数の音声データが蓄積されていて、
    前記判定手段が前記抽出手段により抽出した特徴情報と所定の音声データの特徴情報とが類似していると判定した場合、前記入力手段により入力された音声データと前記蓄積手段に蓄積された音声データを置換して出力するように制御する制御手段を備えていることを特徴とする情報処理装置。
  7. 請求項5に記載の情報処理装置において、
    前記蓄積手段には、複数の音声データに関する情報が蓄積されていて、
    前記判定手段が前記抽出手段により抽出した特徴情報と所定の音声データの特徴情報とが類似していると判定した場合、前記制御手段は前記蓄積手段に蓄積されている該音声データに関する情報が前記出力手段により出力されるように制御する制御手段を備えていることを特徴とする情報処理装置。
  8. 請求項5に記載の情報処理装置において、
    前記蓄積手段には、複数の映像データが蓄積されていて、
    前記判定手段が前記抽出手段により抽出した特徴情報と所定の音声データの特徴情報とが類似していると判定した場合、前記制御手段は前記蓄積手段に蓄積されている複数の映像データから前記音声データに対応した映像データを前記入力手段により入力した音声データに付与するように制御する制御手段を備えていることを特徴とする情報処理装置。
  9. 請求項5に記載の情報処理装置において、
    前記蓄積手段には、複数の音声データに関する情報が蓄積されていて、
    前記判定手段が前記抽出手段により抽出した特徴情報と所定の音声データの特徴情報とが類似していると判定した場合、前記制御手段は前記蓄積手段に蓄積されている音声データに関する情報を前記入力手段により入力した音声データに付与するように制御する制御手段を備えていることを特徴とする情報処理装置。
  10. 請求項5に記載の情報処理装置において、
    前記入力手段により入力された映像データ並びに/若しくは音声データ,及び/または前記蓄積手段に蓄積された映像データ並びに/若しくは音声データを伸縮する伸縮手段を備えていることを特徴とする情報処理装置。
  11. 請求項8に記載の情報処理装置において、
    前記蓄積手段に蓄積されている映像データ及び/または前記入力手段により入力した音声データを伸縮する伸縮手段を備えてなることを特徴とする情報処理装置。
  12. 請求項5〜8のいずれかに記載の情報処理装置において、
    前記蓄積手段に蓄積されるデータは、前記入力手段より入力されることを特徴とする情報処理装置。
  13. 音声データを含むコンテンツデータが入力される入力部と、
    前記コンテンツデータに含まれる音声データから音高列情報と音量の時間変化の規則性情報を含む特徴情報を抽出する抽出手段と、
    データを蓄積する蓄積手段と、を備え、
    前記蓄積手段は前記抽出手段により抽出した特徴情報を前記入力部に入力された各コンテンツデータに対応させて蓄積することを特徴とする情報処理装置。
  14. 請求項13に記載の情報処理装置において、
    前記音量の時間変化の規則性情報に基づいて前記音高列情報を正規化する音高列正規化手段を備え、
    前記蓄積手段には、音量の時間変化の規則性情報と前記音列正規化手段により正規化された正規化音高列情報を含む特徴情報が蓄積されることを特徴とする情報処理装置。
  15. 請求項13に記載の情報処理装置において、
    前記入力部に入力されたコンテンツデータは前記蓄積手段に蓄積された後に、前記抽出手段により特徴情報を抽出されることを特徴とする情報処理装置。
  16. 音声データを含むデータを入力する入力ステップと、
    前記入力ステップにて入力した音声データから音高列情報と音量の時間変化の規則性情報を含む特徴情報を抽出する抽出ステップと、
    前記抽出ステップにより抽出した特徴情報と所定の音声データの特徴情報との類似性を判定する判定ステップからなる情報処理方法。
JP2005257238A 2005-09-06 2005-09-06 情報処理装置及び情報処理方法 Pending JP2007072023A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005257238A JP2007072023A (ja) 2005-09-06 2005-09-06 情報処理装置及び情報処理方法
US11/515,906 US20070051230A1 (en) 2005-09-06 2006-09-06 Information processing system and information processing method
CNA2006101289917A CN1928990A (zh) 2005-09-06 2006-09-06 信息处理装置和信息处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005257238A JP2007072023A (ja) 2005-09-06 2005-09-06 情報処理装置及び情報処理方法

Publications (1)

Publication Number Publication Date
JP2007072023A true JP2007072023A (ja) 2007-03-22

Family

ID=37828853

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005257238A Pending JP2007072023A (ja) 2005-09-06 2005-09-06 情報処理装置及び情報処理方法

Country Status (3)

Country Link
US (1) US20070051230A1 (ja)
JP (1) JP2007072023A (ja)
CN (1) CN1928990A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007298607A (ja) * 2006-04-28 2007-11-15 Victor Co Of Japan Ltd 音響信号分析装置、音響信号分析方法、及び音響信号分析用プログラム
JP2008310138A (ja) * 2007-06-15 2008-12-25 Toshiba Corp シーン分類装置
CN103247292A (zh) * 2013-03-27 2013-08-14 深圳市文鼎创数据科技有限公司 音频通信方法及装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008241850A (ja) * 2007-03-26 2008-10-09 Sanyo Electric Co Ltd 録音または再生装置
JP6019858B2 (ja) * 2011-07-27 2016-11-02 ヤマハ株式会社 楽曲解析装置および楽曲解析方法
CN108010541A (zh) * 2017-12-14 2018-05-08 广州酷狗计算机科技有限公司 在直播间显示音高信息的方法及装置、存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5739451A (en) * 1996-12-27 1998-04-14 Franklin Electronic Publishers, Incorporated Hand held electronic music encyclopedia with text and note structure search
US5963957A (en) * 1997-04-28 1999-10-05 Philips Electronics North America Corporation Bibliographic music data base with normalized musical themes
GB9918611D0 (en) * 1999-08-07 1999-10-13 Sibelius Software Ltd Music database searching
US6188010B1 (en) * 1999-10-29 2001-02-13 Sony Corporation Music search by melody input
US6678680B1 (en) * 2000-01-06 2004-01-13 Mark Woo Music search engine
US20070163425A1 (en) * 2000-03-13 2007-07-19 Tsui Chi-Ying Melody retrieval system
US6307139B1 (en) * 2000-05-08 2001-10-23 Sony Corporation Search index for a music file
US6528715B1 (en) * 2001-10-31 2003-03-04 Hewlett-Packard Company Music search by interactive graphical specification with audio feedback
US6995309B2 (en) * 2001-12-06 2006-02-07 Hewlett-Packard Development Company, L.P. System and method for music identification
US6967275B2 (en) * 2002-06-25 2005-11-22 Irobot Corporation Song-matching system and method
WO2005057429A1 (en) * 2003-12-08 2005-06-23 Koninklijke Philips Electronics N.V. Searching in a melody database
US7518052B2 (en) * 2006-03-17 2009-04-14 Microsoft Corporation Musical theme searching

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007298607A (ja) * 2006-04-28 2007-11-15 Victor Co Of Japan Ltd 音響信号分析装置、音響信号分析方法、及び音響信号分析用プログラム
JP4735398B2 (ja) * 2006-04-28 2011-07-27 日本ビクター株式会社 音響信号分析装置、音響信号分析方法、及び音響信号分析用プログラム
JP2008310138A (ja) * 2007-06-15 2008-12-25 Toshiba Corp シーン分類装置
CN103247292A (zh) * 2013-03-27 2013-08-14 深圳市文鼎创数据科技有限公司 音频通信方法及装置

Also Published As

Publication number Publication date
CN1928990A (zh) 2007-03-14
US20070051230A1 (en) 2007-03-08

Similar Documents

Publication Publication Date Title
JP4487958B2 (ja) メタデータ付与方法及び装置
US7288710B2 (en) Music searching apparatus and method
US7064262B2 (en) Method for converting a music signal into a note-based description and for referencing a music signal in a data bank
Yoshii et al. Automatic Drum Sound Description for Real-World Music Using Template Adaptation and Matching Methods.
WO2017056982A1 (ja) 楽曲検索方法および楽曲検索装置
JP2008275975A (ja) リズム検出装置及びリズム検出用コンピュータ・プログラム
JP2007072023A (ja) 情報処理装置及び情報処理方法
JP4597919B2 (ja) 音響信号特徴抽出方法、抽出装置、抽出プログラム、該プログラムを記録した記録媒体、および該特徴を利用した音響信号検索方法、検索装置、検索プログラム、並びに該プログラムを記録した記録媒体
JP4594701B2 (ja) 情報検索装置、情報検索方法及び情報検索用プログラム並びに情報記録媒体
WO2018207936A1 (ja) 譜面自動検出方法および装置
JP4601643B2 (ja) 信号特徴抽出方法、信号探索方法、信号特徴抽出装置、コンピュータプログラム、及び、記録媒体
JP3612272B2 (ja) 音楽情報検索装置、音楽情報検索方法および音楽情報検索用プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2009014978A (ja) 演奏クロック生成装置、データ再生装置、演奏クロック生成方法、データ再生方法およびプログラム
JP4862003B2 (ja) 再生順序決定装置、楽曲再生システムおよび再生順序決定方法
JP6056799B2 (ja) プログラム、情報処理装置、及びデータ生成方法
JP4048249B2 (ja) カラオケ装置
JP4581699B2 (ja) 音程認識装置およびこれを利用した音声変換装置
CN113689836A (zh) 一种将音频转换成音符并显示的方法及终端
JP5338312B2 (ja) 自動演奏同期装置、自動演奏鍵盤楽器およびプログラム
JP2008257020A (ja) メロディーの類似度算出方法及び類似度算出装置
JP6252421B2 (ja) 採譜装置、及び採譜システム
JP2007171772A (ja) 音楽情報処理装置、音楽情報処理方法および制御プログラム
JP5012269B2 (ja) 演奏クロック生成装置、データ再生装置、演奏クロック生成方法、データ再生方法およびプログラム
JP2019045755A (ja) 歌唱評価装置、歌唱評価プログラム、歌唱評価方法及びカラオケ装置
JP2012159717A (ja) 楽曲データの変化点検出装置、楽曲データの変化点検出方法及び楽曲データの変化点検出プログラム