JP6031475B2 - ハミング空間検索装置、ハミング空間検索方法、ハミング空間検索プログラムおよび記録媒体 - Google Patents
ハミング空間検索装置、ハミング空間検索方法、ハミング空間検索プログラムおよび記録媒体 Download PDFInfo
- Publication number
- JP6031475B2 JP6031475B2 JP2014168401A JP2014168401A JP6031475B2 JP 6031475 B2 JP6031475 B2 JP 6031475B2 JP 2014168401 A JP2014168401 A JP 2014168401A JP 2014168401 A JP2014168401 A JP 2014168401A JP 6031475 B2 JP6031475 B2 JP 6031475B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- sub
- content data
- feature amount
- fingerprint
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
ランダム置換に基づく検索では、元のデータ集合を複数のランダム置換により多重化することにより、ビット列データに対する近傍検索を実現しているということができる。もし仮に、検索質問のみを多重化することができれば、元のデータ集合に対する多重化は不要となり、少ない記憶容量でハミング空間の検索が可能になる。
図3は検索装置1の構成例を示す図である。なお、主として楽曲の検索を想定したものとなっているが、楽曲以外の検索にも適用できることは言うまでもない。
図7は検索前の事前準備の処理例を示すフローチャートである。
具体的なサブ指紋の計算は、フレームnの周波数帯域mにおけるエネルギーをE(n,m)とするとき、フレームnの第mビットF(n,m)を以下の式により求める。
Sj= i iff FPi,FPi+1,・・,FPi+m-1がソート順でj番目の短系列
本実施形態の楽曲検索アルゴリズムの有効性を検証するために、実際の楽曲データを用いた評価実験を行った。評価実験で用いたオーディオ指紋抽出は、基本的にはHaitsma-Kalkerアルゴリズムと同様の手法を用いたが、音楽分析条件等は異なっている。
LSHでは、検索精度を保つために、一般に複数のハッシュ関数を用いており、このため検索用データであるハッシュ表に相当の容量が必要となる。ハミング距離に対する従来のLSHの場合、ランダム置換が一種のハッシュ関数に相当するが、ランダム置換により複数の検索対象データをあらかじめ用意しておく必要がある。我々の提案手法では、開始時間の異なる複数のサブ指紋の短い系列を用いて検索質問の多重化を行うことにより、検索対象データの多重化を必要としない。従来手法に比べ、検索インデックスの大きさをはるかに少なくすることが可能である。評価実験において、検索速度あるいは検索精度の面から評価を行い、提案手法の有効性を示した。
101 オーディオ指紋抽出部
102 インデックス配列作成部
103 検索質問曲片入力部
104 サブ指紋短系列抽出部
105 検索候補位置決定部
106 ハミング距離計算部
107 検索結果ソート部
108 検索結果出力部
111 楽曲データベース
112 オーディオ指紋データベース
Claims (11)
- 検索質問としてコンテンツデータ片を入力し、当該コンテンツデータ片の特徴を示す複数の検索質問サブ特徴量から構成される互いに類似する複数の検索質問サブ特徴量短系列を作成するサブ指紋短系列抽出部と、
最終的な検索対象のコンテンツデータの特徴を示す直接的な検索対象となる複数の検索対象サブ特徴量を連結した検索対象サブ特徴量配列に基づき、前記サブ指紋短系列抽出部が作成した少なくとも二以上の前記検索質問サブ特徴量短系列により検索候補位置を決定する検索候補位置決定部と、
前記検索候補位置決定部が決定した複数の検索候補位置からそれぞれ開始する検索対象サブ特徴量と前記検索質問サブ特徴量短系列とのハミング距離をそれぞれ計算するハミング距離計算部と、を備え、
前記検索質問サブ特徴量は、前記コンテンツデータ片がダウン・サンプリングされた後、ダウン・サンプリングされた前記コンテンツデータ片が第一の所定の長さに分割され、分割された前記コンテンツデータ片にハミング窓による重み付けがなされ、重み付けされた前記コンテンツデータ片の複数のフレームの周波数帯域におけるエネルギー同士の差に基づいて作成されており、
前記検索対象サブ特徴量は、前記コンテンツデータが前記第一の所定の長さよりも短い第二の所定の長さに分割された前記コンテンツデータの複数のフレームの周波数帯域におけるエネルギー同士の差に基づいて作成されていることを特徴とするハミング空間検索装置。 - 前記検索質問サブ特徴量は、前記コンテンツデータ片の複数のフレームの周波数帯域におけるエネルギー同士の差の符号に基づいて作成されており、
前記検索対象サブ特徴量は、前記コンテンツデータの複数のフレームの周波数帯域におけるエネルギー同士の差の符号に基づいて作成されていることを特徴とする請求項1に記載のハミング空間検索装置。 - 前記サブ指紋短系列抽出部は、入力された前記コンテンツデータ片のビットを反転することにより、前記検索質問サブ特徴量短系列を作成することを特徴とする請求項1又は2に記載のハミング空間検索装置。
- 前記サブ指紋短系列抽出部は、入力された前記コンテンツデータ片にノイズをのせることにより、前記検索質問サブ特徴量短系列を作成することを特徴とする請求項1から3の何れか一項に記載のハミング空間検索装置。
- 前記検索候補位置決定部は、
前記検索対象サブ特徴量配列に含まれる各検索対象サブ特徴量から開始する前記検索質問サブ特徴量短系列の長さのブロックの検索対象サブ特徴量の識別情報を保持したインデックス配列に対し、前記検索質問サブ特徴量短系列により前記検索候補位置を決定することを特徴とする請求項1から4の何れか一項に記載のハミング空間検索装置。 - 前記インデックス配列は、
前記検索対象サブ特徴量配列に含まれる各検索対象サブ特徴量から開始する前記検索質問サブ特徴量短系列の長さのブロックの先頭の検索対象サブ特徴量の識別情報を保持することを特徴とする請求項5に記載のハミング空間検索装置。 - 前記インデックス配列は、
前記ブロックを2進数としての大小関係に基づいてソートした場合の前記検索対象サブ特徴量の識別情報をソートされた順に保持することを特徴とする請求項5又は6に記載のハミング空間検索装置。 - 前記サブ指紋短系列抽出部において、
互いに類似する複数の前記検索質問サブ特徴量短系列は、前記コンテンツデータ片の時系列における抽出の開始位置を互いに異ならせて抽出することにより前記コンテンツデータ片から作成されていることを特徴とする請求項1から7のうち何れか一項に記載のハミング空間検索装置。 - 検索質問としてコンテンツデータ片を入力し、当該コンテンツデータ片の特徴を示す複数の検索質問サブ特徴量から構成される互いに類似する複数の検索質問サブ特徴量短系列を前記コンテンツデータ片がダウン・サンプリングされた後、ダウン・サンプリングされた前記コンテンツデータ片が第一の所定の長さに分割され、分割された前記コンテンツデータ片にハミング窓による重み付けがなされ、重み付けされた前記コンテンツデータ片の複数のフレームの周波数帯域におけるエネルギー同士の差に基づいて作成するサブ指紋短系列抽出工程と、
最終的な検索対象のコンテンツデータの特徴を示す直接的な検索対象となる前記検索対象サブ特徴量を前記コンテンツデータが前記第一の所定の長さよりも短い第二の所定の長さに分割された前記コンテンツデータの複数のフレームの周波数帯域におけるエネルギー同士の差に基づいて作成する検索対象サブ特徴量作成工程と、
前記検索対象サブ特徴量作成工程において作成された複数の前記検索対象サブ特徴量を連結した検索対象サブ特徴量配列に基づき、前記サブ指紋短系列抽出工程で作成した少なくとも二以上の前記検索質問サブ特徴量短系列により検索候補位置を決定する検索候補位置決定工程と、
前記検索候補位置決定工程で決定した複数の検索候補位置からそれぞれ開始する検索対象サブ特徴量と前記検索質問サブ特徴量短系列とのハミング距離をそれぞれ計算するハミング距離計算工程と、を備えたことを特徴とするハミング空間検索方法。 - ハミング空間検索装置を構成するコンピュータを、
検索質問としてコンテンツデータ片を入力し、当該コンテンツデータ片の特徴を示す複数の検索質問サブ特徴量から構成される互いに類似する複数の検索質問サブ特徴量短系列を前記コンテンツデータ片がダウン・サンプリングされた後、ダウン・サンプリングされた前記コンテンツデータ片が第一の所定の長さに分割され、分割された前記コンテンツデータ片にハミング窓による重み付けがなされ、重み付けされた前記コンテンツデータ片の複数のフレームの周波数帯域におけるエネルギー同士の差に基づいて作成するサブ指紋短系列抽出手段、
最終的な検索対象のコンテンツデータの特徴を示す直接的な検索対象となる前記検索対象サブ特徴量を前記コンテンツデータが前記第一の所定の長さよりも短い第二の所定の長さに分割された前記コンテンツデータの複数のフレームの周波数帯域におけるエネルギー同士の差に基づいて作成する検索対象サブ特徴量作成手段、
前記検索対象サブ特徴量作成手段において作成された複数の前記検索対象サブ特徴量を連結した検索対象サブ特徴量配列に基づき、前記サブ指紋短系列抽出手段が作成した少なくとも二以上の前記検索質問サブ特徴量短系列により検索候補位置を決定する検索候補位置決定手段、
前記検索候補位置決定手段が決定した複数の検索候補位置からそれぞれ開始する検索対象サブ特徴量と前記検索質問サブ特徴量短系列とのハミング距離をそれぞれ計算するハミング距離計算手段として機能させるためのハミング空間検索プログラム。 - 請求項10に記載のハミング空間検索プログラムを記録したコンピュータ読取可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014168401A JP6031475B2 (ja) | 2014-08-21 | 2014-08-21 | ハミング空間検索装置、ハミング空間検索方法、ハミング空間検索プログラムおよび記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014168401A JP6031475B2 (ja) | 2014-08-21 | 2014-08-21 | ハミング空間検索装置、ハミング空間検索方法、ハミング空間検索プログラムおよび記録媒体 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011102979A Division JP5599363B2 (ja) | 2011-05-02 | 2011-05-02 | ハミング空間検索装置、ハミング空間検索方法、ハミング空間検索プログラムおよび記録媒体 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2014238884A JP2014238884A (ja) | 2014-12-18 |
JP2014238884A5 JP2014238884A5 (ja) | 2015-02-05 |
JP6031475B2 true JP6031475B2 (ja) | 2016-11-24 |
Family
ID=52135914
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014168401A Active JP6031475B2 (ja) | 2014-08-21 | 2014-08-21 | ハミング空間検索装置、ハミング空間検索方法、ハミング空間検索プログラムおよび記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6031475B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108170650B (zh) * | 2016-12-07 | 2021-05-25 | 北京京东尚科信息技术有限公司 | 文本比较方法以及文本比较装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3467415B2 (ja) * | 1998-12-01 | 2003-11-17 | 日本電信電話株式会社 | 音楽検索装置,音楽検索方法および音楽検索プログラムを記録した記録媒体 |
JP4125990B2 (ja) * | 2003-05-01 | 2008-07-30 | 日本電信電話株式会社 | 検索結果利用型類似音楽検索装置,検索結果利用型類似音楽検索処理方法,検索結果利用型類似音楽検索プログラムおよびそのプログラムの記録媒体 |
JP4241445B2 (ja) * | 2004-03-10 | 2009-03-18 | 日本電信電話株式会社 | 音楽内容検索装置及びプログラム及びコンピュータ読み取り可能な記録媒体 |
-
2014
- 2014-08-21 JP JP2014168401A patent/JP6031475B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014238884A (ja) | 2014-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gulati et al. | Phrase-based rāga recognition using vector space modeling | |
Casey et al. | Analysis of minimum distances in high-dimensional musical spaces | |
Grosche et al. | Audio content-based music retrieval | |
Bertin-Mahieux et al. | Large-scale cover song recognition using hashed chroma landmarks | |
Seo et al. | Local text reuse detection | |
Bužić et al. | Lyrics classification using naive bayes | |
EP3477643B1 (en) | Audio fingerprint extraction and audio recognition using said fingerprints | |
AU2006288921A1 (en) | Music analysis | |
Casey et al. | Fast recognition of remixed music audio | |
Gulati et al. | Mining melodic patterns in large audio collections of Indian art music | |
Chen et al. | Improving music genre classification using collaborative tagging data | |
Kolozali et al. | Automatic ontology generation for musical instruments based on audio analysis | |
Wu et al. | Combining acoustic and multilevel visual features for music genre classification | |
JP5596648B2 (ja) | ハッシュ関数生成方法、ハッシュ関数生成装置、ハッシュ関数生成プログラム | |
Padmasundari et al. | Raga identification using locality sensitive hashing | |
Correya et al. | Large-scale cover song detection in digital music libraries using metadata, lyrics and audio features | |
Xiao et al. | Fast Hamming Space Search for Audio Fingerprinting Systems. | |
Thiruvengatanadhan | Music Classification using MFCC and SVM | |
Qi et al. | Triplet convolutional network for music version identification | |
Yang et al. | Music retagging using label propagation and robust principal component analysis | |
Gulati et al. | Discovering rāga motifs by characterizing communities in networks of melodic patterns | |
Ghosal et al. | Song/instrumental classification using spectrogram based contextual features | |
JP5599363B2 (ja) | ハミング空間検索装置、ハミング空間検索方法、ハミング空間検索プログラムおよび記録媒体 | |
JP6031475B2 (ja) | ハミング空間検索装置、ハミング空間検索方法、ハミング空間検索プログラムおよび記録媒体 | |
EP3477505B1 (en) | Fingerprint clustering for content-based audio recogntion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140919 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20141016 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141017 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20141031 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150424 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150609 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150810 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20160329 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160629 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20160707 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161004 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161024 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6031475 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |