JP4979000B2 - 情報検索方法、装置およびプログラム - Google Patents
情報検索方法、装置およびプログラム Download PDFInfo
- Publication number
- JP4979000B2 JP4979000B2 JP2007000571A JP2007000571A JP4979000B2 JP 4979000 B2 JP4979000 B2 JP 4979000B2 JP 2007000571 A JP2007000571 A JP 2007000571A JP 2007000571 A JP2007000571 A JP 2007000571A JP 4979000 B2 JP4979000 B2 JP 4979000B2
- Authority
- JP
- Japan
- Prior art keywords
- query
- search
- information
- vector
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/632—Query formulation
- G06F16/634—Query by example, e.g. query by humming
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
、装置およびプログラムに係り、特に、クラスタリング手法を適用して、短時間で正確な情報検索を実現する情報検索方法、装置およびプログラムに関する。
Claims (5)
- 検索対象情報の集合の中からユーザの嗜好に適合した情報を検索する情報検索装置において、
各検索対象情報の特徴ベクトルを生成する情報ベクトル化手段と、
各検索対象情報を、その特徴ベクトルに基づいて複数のクラスタにクラスタリングするクラスタリング手段と、
前記各クラスタの代表ベクトルを生成する代表ベクトル生成手段と、
検索対象情報に関する嗜好の入力をユーザに促し、入力された嗜好情報を取り込む嗜好取込手段と、
前記入力された嗜好情報に基づいて検索クエリを構築する検索クエリ構築手段と、
前記各クラスタの代表ベクトルと検索クエリとを比較し、検索対象のクラスタを類似度の高い少なくとも一つのクラスタに絞り込む検索対象絞込手段と、
前記検索対象クラスタに属する情報の特徴ベクトルと前記検索クエリとを比較し、類似度の高い情報を抽出する検索手段と、
前記検索結果をユーザに提供する検索結果出力手段と、
各検索対象クラスタに属する各情報の特徴ベクトルと検索クエリとの類似度を、各検索対象クラスタ内での情報分布に基づいて正規化する手段を具備し、
前記検索手段は、前記正規化された類似度を対象に、類似度の高い情報を抽出し、
前記検索クエリ構築手段は、相互に類似しないクエリベクトルの集合を検索クエリとするために、
入力された各嗜好情報の特徴量を代表するクエリベクトルを生成する手段と、
各クエリベクトルの類似度を算出する手段と、
相互に類似する複数のクエリベクトル同士を一つのクエリベクトルに統合する統合手段とを含み、
前記検索対象絞込手段は、検索クエリのクエリベクトルごとに検索対象クラスタを選択し、
前記検索手段は、検索クエリの各クエリベクトルに類似した情報を、当該各クエリベクトルに基づいて絞り込まれた検索対象クラスタを対象に検索することを特徴とする情報検索装置。 - 前記クラスタリング手段は、
検索対象情報の一部を、その特徴ベクトルに基づいて複数のクラスタにクラスタリングする手段と、
各クラスタの代表ベクトルと前記一部以外の各情報の特徴ベクトルとを比較して、当該一部以外の各情報の所属クラスタを決定する手段とを含むことを特徴とする請求項1または2に記載の情報検索装置。 - 検索対象情報の集合の中からユーザの嗜好に適合した情報を検索する情報検索方法において、
各検索対象情報の特徴ベクトルを生成する手順と、
各検索対象情報を、その特徴ベクトルに基づいて複数のクラスタにクラスタリングする手順と、
前記各クラスタの代表ベクトルを生成する手順と、
検索対象情報に関する嗜好の入力をユーザに促し、入力された嗜好情報を取り込む手順と、
前記入力された嗜好情報に基づいて検索クエリを構築する手順と、
前記各クラスタの代表ベクトルと検索クエリとを比較し、検索対象のクラスタを類似度の高い少なくとも一つのクラスタに絞り込む手順と、
前記検索対象クラスタに属する情報の特徴ベクトルと前記検索クエリとを比較し、類似度の高い情報を抽出する手順と、
前記検索結果をユーザに提供する手順と、を具備し、
前記抽出する手順では、各検索対象クラスタに属する各情報の特徴ベクトルと検索クエリとの類似度を、各検索対象クラスタ内での情報分布に基づいて正規化してから、当該正規化された類似度を対象に、類似度の高い情報を抽出し、
前記検索クエリを構築する手順は、相互に類似しないクエリベクトルの集合を検索クエリとするために、
入力された各嗜好情報の特徴量を代表するクエリベクトルを生成する手順と、
各クエリベクトルの類似度を算出する手順と、
相互に類似する複数のクエリベクトル同士を一つのクエリベクトルに統合する手順とを含み、
前記絞り込む手順では、検索クエリのクエリベクトルごとに検索対象クラスタを選択し、
前記抽出する手順では、検索クエリの各クエリベクトルに類似した情報を、当該各クエリベクトルに基づいて絞り込まれた検索対象クラスタを対象に検索することを特徴とする情報検索方法。 - 検索対象情報の集合の中からユーザの嗜好に適合した情報を検索する情報検索プログラムにおいて、
各検索対象情報の特徴ベクトルを生成する手順と、
各検索対象情報を、その特徴ベクトルに基づいて複数のクラスタにクラスタリングする手順と、
前記各クラスタの代表ベクトルを生成する手順と、
検索対象情報に関する嗜好の入力をユーザに促し、入力された嗜好情報を取り込む手順と、
前記入力された嗜好情報に基づいて検索クエリを構築する手順と、
前記各クラスタの代表ベクトルと検索クエリとを比較し、検索対象のクラスタを類似度の高い少なくとも一つのクラスタに絞り込む手順と、
前記検索対象クラスタに属する情報の特徴ベクトルと前記検索クエリとを比較し、類似度の高い情報を抽出する手順と、
前記検索結果をユーザに提供する手順と、をコンピュータに実行させ、
前記抽出する手順では、各検索対象クラスタに属する各情報の特徴ベクトルと検索クエリとの類似度を、各検索対象クラスタ内での情報分布に基づいて正規化してから、当該正規化された類似度を対象に、類似度の高い情報を抽出し、
前記検索クエリを構築する手順は、相互に類似しないクエリベクトルの集合を検索クエリとするために、
入力された各嗜好情報の特徴量を代表するクエリベクトルを生成する手順と、
各クエリベクトルの類似度を算出する手順と、
相互に類似する複数のクエリベクトル同士を一つのクエリベクトルに統合する手順とを含み、
前記絞り込む手順では、検索クエリのクエリベクトルごとに検索対象クラスタを選択し、
前記抽出する手順では、検索クエリの各クエリベクトルに類似した情報を、当該各クエリベクトルに基づいて絞り込まれた検索対象クラスタを対象に検索することを特徴とする情報検索プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007000571A JP4979000B2 (ja) | 2007-01-05 | 2007-01-05 | 情報検索方法、装置およびプログラム |
US11/969,477 US7930281B2 (en) | 2007-01-05 | 2008-01-04 | Method, apparatus and computer program for information retrieval |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007000571A JP4979000B2 (ja) | 2007-01-05 | 2007-01-05 | 情報検索方法、装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008165714A JP2008165714A (ja) | 2008-07-17 |
JP4979000B2 true JP4979000B2 (ja) | 2012-07-18 |
Family
ID=39595161
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007000571A Active JP4979000B2 (ja) | 2007-01-05 | 2007-01-05 | 情報検索方法、装置およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US7930281B2 (ja) |
JP (1) | JP4979000B2 (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5401885B2 (ja) * | 2008-09-24 | 2014-01-29 | 日本電気株式会社 | モデルの構築方法、構築システム及び構築用プログラム |
JP4438014B1 (ja) * | 2008-11-06 | 2010-03-24 | 株式会社ネイクス | 有害顧客検知システム、その方法及び有害顧客検知プログラム |
US8190663B2 (en) * | 2009-07-06 | 2012-05-29 | Osterreichisches Forschungsinstitut Fur Artificial Intelligence Der Osterreichischen Studiengesellschaft Fur Kybernetik Of Freyung | Method and a system for identifying similar audio tracks |
US20110060738A1 (en) | 2009-09-08 | 2011-03-10 | Apple Inc. | Media item clustering based on similarity data |
JP2013029872A (ja) * | 2009-10-19 | 2013-02-07 | Nec Corp | 情報推薦システム、方法、及び、プログラム |
JP2012008623A (ja) * | 2010-06-22 | 2012-01-12 | Jvc Kenwood Corp | プレイリスト作成装置、プレイリスト作成方法、及びプレイリスト作成プログラム |
JP5692725B2 (ja) * | 2011-05-27 | 2015-04-01 | 公立大学法人大阪府立大学 | 近似最近傍探索に係るデータベースの登録方法および登録装置 |
JP5598925B2 (ja) * | 2011-06-29 | 2014-10-01 | Kddi株式会社 | 高次元の特徴ベクトルを高精度で検索する検索装置及びプログラム |
JP5874547B2 (ja) * | 2012-06-27 | 2016-03-02 | 株式会社Jvcケンウッド | 情報選択装置、情報選択方法、端末装置およびコンピュータプログラム |
US9235853B2 (en) * | 2012-09-11 | 2016-01-12 | Google Inc. | Method for recommending musical entities to a user |
CN103020845B (zh) * | 2012-12-14 | 2018-08-10 | 百度在线网络技术(北京)有限公司 | 一种移动应用的推送方法及系统 |
JP5383943B1 (ja) * | 2013-06-06 | 2014-01-08 | 株式会社野村総合研究所 | 契約書分析システム、プログラム及び方法 |
GB2534535A (en) * | 2014-10-08 | 2016-08-03 | Lancaster Univ Business Entpr Ltd | Data structuring and searching methods and apparatus |
JP6160665B2 (ja) * | 2015-08-07 | 2017-07-12 | 株式会社Jvcケンウッド | 情報選択装置、情報選択方法、端末装置およびコンピュータプログラム |
US10489712B2 (en) * | 2016-02-26 | 2019-11-26 | Oath Inc. | Quality-based scoring and inhibiting of user-generated content |
US10591609B1 (en) | 2017-01-11 | 2020-03-17 | Telephonics Corp. | System and method for providing accurate position location information to military forces in a disadvantaged signal environment |
US10936653B2 (en) | 2017-06-02 | 2021-03-02 | Apple Inc. | Automatically predicting relevant contexts for media items |
JP6764992B2 (ja) * | 2019-12-24 | 2020-10-07 | 楽天株式会社 | 検索システム、検索方法、及びプログラム |
CN111552831B (zh) * | 2020-04-21 | 2024-03-26 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种音乐推荐的方法及服务器 |
JP7212728B1 (ja) | 2021-07-20 | 2023-01-25 | ヤフー株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001134593A (ja) * | 1999-11-05 | 2001-05-18 | Nippon Telegr & Teleph Corp <Ntt> | 近傍データ検索方法及び装置及び近傍データ検索プログラムを格納した記憶媒体 |
JP2001331514A (ja) * | 2000-05-19 | 2001-11-30 | Ricoh Co Ltd | 文書分類装置及び文書分類方法 |
JP2003316818A (ja) | 2002-02-21 | 2003-11-07 | Kddi Corp | 情報検索方法及びその装置、コンピュータプログラム |
US7777125B2 (en) * | 2004-11-19 | 2010-08-17 | Microsoft Corporation | Constructing a table of music similarity vectors from a music similarity graph |
JP4597714B2 (ja) | 2005-03-01 | 2010-12-15 | Kddi株式会社 | 情報検索装置および方法ならびにコンピュータプログラム |
JP4752623B2 (ja) * | 2005-06-16 | 2011-08-17 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
-
2007
- 2007-01-05 JP JP2007000571A patent/JP4979000B2/ja active Active
-
2008
- 2008-01-04 US US11/969,477 patent/US7930281B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20080168059A1 (en) | 2008-07-10 |
JP2008165714A (ja) | 2008-07-17 |
US7930281B2 (en) | 2011-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4979000B2 (ja) | 情報検索方法、装置およびプログラム | |
CN110162695B (zh) | 一种信息推送的方法及设备 | |
US8335786B2 (en) | Multi-media content identification using multi-level content signature correlation and fast similarity search | |
US7797265B2 (en) | Document clustering that applies a locality sensitive hashing function to a feature vector to obtain a limited set of candidate clusters | |
TWI553494B (zh) | 基於多模態融合之智能高容錯視頻識別系統及其識別方法 | |
Vaizman et al. | Codebook-based audio feature representation for music information retrieval | |
US8170702B2 (en) | Method for classifying audio data | |
US8344233B2 (en) | Scalable music recommendation by search | |
CN111143604B (zh) | 一种音频的相似度匹配方法、装置及存储介质 | |
CN108090068B (zh) | 医院数据库中的表的分类方法及装置 | |
Darshna | Music recommendation based on content and collaborative approach & reducing cold start problem | |
JP2017045291A (ja) | 類似画像検索システム | |
Yang et al. | Semi-supervised feature selection for audio classification based on constraint compensated Laplacian score | |
KR102345401B1 (ko) | 콘텐츠를 검색하는 방법, 장치, 기기 및 저장 매체 | |
EP3477505A1 (en) | Fingerprint clustering for content-based audio recogntion | |
Nagavi et al. | Content based audio retrieval with MFCC feature extraction, clustering and sort-merge techniques | |
De Vries et al. | Parallel streaming signature em-tree: A clustering algorithm for web scale applications | |
CN113515662B (zh) | 一种相似歌曲检索方法、装置、设备以及存储介质 | |
JP4597714B2 (ja) | 情報検索装置および方法ならびにコンピュータプログラム | |
KR102031282B1 (ko) | 음원 컨텐츠 및 메타 정보를 이용한 플레이리스트 자동 생성 방법 및 시스템 | |
JP2018010482A (ja) | 文書概念ベース生成装置、文書概念検索装置、方法、及びプログラム | |
JP5414614B2 (ja) | キーワードタイプ判定装置及びプログラム | |
Gutiérrez et al. | Landmark-based music recognition system optimisation using genetic algorithms | |
Wang et al. | Local alignment for query by humming | |
Ramirez-Chacon et al. | Indexing and searching point clouds |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090707 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110518 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110601 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110728 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111214 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120209 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120411 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120412 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150427 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4979000 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |