JP2009282681A - Similar item retrieval device, similar item retrieval method, its program and recording medium - Google Patents

Similar item retrieval device, similar item retrieval method, its program and recording medium Download PDF

Info

Publication number
JP2009282681A
JP2009282681A JP2008133158A JP2008133158A JP2009282681A JP 2009282681 A JP2009282681 A JP 2009282681A JP 2008133158 A JP2008133158 A JP 2008133158A JP 2008133158 A JP2008133158 A JP 2008133158A JP 2009282681 A JP2009282681 A JP 2009282681A
Authority
JP
Japan
Prior art keywords
item
attribute
vector
important component
content signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008133158A
Other languages
Japanese (ja)
Other versions
JP5153451B2 (en
Inventor
Tomonori Izumitani
知範 泉谷
Kunio Kayano
邦夫 柏野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2008133158A priority Critical patent/JP5153451B2/en
Publication of JP2009282681A publication Critical patent/JP2009282681A/en
Application granted granted Critical
Publication of JP5153451B2 publication Critical patent/JP5153451B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a similar item retrieval method allowing comparison of an item without previously created attribute data with an item with attribute data by the same measure, and allowing recommendation thereof. <P>SOLUTION: This similar item retrieval device has: a characteristic extraction means 111 for outputting an item characteristic vector from a content signal; an attribute estimation means 112 for generating an item attribute vector based on the item characteristic vector; a list creation means for calculating, by use of the item attribute vector, similarity with an item attribute vector stored in an item database, and outputting a list based on a value of the similarity; a parameter learning means for calculating an attribute-estimating parameter by use of the content signal and the attribute data of a plurality of items, and accumulating it in an attribute-estimating database; and an attribute registration means for registering the item attribute vector into the item database. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は、ユーザが入力したコンテンツ信号と属性が類似したアイテムをデータベースの中から探し、アイテムのリストを出力する類似アイテム検索装置及び類似アイテム検索方法並びにそのプログラムと記録媒体に関する。   The present invention relates to a similar item search apparatus, a similar item search method, a program thereof, and a recording medium that search a database for items whose attributes are similar to those of a content signal input by a user and output a list of items.

楽曲、映画、書籍などのアイテムを、ユーザの嗜好やユーザが過去に利用したアイテムの特徴などに基づいて推薦するための検索技術(レコメンデーション技術)は、ショッピングサイトなどに広く用いられている。レコメンデーション技術には、非特許文献1のような、ユーザの購買記録または評点付けのデータを使い、協調フィルタリングなどの手法を利用する類似アイテム推薦方法や、特許文献1のような、各アイテムの複数の属性(ジャンルや使用楽器等)をベクトルなどの数値データで表現し、ユーザが入力したアイテムの属性データと類似度が高いアイテムのアイテムデータ(タイトルなど)をデータベースから検索する類似アイテム検索方法や、非特許文献2のような、購買記録、評点付け、属性データを用いずにアイテムのコンテンツ信号(音楽であれば音響信号そのもの)を用いる類似アイテム検索方法などがある。また非特許文献3のような、非特許文献1のような協調フィルタリングによる検索と、非特許文献2のようなコンテンツ信号に基づく検索を組み合わせた類似アイテム検索方法もある。   Search technology (recommendation technology) for recommending items such as music, movies, books, etc. based on user preferences, features of items used by users in the past, and the like is widely used in shopping sites and the like. For the recommendation technology, similar item recommendation method using a method such as collaborative filtering using the user's purchase record or rating data as in Non-Patent Document 1, or each item as in Patent Document 1 A similar item search method that expresses a plurality of attributes (genre, musical instrument used, etc.) by numerical data such as vectors, and searches for item data (such as a title) of an item having a high similarity to the item attribute data input by the user from the database. In addition, there are similar item search methods such as Non-Patent Document 2, which use item content signals (acoustic signals themselves for music) without using purchase records, scoring, and attribute data. There is also a similar item search method that combines search by collaborative filtering as in Non-Patent Document 1, as in Non-Patent Document 3, and search based on content signals as in Non-Patent Document 2.

図13は、属性データに基づく類似アイテム検索方法の概要を示す図である。
図13(A)は属性データの例を示している。アイテムが楽曲である場合には、属性として、クラシックやジャズなどのジャンルや、悲しい、楽しいなどのムード、使用楽器などを用いることができる。属性の値は、そのアイテムがそれぞれの属性を含む程度を数値化したものである。図13(A)では、アイテムxの属性の値は、(属性1、属性2、属性3)=(1、0、2)となっている。このベクトルを、アイテム属性ベクトルと呼ぶ。また、アイテムの各属性を座標とする空間を属性空間と呼ぶ。
FIG. 13 is a diagram showing an outline of a similar item search method based on attribute data.
FIG. 13A shows an example of attribute data. When the item is a song, a genre such as classic or jazz, a mood such as sad or fun, an instrument used, etc. can be used as attributes. The attribute value is a numerical value indicating the degree to which the item includes each attribute. In FIG. 13A, the attribute value of the item x is (attribute 1, attribute 2, attribute 3) = (1, 0, 2). This vector is called an item attribute vector. In addition, a space having coordinates of each attribute of an item is called an attribute space.

図13(B)は属性空間におけるアイテム間の類似度計算方法を示している。例えば、ユーザがショッピングサイトなどのシステム上でアイテムxを選択している状態で、アイテムxと類似する別のアイテムを推薦アイテムとして出力するとき、図13(A)のように表される属性を用いて、データベース上のアイテムy、z、wそれぞれとの類似度を算出する。図13(B)はユークリッド距離に基づく類似度尺度を用いた例を示している。なお、図13(B)の属性空間は2次元であるが、あくまで一例であり、属性の数に関してはこの限りではない。
図13(C)は図13(B)で算出した類似度に基づいて出力される類似アイテムのリストである。システムは図13(B)で算出した類似度の順にリストを出力する。
FIG. 13B shows a method for calculating the similarity between items in the attribute space. For example, when a user selects an item x on a system such as a shopping site and outputs another item similar to the item x as a recommended item, the attribute represented as shown in FIG. Using this, the similarity with each of the items y, z, and w on the database is calculated. FIG. 13B shows an example using a similarity measure based on the Euclidean distance. Note that the attribute space in FIG. 13B is two-dimensional, but is merely an example, and the number of attributes is not limited to this.
FIG. 13C is a list of similar items output based on the similarity calculated in FIG. The system outputs a list in the order of similarity calculated in FIG.

図14は、コンテンツ信号に基づく類似アイテム検索方法の概要を示す図である。
図14(A)は、コンテンツ信号が音楽などの音響信号であった場合の例を示している。各アイテムx’、y’、z’、w’は、周波数解析等の処理で特徴抽出することで、ベクトルで表現できる。このベクトルをアイテム特徴ベクトルと呼ぶ。また、抽出された各特徴を座標とする空間を特徴空間と呼ぶ。
図14(B)は、各アイテムx’,y’,z’,w’から2つの特徴を抽出し、特徴空間にプロットした例である。ユーザがシステム上でアイテムx’を選択している状態で、アイテムx’と類似する別のアイテムを推薦アイテムとして出力するとき、属性データに基づく類似アイテム検索方法と同様に、特徴空間上でのアイテムx’と、アイテムy’、z’、w’それぞれとの類似度を算出する。なお、図14(B)の特徴空間は2次元であるが、あくまで一例であり、特徴の数に関してはこの限りではない。
図14(C)は図14(B)で算出した類似度に基づいて出力される類似アイテムのリストである。システムは図14(B)で算出した類似度の順にリストを出力する。
FIG. 14 is a diagram showing an outline of a similar item search method based on a content signal.
FIG. 14A shows an example where the content signal is an acoustic signal such as music. Each item x ′, y ′, z ′, w ′ can be expressed as a vector by extracting features by processing such as frequency analysis. This vector is called an item feature vector. In addition, a space having the extracted features as coordinates is referred to as a feature space.
FIG. 14B shows an example in which two features are extracted from each item x ′, y ′, z ′, w ′ and plotted in the feature space. When another item similar to the item x ′ is output as a recommended item in a state where the user selects the item x ′ on the system, as in the similar item search method based on the attribute data, The similarity between the item x ′ and the items y ′, z ′, and w ′ is calculated. Note that the feature space in FIG. 14B is two-dimensional, but is merely an example, and the number of features is not limited to this.
FIG. 14C is a list of similar items output based on the similarity calculated in FIG. The system outputs a list in the order of similarity calculated in FIG.

コンテンツ信号が長時間の系列データなどであった場合は、1つのコンテンツ信号を複数のセグメントに分割し、それぞれについて特徴抽出を行い、以降の処理ではそれぞれのセグメントをコンテンツ信号代わりに用いることも可能である。この場合、アイテムx’の全セグメントとアイテムy’の全セグメントの全ての組み合わせの類似度の平均値をアイテムx’、y’間の類似度とみなす方法や、最も類似度が高いセグメント同士の類似度をアイテムx’、y’間の類似度とみなす方法を用いて、図14(C)のリストを作成することができる。
米国特許第7003515号明細書 Sarwar et al.、“Analysis of Recommendation Algorithm for E-Commerce”、「Proceedings of the 2nd ACM conference on Electronic commerce」、2000年、158−167頁 B.Logan.、“MUSIC RECOMMENDATION FROM SONG SETS”、「Proceedings of the 5th International Conference on Music Information Retrieval」、2004年、425−428頁 Qing Li et al.、“A Music Recommender Based on Audio Features”、「SIGIR’04」、2004年、532−533頁
If the content signal is long-time series data, etc., one content signal can be divided into multiple segments, and feature extraction can be performed for each segment. In subsequent processing, each segment can be used instead of the content signal. It is. In this case, the average value of the similarities of all the combinations of all the segments of the item x ′ and all the segments of the item y ′ is regarded as the similarity between the items x ′ and y ′, or between the segments having the highest similarity The list shown in FIG. 14C can be created by using a method in which the similarity is regarded as the similarity between items x ′ and y ′.
US Pat. No. 7,003,315 Sarwar et al., “Analysis of Recommendation Algorithm for E-Commerce”, “Proceedings of the 2nd ACM conference on Electronic commerce”, 2000, pp. 158-167 B.Logan., “MUSIC RECOMMENDATION FROM SONG SETS”, “Proceedings of the 5th International Conference on Music Information Retrieval”, 2004, pages 425-428. Qing Li et al., “A Music Recommender Based on Audio Features”, “SIGIR'04”, 2004, pp. 532-533.

しかし、上述した非特許文献1のような協調フィルタリングによる類似アイテム検索方法は、検索にユーザの購買記録や評点付けのデータを用いるため、それらのデータを有しないユーザはアイテムを検索することができないという問題がある。また、上述した特許文献1のような属性データに基づく類似アイテム検索方法は、事前に作成された属性データによって類似度を算出するため、属性データを有しないアイテムを推薦することができないという問題がある。上述した非特許文献3のような、協調フィルタリングとコンテンツ信号に基づく手法を組み合わせた類似アイテム検索方法は、これらの問題を解決するが、ユーザによる評点付けのデータを有しないアイテムを評点付けのデータを有するアイテムと比較する場合に、同じ尺度で比較することができないという問題がある。   However, since the similar item search method using collaborative filtering as described in Non-Patent Document 1 uses user purchase records and rating data for search, users who do not have such data cannot search for items. There is a problem. Moreover, since the similarity item search method based on attribute data like the above-mentioned patent document 1 calculates a similarity by the attribute data created in advance, there is a problem that an item having no attribute data cannot be recommended. is there. The similar item search method combining collaborative filtering and a method based on a content signal as described in Non-Patent Document 3 described above solves these problems, but items that do not have rating data by the user are rated data. There is a problem in that it is not possible to compare on the same scale when comparing with items having.

本発明は上記の点に鑑みてなされたものであり、その目的は、事前に作成された属性データを有しないアイテムを、属性データを有するアイテムと同じ尺度で比較・推薦することが可能な類似アイテム検索装置及び類似アイテム検索方法並びにそのプログラムと記録媒体を提供することにある。   The present invention has been made in view of the above points, and its object is to make it possible to compare and recommend items that do not have attribute data created in advance on the same scale as items that have attribute data. An object search device, a similar item search method, a program thereof, and a recording medium are provided.

本発明は上記の課題を解決するためになされたものであり、あるアイテムの内容を表すコンテンツ信号の入力を受け付けることにより、当該アイテムと属性が類似するアイテムデータをアイテムデータベースの中から検索し、検索結果をリストとして出力する類似アイテム検索装置であって、属性推定用データベースと、学習用コンテンツ信号と当該学習用コンテンツ信号によって示されるアイテムの前記属性を表すアイテム属性ベクトルの組を入力として受け付け、当該学習用コンテンツ信号の特徴を要素とする学習用特徴ベクトルを生成し、複数の前記入力を受け付けたアイテム属性ベクトルと当該学習用特徴ベクトルとの関係に基づいて前記属性の推定に用いる属性推定用パラメータを得て、当該属性推定用パラメータを前記属性推定用データベースに蓄積するパラメータ学習手段と、アイテム属性ベクトルを、前記アイテムデータベースのアイテムデータに対応付けて登録する属性登録手段と、前記入力を受け付けたコンテンツ信号から当該コンテンツ信号の特徴を要素とするアイテム特徴ベクトルを抽出して出力する特徴抽出手段と、前記アイテム特徴ベクトルと、前記属性推定用データベースに蓄積されている前記属性推定用パラメータとを属性データ算出式に代入することで、前記入力を受け付けたコンテンツ信号によって示されるアイテムのアイテム属性ベクトルを生成する属性推定手段と、前記入力を受け付けたコンテンツ信号によって示されるアイテムのアイテム属性ベクトルと、前記アイテムデータベースに保存されている少なくとも1つのアイテム属性ベクトルとの類似度を算出し、当該類似度の値に基づいて前記リストを作成して出力するリスト作成手段と、を有することを特徴とする。   The present invention has been made to solve the above problems, and by receiving an input of a content signal representing the contents of a certain item, it searches the item database for item data similar in attribute to the item, A similar item search device that outputs a search result as a list, which accepts as an input a database for attribute estimation, a learning content signal, and a set of item attribute vectors representing the attribute of the item indicated by the learning content signal, A feature vector for learning having the feature of the content signal for learning as an element is generated, and for attribute estimation used for estimating the attribute based on the relationship between the item attribute vector that has received the plurality of inputs and the feature vector for learning Obtaining a parameter and determining the attribute estimation parameter Parameter learning means for accumulating in the database, attribute registration means for registering the item attribute vector in association with the item data of the item database, and item features having the characteristics of the content signal as elements from the received content signal The input is accepted by substituting into the attribute data calculation formula the feature extraction means for extracting and outputting the vector, the item feature vector, and the attribute estimation parameter stored in the attribute estimation database. Attribute estimation means for generating an item attribute vector of an item indicated by the content signal, an item attribute vector of the item indicated by the content signal that has received the input, and at least one item attribute vector stored in the item database. Calculating a similarity between Torr, and having a list creation means for outputting to create the list based on the value of the similarity, the.

また、本発明は、あるアイテムの内容を表すコンテンツ信号の入力を受け付けることにより、当該アイテムと属性が類似するアイテムデータをアイテムデータベースの中から検索し、検索結果をリストとして出力する類似アイテム検索装置であって、属性重要成分推定用データベースと、学習用コンテンツ信号と当該学習用コンテンツ信号によって示されるアイテムの前記属性を表現する少なくとも1つの成分である属性重要成分を表すアイテム属性重要成分ベクトルの組を入力として受け付け、当該学習用コンテンツ信号の特徴を要素とする学習用特徴ベクトルを生成し、複数の前記入力を受け付けたアイテム属性重要成分ベクトルと当該学習用特徴ベクトルとの関係に基づいて前記属性重要成分の推定用に用いる属性重要成分推定用パラメータを得て、当該属性重要成分推定用パラメータを前記属性重要成分推定用データベースに蓄積するパラメータ学習手段と、アイテム属性重要成分ベクトルを、前記アイテムデータベースのアイテムデータに対応付けて登録する属性重要成分登録手段と、前記入力を受け付けたコンテンツ信号から当該コンテンツ信号の特徴を要素とするアイテム特徴ベクトルを抽出して出力する特徴抽出手段と、前記アイテム特徴ベクトルと、前記属性重要成分推定用データベースに蓄積されている属性重要成分推定用パラメータとを属性重要成分データ算出式に代入することで、前記入力を受け付けたコンテンツ信号によって示されるアイテムのアイテム属性重要成分ベクトルを生成する属性重要成分推定手段と、前記入力を受け付けたコンテンツ信号によって示されるアイテムのアイテム属性重要成分ベクトルと、前記アイテムデータベースに保存された少なくとも1つのアイテム属性重要成分ベクトルとの類似度を算出し、当該類似度の値に基づいて前記リストを作成して出力するリスト作成手段と、を有することを特徴とする。   In addition, the present invention accepts an input of a content signal representing the contents of a certain item, searches for item data having similar attributes to the item from the item database, and outputs a search result as a list. A set of attribute important component vectors representing an attribute important component which is an attribute important component estimation database and a learning content signal and at least one component expressing the attribute of the item indicated by the learning content signal Is received as an input, a feature vector for learning having the feature of the content signal for learning as an element is generated, and the attribute based on the relationship between the item attribute important component vector that has received the plurality of inputs and the feature vector for learning Attribute important component estimation parameter used for important component estimation The attribute important component estimation parameter is stored in the attribute important component estimation database, and the item attribute important component vector is registered in association with the item data of the item database. Component registration means, feature extraction means for extracting and outputting item feature vectors whose elements are the features of the content signal from the content signal that has received the input, the item feature vector, and the attribute important component estimation database Attribute important component estimation means for generating an item attribute important component vector of an item indicated by the content signal that has received the input by substituting the accumulated attribute important component estimation parameter into the attribute important component data calculation formula; , The content signal that received the input Accordingly, the similarity between the item attribute important component vector of the item indicated by the at least one item attribute important component vector stored in the item database is calculated, and the list is created and output based on the similarity value And a list creating means.

また、本発明の前記リスト作成手段は、コンテンツ信号のみでなく、前記属性を示す属性データを入力して前記アイテムデータベースに保存された少なくとも1つのアイテム属性ベクトルとの類似度の算出を行うことを特徴とする。   Further, the list creating means of the present invention inputs not only the content signal but also attribute data indicating the attribute, and calculates the similarity with at least one item attribute vector stored in the item database. Features.

また、本発明の前記リスト作成手段は、コンテンツ信号のみでなく、前記属性を示す属性データを入力し、当該属性データによって算出された属性重要成分ベクトルを用いて、前記アイテムデータベースに保存された少なくとも1つのアイテム属性重要成分ベクトルとの類似度の算出を行うことを特徴とする。   Further, the list creating means of the present invention inputs not only the content signal but also attribute data indicating the attribute, and using the attribute important component vector calculated from the attribute data, at least stored in the item database The similarity with one item attribute important component vector is calculated.

また、本発明は、前記特徴抽出手段において、入力されるコンテンツ信号が音響信号であることを特徴とする。   Further, the present invention is characterized in that in the feature extraction means, the input content signal is an acoustic signal.

また、本発明は、前記特徴抽出手段において、出力されるアイテム特徴ベクトルの各要素は、対数周波数軸上で等間隔になる各周波数における音響パワースペクトルであることを特徴とする。   Further, the present invention is characterized in that in the feature extraction means, each element of the output item feature vector is an acoustic power spectrum at each frequency that is equally spaced on the logarithmic frequency axis.

また、本発明は、あるアイテムの内容を表すコンテンツ信号の入力を受け付けることにより、当該アイテムと属性が類似するアイテムデータをアイテムデータベースの中から検索して検索結果をリストとして出力し、属性推定用データベースを備える類似アイテム検索装置における類似アイテム検索方法であって、パラメータ学習手段は、学習用コンテンツ信号と当該学習用コンテンツ信号によって示されるアイテムの前記属性を表すアイテム属性ベクトルの組を入力として受け付け、当該学習用コンテンツ信号の特徴を要素とする学習用特徴ベクトルを生成し、複数の前記入力を受け付けたアイテム属性ベクトルと当該学習用特徴ベクトルとの関係に基づいて前記属性の推定に用いる属性推定用パラメータを得て、当該属性推定用パラメータを前記属性推定用データベースに蓄積し、属性登録手段は、アイテム属性ベクトルを前記アイテムデータベースのアイテムデータに対応付けて登録し、特徴抽出手段は、前記入力を受け付けたコンテンツ信号から当該コンテンツ信号の特徴を要素とするアイテム特徴ベクトルを抽出して出力し、属性推定手段は、前記アイテム特徴ベクトルと、前記属性推定用データベースに蓄積されている属性推定用パラメータとを属性データ算出式に代入することで、前記入力を受け付けたコンテンツ信号によって示されるアイテムのアイテム属性ベクトルを生成し、リスト作成手段は、前記入力を受け付けたコンテンツ信号によって示されるアイテムのアイテム属性ベクトルを用いて、前記アイテムデータベースに保存されている少なくとも1つのアイテム属性ベクトルとの類似度を算出し、当該類似度の値に基づいて前記リストを作成して出力することを特徴とする。   Also, the present invention accepts input of a content signal representing the contents of a certain item, searches the item database for item data having an attribute similar to the item, outputs a search result as a list, and estimates the attribute. A similar item search method in a similar item search device comprising a database, wherein the parameter learning means accepts as input a set of a learning content signal and an item attribute vector representing the attribute of the item indicated by the learning content signal, A feature vector for learning having the feature of the content signal for learning as an element is generated, and for attribute estimation used for estimating the attribute based on the relationship between the item attribute vector that has received the plurality of inputs and the feature vector for learning Parameter is obtained and the attribute estimation parameter Are registered in the attribute estimation database, the attribute registration unit registers the item attribute vector in association with the item data of the item database, and the feature extraction unit extracts the feature of the content signal from the received content signal. The item feature vector having the element as an element is extracted and output, and the attribute estimation unit substitutes the item feature vector and the attribute estimation parameter stored in the attribute estimation database into an attribute data calculation formula. Generating an item attribute vector of the item indicated by the content signal that has received the input, and the list creation means is stored in the item database using the item attribute vector of the item indicated by the content signal that has received the input At least one Calculating a similarity between Temu attribute vector, and outputs to create the list based on the value of the similarity.

また、本発明は、あるアイテムの内容を表すコンテンツ信号の入力を受け付けることにより、当該アイテムと属性が類似するアイテムデータをアイテムデータベースの中から検索して検索結果をリストとして出力し、属性重要成分推定用データベースを備える類似アイテム検索装置における類似アイテム検索方法であって、パラメータ学習手段は、学習用コンテンツ信号と、当該学習用コンテンツ信号によって示されるアイテムの前記属性を表現する少なくとも1つの成分である属性重要成分を表すアイテム属性重要成分ベクトルの組を入力として受け付け、当該学習用コンテンツ信号の特徴を要素とする学習用特徴ベクトルを生成し、複数の前記入力を受け付けたアイテム属性重要成分ベクトルと当該学習用特徴ベクトルとの関係に基づいて属性重要成分の推定用に用いる属性重要成分推定用パラメータを得て、当該属性重要成分推定用パラメータを前記属性重要成分推定用データベースに蓄積し、属性重要成分登録手段は、アイテム属性重要成分ベクトルを前記アイテムデータベースのアイテムデータに対応付けて登録し、特徴抽出手段は、前記入力を受け付けたコンテンツ信号から当該コンテンツ信号の特徴を要素とするアイテム特徴ベクトルを抽出して出力し、属性重要成分推定手段は、前記アイテム特徴ベクトルと、前記属性重要成分推定用データベースに蓄積されている属性重要成分推定用パラメータとを属性重要成分データ算出式に代入することで、前記入力を受け付けたコンテンツ信号によって示されるアイテムのアイテム属性重要成分ベクトルを生成し、リスト作成手段は、前記入力を受け付けたコンテンツ信号によって示されるアイテムのアイテム属性重要成分ベクトルを用いて、前記アイテムデータベースに保存された少なくとも1つのアイテム属性重要成分ベクトルとの類似度を算出し、当該類似度の値に基づいて前記リストを作成して出力することを特徴とする。   Further, the present invention accepts input of a content signal representing the contents of a certain item, searches for item data having an attribute similar to that item from the item database, and outputs a search result as a list. A similar item search method in a similar item search device comprising an estimation database, wherein the parameter learning means is at least one component that expresses a learning content signal and the attribute of the item indicated by the learning content signal. A set of item attribute important component vectors representing an attribute important component is received as an input, a learning feature vector having the characteristics of the content signal for learning as an element is generated, and the item attribute important component vector that has received the plurality of inputs and the corresponding Based on relationship with learning feature vector An attribute important component estimation parameter used for estimation of an attribute important component is obtained, the attribute important component estimation parameter is accumulated in the attribute important component estimation database, and the attribute important component registration means stores an item attribute important component vector. The feature extraction unit extracts and outputs an item feature vector having the feature of the content signal as an element from the content signal that has received the input, and outputs the attribute feature component estimation unit. Is indicated by the content signal that has received the input by substituting the item feature vector and the attribute important component estimation parameter stored in the attribute important component estimation database into the attribute important component data calculation formula Generate item attribute important component vector of item and list The generating means calculates the similarity with at least one item attribute important component vector stored in the item database using the item attribute important component vector of the item indicated by the content signal that has received the input, and the similarity The list is created and output based on the degree value.

また、本発明は、上述した類似アイテム検索装置のコンピュータに実行させるプログラムである。   Further, the present invention is a program that is executed by a computer of the above-described similar item search apparatus.

また、本発明は、上述したプログラムを記録したコンピュータ読み取り可能な記録媒体である。   The present invention is also a computer-readable recording medium that records the above-described program.

本発明によれば、コンテンツから属性を推定し、属性データを有しないアイテムに属性データを付与することができる。付与された属性データを用いて、アイテム間の類似度を算出するので、属性データを有しないアイテムを、属性データを有するアイテムと同じ尺度を用いて比較・推薦することが可能である。また、属性の重要成分を抽出することで、処理時間の短縮及び精度の向上を図ることが可能である。   According to the present invention, attributes can be estimated from content, and attribute data can be assigned to items that do not have attribute data. Since the similarity between items is calculated using the assigned attribute data, it is possible to compare / recommend an item that does not have attribute data using the same scale as an item that has attribute data. Further, by extracting the important component of the attribute, it is possible to shorten the processing time and improve the accuracy.

(第1の実施形態)
以下、図面を参照しながら本発明の第1の実施形態について詳しく説明する。第1の実施形態は、アイテムのコンテンツ信号を入力し、コンテンツ信号の特徴を表すアイテム特徴ベクトルからアイテムの属性を推定することで類似アイテムの検索を行う例である。
本実施形態において、アイテムとは物を特定する概念のことであり、例えば楽曲、映画、書籍などを示す。アイテムは、アイテムの内容を表すコンテンツ信号、アイテムの属するジャンルや人がコンテンツ信号を見るまたは聞くことで発生する印象などの、コンテンツ信号に固有の特徴を表す属性、及びアイテムの固有の情報を示すアイテムデータによって表される。アイテムとアイテムデータとコンテンツ信号の関係は、例えば、アイテムを楽曲とした場合、人は楽曲のタイトル(アイテムデータ)を知ることで、その楽曲の内容を連想することができ、また人は楽曲の音響信号(コンテンツ信号)すなわち楽曲の内容を聞くことで、その楽曲のタイトルを連想することができる、という関係にある。
また、アイテムデータは、例えばアイテムのタイトル情報、ID番号、仕様などによって表される。
(First embodiment)
Hereinafter, a first embodiment of the present invention will be described in detail with reference to the drawings. The first embodiment is an example in which a similar item is searched by inputting a content signal of an item and estimating an item attribute from an item feature vector representing the feature of the content signal.
In the present embodiment, an item is a concept that identifies an object, and indicates, for example, a song, a movie, a book, or the like. The item indicates a content signal that represents the content of the item, an attribute that represents characteristics unique to the content signal, such as an genre to which the item belongs or an impression generated when a person sees or listens to the content signal, and unique information of the item Represented by item data. The relationship between an item, item data, and a content signal is, for example, when an item is a song, a person can associate the contents of the song by knowing the title (item data) of the song, By listening to the sound signal (content signal), that is, the content of the music, the title of the music can be associated.
The item data is represented by, for example, item title information, ID numbers, specifications, and the like.

図1は、本発明の第1の実施形態による類似アイテム検索装置1の構成を示す概略ブロック図である。以下、アイテムのコンテンツ信号が楽曲の音響信号(以下、アイテム音響信号とする)であった例について説明する。映像等の他のコンテンツ信号の場合も装置の構成は同じである。   FIG. 1 is a schematic block diagram showing a configuration of a similar item search apparatus 1 according to the first embodiment of the present invention. Hereinafter, an example in which the content signal of an item is a music acoustic signal (hereinafter referred to as an item acoustic signal) will be described. The configuration of the apparatus is the same for other content signals such as video.

類似アイテム検索装置1は、推薦リスト作成部110と、パラメータ学習部(パラメータ学習手段)120と、属性推定用パラメータ蓄積部(属性推定用データベース)130と、データベース登録部(属性登録手段)140と、楽曲データベース(アイテムデータベース)150と、を有する。推薦リスト作成部110は、特徴抽出部(特徴抽出手段)111と、属性推定部(属性推定手段)112と、リスト作成部(リスト作成手段)113と、を有する。パラメータ学習部120は、特徴抽出部121と、パラメータ学習部122と、を有する。属性推定用パラメータ蓄積部130は、属性推定部112、143で用いる属性推定用パラメータを記憶する。データベース登録部140は、属性登録部141と、特徴抽出部142と、属性推定部143と、を有する。楽曲データベース150は、アイテム属性データ(属性データ)を記憶する。   The similar item search device 1 includes a recommendation list creation unit 110, a parameter learning unit (parameter learning unit) 120, an attribute estimation parameter storage unit (attribute estimation database) 130, and a database registration unit (attribute registration unit) 140. , A music database (item database) 150. The recommendation list creation unit 110 includes a feature extraction unit (feature extraction unit) 111, an attribute estimation unit (attribute estimation unit) 112, and a list creation unit (list creation unit) 113. The parameter learning unit 120 includes a feature extraction unit 121 and a parameter learning unit 122. The attribute estimation parameter storage unit 130 stores attribute estimation parameters used by the attribute estimation units 112 and 143. The database registration unit 140 includes an attribute registration unit 141, a feature extraction unit 142, and an attribute estimation unit 143. The music database 150 stores item attribute data (attribute data).

類似アイテム検索装置1において、特徴抽出部111は、入力されたアイテム音響信号の特徴を抽出する。属性推定部112は、特徴抽出部111で抽出された特徴と属性推定用パラメータ蓄積部130に記憶されている属性推定用パラメータを用いてアイテムの属性を推定する。リスト作成部113は、属性推定部で推定された属性と楽曲データベース150に記憶されている複数のアイテム属性データとを比較し、楽曲データベース150に記憶されているアイテムデータを、当該アイテムデータが示すアイテムと入力されたアイテム音響信号が示すアイテムとの類似度順に並べたリストを作成し、出力する。出力するアイテム数は、例えば、類似度が事前に設定してある閾値を超える楽曲すべて、事前に設定された数などとすることができる。   In the similar item search device 1, the feature extraction unit 111 extracts the feature of the input item acoustic signal. The attribute estimation unit 112 estimates the attribute of the item using the feature extracted by the feature extraction unit 111 and the attribute estimation parameter stored in the attribute estimation parameter storage unit 130. The list creation unit 113 compares the attribute estimated by the attribute estimation unit with a plurality of item attribute data stored in the music database 150, and the item data indicates item data stored in the music database 150. A list arranged in the order of similarity between items and items indicated by the input item acoustic signal is created and output. The number of items to be output can be, for example, all songs whose similarity exceeds a preset threshold, the number set in advance, or the like.

まず、属性推定用パラメータ蓄積部130に属性推定用パラメータを登録するパラメータ学習部120の説明を行う。
パラメータ学習部120は、推薦リスト作成部110の属性推定部112、データベース登録部140の属性推定部143で使う属性推定用パラメータの計算を行う。パラメータ学習部120は、アイテム属性データとアイテム音響信号(学習用コンテンツ信号)の両方を含む学習用楽曲データを入力として受け付ける。特徴抽出部121は、アイテム音響信号を読み込み、読み込んだアイテム音響信号から特徴を抽出し、アイテム特徴ベクトルf(学習用特徴ベクトル)を生成する。
First, the parameter learning unit 120 that registers the attribute estimation parameter in the attribute estimation parameter storage unit 130 will be described.
The parameter learning unit 120 calculates attribute estimation parameters used by the attribute estimation unit 112 of the recommendation list creation unit 110 and the attribute estimation unit 143 of the database registration unit 140. The parameter learning unit 120 receives learning music data including both item attribute data and item acoustic signals (learning content signals) as inputs. The feature extraction unit 121 reads an item acoustic signal, extracts features from the read item acoustic signal, and generates an item feature vector f (learning feature vector).

図2は、アイテム音響信号からアイテム特徴ベクトルを算出する方法の概念を表す図である。ここでは、アイテム特徴ベクトルの算出にN個の帯域フィルタで構成される帯域フィルタバンクを利用する例を用いて、アイテム特徴ベクトルの算出方法を説明する。この場合、特徴抽出部121は、帯域フィルタバンクと、特徴ベクトル算出部と、を有する。図2(A)は、入力したアイテム音響信号の例を表している。図2(A)に表されるアイテム音響信号(x、x、…)を帯域フィルタバンクに入力すると、それぞれ異なる周波数帯域で取り出した、図2(A)のアイテム音響信号と同じサンプリング周波数のサンプル列がN本出力される。帯域フィルタバンクは、出力したN本のサンプル列それぞれに対して、長さWのフレーム(信号区間)を設定し、フレーム内の信号強度の平均値、もしくは信号強度の平均値の対数を計算する。帯域フィルタバンクは、フレームを所定のサンプル数Lだけスキップさせて、アイテム音響信号の末尾に達するまで、フレーム内の信号強度の平均値、もしくは信号強度の平均値の対数を計算する。これにより得られたN本の数列(例えば1本目の数列ならばy11、y12、…)をフレーム特徴列と呼ぶ。図2(B)はフレーム特徴列を表している。特徴ベクトル算出部は、帯域フィルタバンクが出力したN本のフレーム特徴列それぞれの平均をとり、アイテム特徴ベクトルf=(f、f、…f)を出力する。また、特徴ベクトル算出部は、帯域フィルタバンクが出力したフレーム特徴列の値を、各フレームN個の値(例えば最初のフレームでは、y11、y21、…yN1)のノルムが1などとなるように正規化しても良い。 FIG. 2 is a diagram illustrating a concept of a method for calculating an item feature vector from an item acoustic signal. Here, an item feature vector calculation method will be described using an example in which a band filter bank including N band filters is used to calculate an item feature vector. In this case, the feature extraction unit 121 includes a band filter bank and a feature vector calculation unit. FIG. 2A shows an example of the input item acoustic signal. When the item acoustic signals (x 1 , x 2 ,...) Represented in FIG. 2 (A) are input to the band filter bank, the same sampling frequency as that of the item acoustic signal in FIG. N sample strings are output. The band-pass filter bank sets a frame (signal interval) of length W for each of the output N sample strings, and calculates the average value of the signal strength in the frame or the logarithm of the average value of the signal strength. . The band-pass filter bank skips the frame by a predetermined number of samples L, and calculates the average value of the signal strength in the frame or the logarithm of the average value of the signal strength until the end of the item acoustic signal is reached. The N number sequences thus obtained (for example, y 11 , y 12 ,... In the case of the first number sequence) are called frame feature sequences. FIG. 2B shows a frame feature sequence. The feature vector calculation unit takes an average of each of the N frame feature sequences output by the band filter bank, and outputs an item feature vector f = (f 1 , f 2 ,... F N ). In addition, the feature vector calculation unit sets the frame feature string output by the band filter bank to a norm of N values of each frame (for example, y 11 , y 21 ,..., Y N1 in the first frame) as 1 or the like. You may normalize so that.

帯域フィルタバンクの中心周波数は、対数周波数軸上で等間隔になるよう、音階の有する特性を利用した、式(1)に示すような等比級数による配置(音響パワースペクトル)を利用するのが効果的である。   The center frequency of the band-pass filter bank uses an arrangement (acoustic power spectrum) by a geometric series as shown in Equation (1) using the characteristics of the scale so that the center frequency is equally spaced on the logarithmic frequency axis. It is effective.

Figure 2009282681
Figure 2009282681

ただし、F(k)はk番目の帯域フィルタの中心周波数を、Fは最低中心周波数を表している。
また、Rは隣接する中心周波数同士の比を表しており、1を超える値、例えば21/12などが設定される。アイテム音響信号が複数のセクションからなるなど、音響特徴の時間的な変化が大きい場合は、例えば30秒毎にアイテム音響信号を複数のセグメントに分割し、それぞれのセグメントを1つのアイテム音響信号と同様に扱い、アイテム特徴ベクトルを計算することも可能である。
However, F C (k) represents the center frequency of the k-th band filter, and F 0 represents the lowest center frequency.
R represents a ratio between adjacent center frequencies, and a value exceeding 1, for example, 2 1/12 is set. For example, if an item's acoustic signal is composed of multiple sections and there is a large change in acoustic characteristics, for example, the item's acoustic signal is divided into multiple segments every 30 seconds, and each segment is the same as one item's acoustic signal. It is also possible to calculate item feature vectors.

パラメータ学習部122は、特徴抽出部121が出力したアイテム特徴ベクトルfと、対応する学習用楽曲データのアイテム属性データを入力される。パラメータ学習部122は、アイテム属性データに基づいてアイテム属性ベクトルtを生成し、属性推定用パラメータを算出する。アイテム属性ベクトルの変換式(属性データ算出式)として、例えば、式(2)を用いることができる。   The parameter learning unit 122 receives the item feature vector f output from the feature extraction unit 121 and the item attribute data of the corresponding music data for learning. The parameter learning unit 122 generates an item attribute vector t based on the item attribute data, and calculates an attribute estimation parameter. As the item attribute vector conversion formula (attribute data calculation formula), for example, formula (2) can be used.

Figure 2009282681
Figure 2009282681

ただし、tはn次元のアイテム属性ベクトル、fはn次元のアイテム特徴ベクトルである。また、行列Aはn×nの行列、ベクトルbはn×1のベクトルである。式(2)のA、bの第i行成分は、アイテム属性ベクトルtのi番目の要素を目的変数、アイテム特徴ベクトルfの各要素を説明変数として、複数のアイテム音響信号とアイテム属性データの組み合わせに対して線形回帰分析を適用することにより、算出することができる。算出された属性推定用パラメータは属性推定用パラメータ蓄積部130に記憶される。 Here, t is an item attribute vector of n t dimension and f is an item feature vector of n f dimension. The matrix A is a matrix of n t × n f , and the vector b is a vector of n t × 1. The i-th row components of A and b in Expression (2) are a plurality of item acoustic signals and item attribute data using the i-th element of the item attribute vector t as an objective variable and each element of the item feature vector f as an explanatory variable. It can be calculated by applying linear regression analysis to the combination. The calculated attribute estimation parameter is stored in the attribute estimation parameter storage unit 130.

次に、推薦リスト作成部110のリスト作成手段114で用いる楽曲データベース140にアイテム属性ベクトルとアイテムデータの登録を行うデータベース登録部140の説明を行う。
特徴抽出部142は、パラメータ学習部120の特徴抽出部121と同じもので、アイテム音響信号を入力し、アイテム特徴ベクトルfを出力する。属性推定部143は、特徴抽出部142が生成したアイテム特徴ベクトルfと、属性推定用パラメータ蓄積部130が記憶している属性推定用パラメータを用い、アイテム属性ベクトルtを算出する。
Next, the database registration unit 140 that registers item attribute vectors and item data in the music database 140 used by the list creation unit 114 of the recommendation list creation unit 110 will be described.
The feature extraction unit 142 is the same as the feature extraction unit 121 of the parameter learning unit 120, receives an item acoustic signal, and outputs an item feature vector f. The attribute estimation unit 143 uses the item feature vector f generated by the feature extraction unit 142 and the attribute estimation parameter stored in the attribute estimation parameter storage unit 130 to calculate the item attribute vector t.

図3は、アイテム特徴ベクトルからアイテム属性ベクトルを算出する方法の概念を表す図である。図3(A)は、アイテムX、Yを特徴a、b、cで表される3次元の特徴空間上にプロットした例である。アイテムX、Yの位置を表すn次元のアイテム特徴ベクトルをそれぞれf、fとする。この例では、n=3である。図3(B)は、3次元の属性空間上にアイテムX、Yをプロットしたものである。ここでは、特徴空間と属性空間の次元数が同じ例となっているが、同じである必要はない。アイテムX、Yの属性空間における位置を表すn次元のアイテム属性ベクトルをそれぞれt、tとする。この例ではn=3である。図3(C)は、特徴空間から属性空間へ変換する計算式である。アイテム特徴ベクトルをf、アイテム属性ベクトルをtとし、t=T(f)という変換式を用いることで、fからtを、fからtを推定値として算出する。 FIG. 3 is a diagram illustrating a concept of a method for calculating an item attribute vector from an item feature vector. FIG. 3A is an example in which items X and Y are plotted on a three-dimensional feature space represented by features a, b, and c. The n f- dimensional item feature vectors representing the positions of the items X and Y are respectively represented as f X and f Y. In this example, n f = 3. FIG. 3B is a plot of items X and Y on a three-dimensional attribute space. Here, the feature space and the attribute space have the same number of dimensions, but they need not be the same. Item X, respectively n t dimensions of the item attribute vector representing a position in the attribute space of Y t X, and t Y. In this example, n t = 3. FIG. 3C shows a calculation formula for converting from the feature space to the attribute space. The item feature vector is f, the item attribute vector is t, and a conversion formula t = T (f) is used to calculate f X to t X and f Y to t Y as estimated values.

変換式に式(2)を用いてベクトルを変換する場合は、行列A及びベクトルbが属性推定用パラメータ蓄積部130(図1)に記憶されている。そして、属性推定部143は、特徴抽出部142が生成したアイテム特徴ベクトルfと属性推定用パラメータ蓄積部130が記憶している属性推定用パラメータA、bを用いることで、アイテム属性ベクトルtを算出する。   When the vector is converted using the equation (2) as the conversion equation, the matrix A and the vector b are stored in the attribute estimation parameter storage unit 130 (FIG. 1). Then, the attribute estimation unit 143 calculates the item attribute vector t by using the item feature vector f generated by the feature extraction unit 142 and the attribute estimation parameters A and b stored in the attribute estimation parameter storage unit 130. To do.

データベース登録部140は、アイテム属性データを有しないアイテムと、アイテム属性データを有するアイテムのどちらも入力として受け付ける。アイテム属性データを有しないアイテムの場合、特徴抽出部142は、アイテム音響信号を入力し、アイテム特徴ベクトルfを出力する。属性推定部143は、特徴抽出部142が出力したアイテム特徴ベクトルfを入力し、アイテム属性ベクトルtを出力する。属性推定部143が出力したアイテム属性ベクトルを楽曲データベース150に記憶させる。また、アイテム属性データを有するアイテムの場合、アイテム属性データを属性登録部141に入力し、属性登録部141は入力されたアイテム属性データからアイテム属性ベクトルを作成し、アイテム属性ベクトルが示すアイテムのアイテムデータに対応付けて楽曲データベース150に登録する。   The database registration unit 140 accepts both an item having no item attribute data and an item having item attribute data as input. In the case of an item having no item attribute data, the feature extraction unit 142 receives an item acoustic signal and outputs an item feature vector f. The attribute estimation unit 143 receives the item feature vector f output from the feature extraction unit 142 and outputs an item attribute vector t. The item attribute vector output by the attribute estimation unit 143 is stored in the music database 150. In the case of an item having item attribute data, the item attribute data is input to the attribute registration unit 141, and the attribute registration unit 141 creates an item attribute vector from the input item attribute data, and the item of the item indicated by the item attribute vector It is registered in the music database 150 in association with the data.

ここで、ユーザは、この類似アイテム検索装置1を用いて入力するアイテム音響信号が示すアイテムに類似するアイテムの検索を行う。当該検索において、ユーザが検索質問として入力するアイテム音響信号は、推薦リスト作成部110に入力される。推薦リスト作成部110は、入力されたアイテム音響信号を受け付ける。このアイテム音響信号は、図14(A)、(B)におけるアイテムxに相当し、ショッピングサイトなどのシステムで、ユーザが選択しているアイテムのコンテンツ信号を表している。推薦リスト作成部110は、楽曲データベース150に保存されているアイテム属性ベクトルが示すアイテムの中から入力されたアイテム音響信号が示すアイテムとの類似度が高いアイテムを抽出し、そのタイトルなどの情報(アイテムデータ)を楽曲リストとして出力する。出力する楽曲数は、例えば、類似度が事前に設定してある閾値を超える楽曲すべて、事前に設定された数、などとすることができる。   Here, the user searches for an item similar to the item indicated by the item acoustic signal input using the similar item search device 1. In the search, the item acoustic signal that the user inputs as a search question is input to the recommendation list creation unit 110. The recommendation list creation unit 110 receives the input item sound signal. This item acoustic signal corresponds to the item x in FIGS. 14A and 14B, and represents the content signal of the item selected by the user in a system such as a shopping site. The recommendation list creation unit 110 extracts an item having a high similarity to the item indicated by the item acoustic signal input from the items indicated by the item attribute vector stored in the music database 150, and information such as the title ( Item data) is output as a music list. The number of songs to be output can be, for example, all songs whose similarity exceeds a preset threshold value, a preset number, and the like.

図4は推薦リスト作成部110の処理を表すフローチャートである。
上述の処理により、属性推定用パラメータ蓄積部130に属性推定用パラメータが記憶され、楽曲データベース150に少なくとも1つのアイテム属性データが記憶された状態で以下の処理が開始される。
まず、特徴抽出部111は、アイテム音響信号(コンテンツ信号)を読み込む(ステップS1)。次に、特徴抽出部111は、読み込んだアイテム音響信号から特徴を抽出し、アイテム特徴ベクトルfを生成する(ステップS2)。次に、属性推定部112は、特徴抽出部111が生成したアイテム特徴ベクトルfと、属性推定用パラメータ蓄積部130が記憶している属性推定用パラメータを用い、アイテム属性ベクトルtinを算出する(ステップS3)。
FIG. 4 is a flowchart showing the process of the recommendation list creation unit 110.
With the above process, the attribute estimation parameter is stored in the attribute estimation parameter storage unit 130, and the following process is started with at least one item attribute data stored in the music database 150.
First, the feature extraction unit 111 reads an item acoustic signal (content signal) (step S1). Next, the feature extraction unit 111 extracts features from the read item acoustic signal and generates an item feature vector f (step S2). Next, the attribute estimating unit 112 uses the item feature vector f by the feature extraction unit 111 to generate a parameter for the attribute estimation attribute estimation parameter storage unit 130 stores, calculates the item attribute vector t in ( Step S3).

次に、リスト作成部113は、楽曲データベース150から読み出し完了フラグが立っていないアイテム属性ベクトルを検索する。(ステップS4)。楽曲データベース150に読み出し完了フラグが立っていないアイテム属性ベクトルがあれば、リスト作成部113は、楽曲データベース150から該当するアイテム属性ベクトルtを読み出し、読み出したアイテム属性ベクトルtに読み出し完了フラグを立てる(ステップS5)。リスト作成部113は、楽曲データベース150から読み出したアイテム属性ベクトルtと、属性推定部112が算出したアイテム属性ベクトルtinとの類似度を計算する(ステップS6)。 Next, the list creation unit 113 searches the song database 150 for item attribute vectors for which no read completion flag is set. (Step S4). If the item attribute vector read completion flag is not set in the music database 150, the list creation unit 113 reads the item attribute vector t d corresponding the music database 150, a read completion flag in the read item attribute vector t d Stand up (step S5). List creation unit 113 calculates the item attribute vector t d read from the music database 150, the similarity between the item attribute vector t in the attribute estimating unit 112 is calculated (step S6).

アイテム属性ベクトルtinとtとの類似度S(tin、t)は、属性空間上での内積、余弦、また式(3)のようなガウス動径基底関数などを用いることができる。 As the similarity S (t in , t d ) between the item attribute vectors t in and t d , an inner product on the attribute space, a cosine, a Gaussian radial basis function such as Equation (3), or the like can be used. .

Figure 2009282681
Figure 2009282681

ただし、rは事前に設定されたパラメータである。リスト作成部113は、楽曲データベース150から全てのアイテム属性ベクトルを読み出すまでステップS4以降の処理を行う。全てのアイテム属性ベクトルを読み出したら、リスト作成部113は、楽曲データベース150上の類似度の高いアイテムのアイテムデータのリストを出力する(ステップS7)。特徴抽出部111においてアイテム音響信号を複数の短時間のセグメントに分割した場合は、それぞれのセグメントについて類似度の計算を行い、類似度の高いセグメントが属するアイテムのアイテムデータをリストとして出力する。   Here, r is a parameter set in advance. The list creation unit 113 performs the processing from step S4 onward until all item attribute vectors are read from the music database 150. When all the item attribute vectors are read, the list creation unit 113 outputs a list of item data of items with high similarity on the music database 150 (step S7). When the item sound signal is divided into a plurality of short-time segments in the feature extraction unit 111, the similarity is calculated for each segment, and the item data of the item to which the segment having a high similarity belongs is output as a list.

このように、第1の実施形態によれば、アイテム属性データを有しないアイテムにアイテム属性ベクトルを付与することができる。これにより、アイテム属性データを有しないアイテムを、アイテム属性データを有するアイテムと同じ尺度を用いて比較・推薦することができる。   Thus, according to the first embodiment, an item attribute vector can be given to an item that does not have item attribute data. Thereby, the item which does not have item attribute data can be compared and recommended using the same scale as the item which has item attribute data.

(第2の実施形態)
以下、本発明の第2の実施形態について詳しく説明する。第2の実施形態は、アイテム属性ベクトルからより低次元のアイテム属性重要成分を抽出し、類似アイテムの検索を行う例である。
(Second Embodiment)
Hereinafter, the second embodiment of the present invention will be described in detail. The second embodiment is an example in which a lower-dimensional item attribute important component is extracted from an item attribute vector and a similar item is searched.

図5は、本発明の第2の実施形態による類似アイテム検索装置1の構成を示す概略ブロック図である。
以下、第1の実施形態と同様に、アイテムのコンテンツ信号が楽曲の音響信号(以下、アイテム音響信号とする)であった例について説明する。
第2の実施形態による類似アイテム検索装置1は、第1の実施形態による類似アイテム検索装置1における属性推定部112、パラメータ学習部122、属性推定用パラメータ蓄積部130、属性登録部141、属性推定部143が、それぞれ属性重要成分推定部(属性重要成分推定手段)212、属性重要成分推定用パラメータ学習部222、属性重要成分推定用パラメータ蓄積部(属性重要成分推定用データベース)230、属性重要成分登録部(属性重要成分登録手段)241、属性重要成分推定部243に変更になり、パラメータ学習部120に属性/属性重要成分変換部223を備え、データベース登録部140に属性/属性重要成分変換部244を備えるものである。
なお、他の処理部については第1の実施形態と同じであるため、同一の符号を用いて説明する。
FIG. 5 is a schematic block diagram showing the configuration of the similar item search device 1 according to the second embodiment of the present invention.
Hereinafter, as in the first embodiment, an example in which the content signal of an item is a music acoustic signal (hereinafter referred to as an item acoustic signal) will be described.
The similar item search device 1 according to the second embodiment includes an attribute estimation unit 112, a parameter learning unit 122, an attribute estimation parameter storage unit 130, an attribute registration unit 141, and an attribute estimation in the similar item search device 1 according to the first embodiment. The unit 143 includes an attribute important component estimation unit (attribute important component estimation means) 212, an attribute important component estimation parameter learning unit 222, an attribute important component estimation parameter storage unit (attribute important component estimation database) 230, and an attribute important component. The registration unit (attribute important component registration unit) 241 and the attribute important component estimation unit 243 are changed, the parameter learning unit 120 includes the attribute / attribute important component conversion unit 223, and the database registration unit 140 includes the attribute / attribute important component conversion unit. 244 is provided.
The other processing units are the same as those in the first embodiment, and will be described using the same reference numerals.

パラメータ学習部120は、推薦リスト作成部110の属性重要成分推定部212、データベース登録部140の属性重要成分推定部243で使う属性重要成分推定用パラメータの計算を行う。パラメータ学習部120は、第1の実施形態と同様に、アイテム属性データとアイテム音響信号の両方を含む学習用楽曲データを入力として受け付ける。特徴抽出部121は、アイテム音響信号を入力し、アイテム特徴ベクトルfを出力する。特徴抽出部121は、第1の形態による特徴抽出部121と同じものなので説明を省略する。属性/属性重要成分変換部223は、アイテム属性データを受け付ける。属性/属性重要成分変換部223は、アイテム属性データに基づいてアイテム属性ベクトルtを生成し、生成したアイテム属性ベクトルtからアイテム属性重要成分ベクトルpを算出する。   The parameter learning unit 120 calculates an attribute important component estimation parameter used by the attribute important component estimation unit 212 of the recommendation list creation unit 110 and the attribute important component estimation unit 243 of the database registration unit 140. As in the first embodiment, the parameter learning unit 120 receives music data for learning including both item attribute data and item acoustic signals as input. The feature extraction unit 121 receives an item acoustic signal and outputs an item feature vector f. Since the feature extraction unit 121 is the same as the feature extraction unit 121 according to the first embodiment, the description thereof is omitted. The attribute / attribute important component conversion unit 223 receives item attribute data. The attribute / attribute important component conversion unit 223 generates an item attribute vector t based on the item attribute data, and calculates an item attribute important component vector p from the generated item attribute vector t.

図6は、アイテム属性ベクトルからアイテム属性重要成分ベクトルを算出する方法の概念を表す図である。図6(A)は、アイテム属性ベクトルtを3次元の属性空間上にプロットした例である。アイテム属性重要成分は、アイテムの属性から算出される検索において重要な成分のことであり、例えば、属性空間内である方向を持つ分散の大きい軸(図6(A)における2本の太い矢印)へ射影することにより算出することができる。図6(B)は、属性空間のアイテムを、2次元の属性重要成分空間に射影した例である。アイテム属性重要成分ベクトルpを計算するための軸の方向は、アイテム属性データを有する多数のアイテムを学習データとして用い、主成分分析などの方法であらかじめ求めておく。主成分分析を用いた場合、n次元のアイテム属性ベクトルtからn次元のアイテム属性重要成分ベクトルpへの変換式(属性重要成分データ算出式)は、式(4)のように表される。 FIG. 6 is a diagram illustrating a concept of a method for calculating an item attribute important component vector from an item attribute vector. FIG. 6A shows an example in which the item attribute vector t is plotted on a three-dimensional attribute space. The item attribute important component is an important component in the search calculated from the item attributes. For example, the axis with a large variance having a direction in the attribute space (two thick arrows in FIG. 6A). It can be calculated by projecting to FIG. 6B shows an example in which an item in the attribute space is projected onto a two-dimensional attribute important component space. The direction of the axis for calculating the item attribute important component vector p is obtained in advance by a method such as principal component analysis using a number of items having item attribute data as learning data. When using principal component analysis, conversion formula from n t dimensions of the item attribute vector t to n p-dimensional item attributes important component vector p (attribute important component data calculation formula) is expressed by equation (4) The

Figure 2009282681
Figure 2009282681

ただし、行列Eはn×nの行列である。また、ベクトルgはn×1のベクトルである。式(4)のパラメータは属性/属性重要成分変換部223が記憶している。そして、属性/属性重要成分変換部223は、アイテム属性データに基づいて算出したアイテム属性ベクトルtと、パラメータE、gを用いることで、アイテム属性重要成分ベクトルpを算出する。 However, the matrix E is an n p × nt matrix. The vector g is an n p × 1 vector. The parameter of equation (4) is stored in the attribute / attribute important component conversion unit 223. Then, the attribute / attribute important component conversion unit 223 calculates the item attribute important component vector p by using the item attribute vector t calculated based on the item attribute data and the parameters E and g.

属性重要成分推定用パラメータ学習部222は、特徴抽出部121が出力したアイテム特徴ベクトルfと、属性/属性重要成分変換部223が出力したアイテム属性重要成分ベクトルpを受け付け、アイテム属性重要成分推定用パラメータを算出する。アイテム属性重要成分ベクトルの変換式として、例えば、式(5)を用いることができる。   The attribute important component estimation parameter learning unit 222 receives the item feature vector f output from the feature extraction unit 121 and the item attribute important component vector p output from the attribute / attribute important component conversion unit 223, and estimates the item attribute important component. Calculate the parameters. As the item attribute important component vector conversion formula, for example, Formula (5) can be used.

Figure 2009282681
Figure 2009282681

ただし、pはn次元のアイテム属性重要成分ベクトル、fはn次元のアイテム特徴ベクトルである。また、行列Cはn×nの行列、ベクトルdはn×1のベクトルである。式(5)のC、dの第i行成分は、pのi番目の要素を目的変数、fの各要素を説明変数として線形回帰分析を適用することにより、算出することができる。算出された属性重要成分推定用パラメータは属性重要成分推定用パラメータ蓄積部230に記憶される。 Here, p is an np- dimensional item attribute important component vector, and f is an nf- dimensional item feature vector. The matrix C is an n p × n f matrix, and the vector d is an n p × 1 vector. The i-th row component of C and d in Equation (5) can be calculated by applying linear regression analysis using the i-th element of p as an objective variable and each element of f as an explanatory variable. The calculated attribute important component estimation parameter is stored in the attribute important component estimation parameter storage unit 230.

データベース登録部140は、楽曲データベース150にアイテム属性重要成分ベクトルとアイテムデータの登録を行う。属性/属性重要成分変換部244は、パラメータ学習部120の属性/属性重要成分変換部223と同じもので、アイテム属性データを入力し、アイテム属性重要成分ベクトルpを出力する。特徴抽出部142は、推薦リスト作成部120の特徴抽出部121と同じもので、アイテム音響信号を入力し、アイテム特徴ベクトルfを出力する。属性重要成分推定部243は、特徴抽出部142が出力したアイテム特徴ベクトルfと、属性重要成分推定用パラメータ蓄積部130が記憶している属性重要成分推定用パラメータを入力し、アイテム属性重要成分ベクトルpを出力する。   The database registration unit 140 registers an item attribute important component vector and item data in the music database 150. The attribute / attribute important component conversion unit 244 is the same as the attribute / attribute important component conversion unit 223 of the parameter learning unit 120, inputs item attribute data, and outputs an item attribute important component vector p. The feature extraction unit 142 is the same as the feature extraction unit 121 of the recommendation list creation unit 120, and receives an item acoustic signal and outputs an item feature vector f. The attribute important component estimation unit 243 receives the item feature vector f output from the feature extraction unit 142 and the attribute important component estimation parameter stored in the attribute important component estimation parameter storage unit 130, and the item attribute important component vector p is output.

図7は、アイテム特徴ベクトルからアイテム属性重要成分ベクトルを算出する方法の概念を表す図である。図7(A)は、アイテムX、Yを特徴a、b、cで表される3次元の特徴空間上にプロットした例である。アイテムX、Yの位置を表すn次元のアイテム特徴ベクトルをそれぞれf、fとする。この例では、n=3である。図7(B)は、2次元の属性重要成分空間上にアイテムX、Yをプロットした例である。アイテムX、Yの属性重要成分空間における位置を表すn次元のアイテム属性ベクトルをそれぞれp、pとする。この例ではn=2である。図7(C)は、特徴空間から属性重要成分空間へ変換する計算式である。アイテム特徴ベクトルをf、アイテム属性重要成分ベクトルをpとし、p=P(f)という変換式を用いることで、fからpを、fからpを推定値として算出する。 FIG. 7 is a diagram illustrating a concept of a method for calculating an item attribute important component vector from an item feature vector. FIG. 7A is an example in which items X and Y are plotted on a three-dimensional feature space represented by features a, b, and c. The n f- dimensional item feature vectors representing the positions of the items X and Y are respectively represented as f X and f Y. In this example, n f = 3. FIG. 7B is an example in which items X and Y are plotted on a two-dimensional attribute important component space. The n p- dimensional item attribute vectors representing the positions of the items X and Y in the attribute important component space are denoted as p X and p Y , respectively. In this example, n p = 2. FIG. 7C shows a calculation formula for converting from the feature space to the attribute important component space. The item feature vector is f, the item attribute important component vector is p, and a conversion formula p = P (f) is used to calculate f X to p X and f Y to p Y as estimated values.

変換式に式(5)を用いてベクトルを変換する場合は、行列C及びベクトルdが属性重要成分推定用パラメータ蓄積部230(図5)に記憶されている。そして、属性重要成分推定部243は、特徴抽出部142が生成したアイテム特徴ベクトルfと属性重要成分推定用パラメータ蓄積部230が記憶している属性重要成分推定用パラメータC、dを用いることで、アイテム属性重要成分ベクトルpを算出する。   When the vector is converted using the equation (5) as the conversion equation, the matrix C and the vector d are stored in the attribute important component estimation parameter storage unit 230 (FIG. 5). Then, the attribute important component estimation unit 243 uses the item feature vector f generated by the feature extraction unit 142 and the attribute important component estimation parameters C and d stored in the attribute important component estimation parameter storage unit 230, The item attribute important component vector p is calculated.

データベース登録部140は、アイテム属性データを有しないアイテムと、アイテム属性データを有するアイテムのどちらも入力として受け付ける。アイテム属性データを有しないアイテムの場合、特徴抽出部142は、アイテム音響信号を入力し、アイテム特徴ベクトルfを出力する。属性重要成分推定部243は、特徴抽出部142が出力したアイテム特徴ベクトルfを入力し、アイテム属性重要成分ベクトルpを出力する。出力したアイテム属性重要成分ベクトルpを楽曲データベース150に記憶させる。また、アイテム属性データを有するアイテムの場合、属性/属性重要成分変換部244は、アイテム属性データを入力し、アイテム属性重要成分ベクトルpを出力する。属性重要成分登録部241は属性/属性重要成分変換部244が出力したアイテム属性重要ベクトルpを、楽曲データベース150に登録する。   The database registration unit 140 accepts both an item having no item attribute data and an item having item attribute data as input. In the case of an item having no item attribute data, the feature extraction unit 142 receives an item acoustic signal and outputs an item feature vector f. The attribute important component estimation unit 243 receives the item feature vector f output from the feature extraction unit 142 and outputs an item attribute important component vector p. The output item attribute important component vector p is stored in the music database 150. In the case of an item having item attribute data, the attribute / attribute important component conversion unit 244 inputs the item attribute data and outputs the item attribute important component vector p. The attribute important component registration unit 241 registers the item attribute important vector p output from the attribute / attribute important component conversion unit 244 in the music database 150.

図8は、第2の実施形態による推薦リスト作成部110の処理を表すフローチャートである。
まず、特徴抽出部111は、アイテム音響信号(コンテンツ信号)を読み込む(ステップS101)。次に、特徴抽出部111は、読み込んだアイテム音響信号から特徴を抽出し、アイテム特徴ベクトルfを生成する(ステップS102)。次に、属性重要成分推定部212は、特徴抽出部111が生成したアイテム特徴ベクトルfと、属性重要成分推定用パラメータ蓄積部230が記憶している属性重要成分推定用パラメータを用い、アイテム属性重要成分ベクトルpinを算出する(ステップS103)。
FIG. 8 is a flowchart showing processing of the recommendation list creation unit 110 according to the second embodiment.
First, the feature extraction unit 111 reads an item acoustic signal (content signal) (step S101). Next, the feature extraction unit 111 extracts features from the read item acoustic signal and generates an item feature vector f (step S102). Next, the attribute important component estimation unit 212 uses the item feature vector f generated by the feature extraction unit 111 and the attribute important component estimation parameter stored in the attribute important component estimation parameter storage unit 230 to calculate the item attribute important calculating a component vector p in (step S103).

次に、リスト作成部113は、楽曲データベース150から読み出し完了フラグが立っていないアイテム属性重要成分ベクトルを検索する(ステップS104)。楽曲データベース150に読み出し完了フラグが立っていないアイテム属性重要成分ベクトルがあれば、リスト作成部113は、楽曲データベース150からアイテム属性重要成分ベクトルpを読み出し、読み出したアイテム属性重要成分ベクトルpに読み出し完了フラグを立てる(ステップS105)。リスト作成部113は、楽曲データベース150から読み出したアイテム属性重要成分ベクトルpと、属性重要成分推定部212が算出したアイテム属性重要成分ベクトルpinとの類似度を計算する(ステップS106)。 Next, the list creation unit 113 searches the item database 150 for item attribute important component vectors for which no read completion flag is set (step S104). If there is an item attribute important component vector read completion flag is not set in the music database 150, the list creation unit 113 reads the item attribute important component vector p d from the music database 150, the read item attributes important component vector p d A read completion flag is set (step S105). List creation unit 113 calculates the similarity of the item attributes important component vector p d read from the music database 150, an attribute item attribute important component estimator 212 calculates important component vector p in (step S106).

アイテム属性重要成分ベクトルpinとpとの類似度S(pin、p)は、第1の実施形態におけるアイテム属性成分の類似度と同様に、属性空間上での内積、余弦、また式(6)のようなガウス動径基底関数などを用いることができる。 Similarity S p (p in , p d ) between the item attribute important component vectors p in and p d is similar to the similarity of the item attribute component in the first embodiment, the inner product on the attribute space, cosine, Also, a Gaussian radial basis function such as the equation (6) can be used.

Figure 2009282681
Figure 2009282681

ただし、rは事前に設定されたパラメータである。リスト作成部113は、楽曲データベース150から全てのアイテム属性重要成分ベクトルを読み出すまでステップS104以降の処理を行う。全てのアイテム属性重要成分ベクトルを読み出したら、リスト作成部113は、楽曲データベース150上の類似度の高いアイテムのアイテムデータのリストを出力する(ステップS107)。特徴抽出部111においてアイテム音響信号を複数の短時間のセグメントに分割した場合は、それぞれのセグメントについて類似度の計算を行い、類似度の高いセグメントが属するアイテムのアイテムデータをリストとして出力する。 Here, r p is a parameter set in advance. The list creation unit 113 performs the processing from step S104 onward until all item attribute important component vectors are read from the music database 150. When all the item attribute important component vectors are read, the list creation unit 113 outputs a list of item data of items with high similarity on the music database 150 (step S107). When the item sound signal is divided into a plurality of short-time segments in the feature extraction unit 111, the similarity is calculated for each segment, and the item data of the item to which the segment having a high similarity belongs is output as a list.

第2の実施形態を用いることによって、アイテム属性データを有するアイテムに対しては、アイテム属性データをアイテム属性重要成分に変換し、アイテム属性データを有しないアイテムに対しては、アイテム属性重要成分を推定するために、アイテム属性データを有しないアイテムとアイテム属性データを有するアイテムとを同じ尺度を用いて比較・推薦することができる。また、第1の実施形態では、アイテム属性ベクトルtにおける全ての次元の値を算出し、類似度計算を行うため、属性空間の次元数が大きい場合には、計算時間の増大と類似度計算の精度の低下を招く恐れがあったが、第2の実施形態では、アイテム属性ベクトルtよりも低次元のアイテム属性重要成分ベクトルpを用いることにより、計算時間の短縮及び精度の向上を図ることができる。   By using the second embodiment, the item attribute data is converted into the item attribute important component for the item having the item attribute data, and the item attribute important component is changed for the item having no item attribute data. In order to estimate, an item having no item attribute data and an item having item attribute data can be compared and recommended using the same scale. In the first embodiment, since all dimension values in the item attribute vector t are calculated and the similarity is calculated, when the number of dimensions in the attribute space is large, the calculation time is increased and the similarity is calculated. In the second embodiment, the item attribute important component vector p having a dimension lower than that of the item attribute vector t can be used to reduce the calculation time and improve the accuracy. it can.

なお、第2の実施形態では、属性/属性重要成分変換部223、244が変換に用いるパラメータを記憶している場合を説明したが、これに限定するものではない。例えば、属性重要成分推定用パラメータ蓄積部230に、属性/属性重要成分変換部223、244が変換に用いるパラメータを記憶させ、属性/属性重要成分変換部223、244が計算を行うときに読み出すようにしてもよい。   In the second embodiment, the case where the attribute / attribute important component conversion units 223 and 244 store parameters used for conversion has been described, but the present invention is not limited to this. For example, the attribute important component estimation parameter storage unit 230 stores the parameters used by the attribute / attribute important component conversion units 223 and 244 for conversion, and reads them when the attribute / attribute important component conversion units 223 and 244 perform calculation. It may be.

(第3の実施形態)
以下、本発明の第3の実施形態について詳しく説明する。第3の実施形態は、推薦リスト作成部がアイテム属性データを受け付ける例である。
(Third embodiment)
Hereinafter, the third embodiment of the present invention will be described in detail. The third embodiment is an example in which the recommendation list creation unit accepts item attribute data.

図9は、本発明の第3の実施形態による類似アイテム検索装置1の構成を示す概略ブロック図である。以下、第1の実施形態と同様に、アイテムのコンテンツ信号が楽曲の音響信号(以下、アイテム音響信号とする)であった例について説明する。第3の実施形態による類似アイテム検索装置1は、リスト作成手段113への入力及び処理が、第1の実施形態による類似アイテム検索装置1と異なる。なお、他の処理部については同じであるため、同一の符号を用いて説明する。   FIG. 9 is a schematic block diagram showing the configuration of the similar item search device 1 according to the third embodiment of the present invention. Hereinafter, as in the first embodiment, an example in which the content signal of an item is a music acoustic signal (hereinafter referred to as an item acoustic signal) will be described. The similar item search device 1 according to the third embodiment is different from the similar item search device 1 according to the first embodiment in input and processing to the list creation unit 113. Since the other processing units are the same, description will be made using the same reference numerals.

図10は、第3の実施形態による推薦リスト作成部110の処理を表すフローチャートである。まず、推薦リスト作成部110は、入力されたデータのデータ種別がアイテム属性データであるかアイテム音響信号(コンテンツ信号)であるかを判断し、処理を行うデータ種別に入力済みフラグを立てる(ステップS201)。入力されたデータのデータ種別がアイテム属性データである場合は、リスト作成部113が、アイテム属性データを読み込み、アイテム属性ベクトルtinを作成する(ステップS202)。このアイテム属性ベクトルtを、第1の実施形態による属性推定部112が出力するアイテム属性ベクトルtinと同等のものであるとする。
入力されたデータのデータ種別がアイテム音響信号である場合は、特徴抽出部111が、アイテム音響信号(コンテンツ信号)を読み込む(ステップS203)。次に、特徴抽出部111は、読み込んだアイテム音響信号から特徴を抽出し、アイテム特徴ベクトルfを生成する(ステップS204)。次に、属性推定部112は、特徴抽出部111が生成したアイテム特徴ベクトルfと、属性推定用パラメータ蓄積部130が記憶している属性推定用パラメータを用い、アイテム属性ベクトルtinを算出する(ステップS205)。
FIG. 10 is a flowchart showing the process of the recommendation list creation unit 110 according to the third embodiment. First, the recommendation list creation unit 110 determines whether the data type of the input data is item attribute data or an item sound signal (content signal), and sets an input completed flag for the data type to be processed (Step S110). S201). If the data type of the input data is the item attribute data list creating unit 113 reads the item attribute data, to create an item attribute vector t in (step S202). The item attribute vector t, and is equivalent to the item attribute vector t in the attribute estimating unit 112 according to the first embodiment is output.
If the data type of the input data is an item acoustic signal, the feature extraction unit 111 reads the item acoustic signal (content signal) (step S203). Next, the feature extraction unit 111 extracts features from the read item acoustic signal and generates an item feature vector f (step S204). Next, the attribute estimating unit 112 uses the item feature vector f by the feature extraction unit 111 to generate a parameter for the attribute estimation attribute estimation parameter storage unit 130 stores, calculates the item attribute vector t in ( Step S205).

次に、リスト作成部113は、楽曲データベース150から読み出し完了フラグが立っていないアイテム属性ベクトルを検索する(ステップS206)。楽曲データベース150に読み出し完了フラグが立っていないアイテム属性ベクトルがあれば、リスト作成部113は、楽曲データベース150から該当するアイテム属性ベクトルtを読み出し、読み出したアイテム属性ベクトルtに読み出し完了フラグを立てる(ステップS207)。リスト作成部113は、楽曲データベース150から読み出したアイテム属性ベクトルtと、属性推定部112が算出したアイテム属性ベクトルtinとの類似度を計算する(ステップS208)。リスト作成部113は、楽曲データベース150から全てのアイテム属性ベクトルを読み出すまでステップS206以降の処理を行う。全てのアイテム属性ベクトルを読み出したら、リスト作成部113は、楽曲データベース150上の類似度の高いアイテムのアイテムデータのリストを作成する(ステップS209)。特徴抽出部111においてアイテム音響信号を複数の短時間のセグメントに分割した場合は、第1の実施形態と同様に、それぞれのセグメントについて類似度の計算を行い、類似度の高いセグメントが属するアイテムのアイテムデータをリストとして出力する。 Next, the list creating unit 113 searches the item database 150 for an item attribute vector for which no read completion flag is set (step S206). If the item attribute vector read completion flag is not set in the music database 150, the list creation unit 113 reads the item attribute vector t d corresponding the music database 150, a read completion flag in the read item attribute vector t d Stand up (step S207). List creation unit 113 calculates the item attribute vector t d read from the music database 150, the similarity between the item attribute vector t in the attribute estimating unit 112 is calculated (step S208). The list creation unit 113 performs the processing from step S206 onward until all item attribute vectors are read from the music database 150. When all the item attribute vectors are read, the list creation unit 113 creates a list of item data of items with high similarity on the music database 150 (step S209). When the item sound signal is divided into a plurality of short-time segments in the feature extraction unit 111, similar to the first embodiment, the similarity is calculated for each segment, and the item to which the segment with the higher similarity belongs is calculated. Output item data as a list.

次に、入力されたデータについて、入力済みフラグが立っていないデータ種別が存在するかどうかを確認する(ステップS210)。入力済みフラグが立っていないデータ種別が存在する場合は、該当するデータ種別に対し、ステップS201以降の処理を行う。入力されたデータの全てのデータ種別に対する処理が終わったら、リスト作成部113は、全てのリストに対し、類似度順に整列するなどの統合を行ったリストを作成し、出力する(ステップS211)。   Next, for the input data, it is confirmed whether there is a data type for which an input flag is not set (step S210). If there is a data type for which the input completion flag is not set, the processing from step S201 is performed on the corresponding data type. When the processing for all data types of the input data is completed, the list creation unit 113 creates and outputs an integrated list such as arranging all the lists in order of similarity (step S211).

第3の実施形態を用いることによって、アイテム属性データを有しないアイテムを、アイテム属性データを有するアイテムと同じ尺度を用いて比較・推薦することができる。また、アイテム属性データとアイテム音響信号とを有するアイテムに対しては、入力されたアイテム属性データに基づく類似度計算をさらに行うことで、第1の実施形態よりも精度の高い類似アイテム検索を行うことができる。   By using the third embodiment, an item that does not have item attribute data can be compared and recommended using the same scale as an item that has item attribute data. Further, for items having item attribute data and item acoustic signals, similar item search is performed with higher accuracy than in the first embodiment by further calculating similarity based on the input item attribute data. be able to.

(第4の実施形態)
以下、本発明の第4の実施形態について詳しく説明する。第4の実施形態は、推薦リスト作成部がアイテム属性データを受け付け、アイテム属性重要成分ベクトルを抽出する例である。
(Fourth embodiment)
Hereinafter, the fourth embodiment of the present invention will be described in detail. The fourth embodiment is an example in which the recommendation list creation unit accepts item attribute data and extracts an item attribute important component vector.

図11は、本発明の第4の実施形態による類似アイテム検索装置1の構成を示す概略ブロック図である。以下、第1の実施形態と同様に、アイテムのコンテンツ信号が楽曲の音響信号(以下、アイテム音響信号とする)であった例について説明する。第4の実施形態による類似アイテム検索装置1は、リスト作成手段113への入力及び処理が、第2の実施形態による類似アイテム検索装置1と異なり、推薦リスト作成部に属性/属性重要成分変換手段414を備える。なお、他の処理部については同じであるため、同一の符号を用いて説明する。   FIG. 11 is a schematic block diagram showing the configuration of the similar item search device 1 according to the fourth embodiment of the present invention. Hereinafter, as in the first embodiment, an example in which the content signal of an item is a music acoustic signal (hereinafter referred to as an item acoustic signal) will be described. Unlike the similar item search apparatus 1 according to the second embodiment, the similar item search apparatus 1 according to the fourth embodiment is different from the similar item search apparatus 1 according to the second embodiment in terms of input and processing. 414. Since the other processing units are the same, description will be made using the same reference numerals.

図12は、推薦リスト作成部110の処理を表すフローチャートである。まず、推薦リスト作成部110は、入力されたデータのデータ種別がアイテム属性データであるかアイテム音響信号(コンテンツ信号)であるかを判断し、処理を行うデータ種別に入力済みフラグを立てる(ステップS301)。入力されたデータのデータ種別がアイテム属性データである場合は、属性/属性重要成分変換部114が、アイテム属性データを読み込み、アイテム属性ベクトルtinを作成する(ステップS302)。属性/属性重要成分変換部414は、アイテム属性ベクトルtinから、アイテム属性重要成分ベクトルpinを算出する(ステップS303)。リスト作成部113は、属性/属性重要成分変換部414が出力したアイテム属性重要成分ベクトルpinを、第2の実施形態における属性重要成分推定部212が出力するアイテム属性重要成分ベクトルpinと同等のものであるとする。
入力されたデータのデータ種別がアイテム音響信号である場合は、特徴抽出部111が、アイテム音響信号(コンテンツ信号)を読み込む(ステップS304)。次に、特徴抽出部111は、読み込んだアイテム音響信号から特徴を抽出し、アイテム特徴ベクトルfを生成する(ステップS305)。次に、属性重要成分推定部212は、特徴抽出部111が生成したアイテム特徴ベクトルfと、属性重要成分推定用パラメータ蓄積部230が記憶している属性重要成分推定用パラメータを用い、アイテム属性重要成分ベクトルpinを算出する(ステップS306)。
FIG. 12 is a flowchart showing the process of the recommendation list creation unit 110. First, the recommendation list creation unit 110 determines whether the data type of the input data is item attribute data or an item acoustic signal (content signal), and sets an input completed flag for the data type to be processed (Step S110). S301). If the data type of the input data is the item attribute data, the attribute / attributes important component conversion unit 114 reads the item attribute data, to create an item attribute vector t in (step S302). Attribute / attribute important component conversion section 414, from the item attribute vector t in, it calculates the item attributes important component vector p in (step S303). List creation unit 113, attribute / attributes important item attribute component conversion unit 414 has output key component vector p in, equivalent to item attribute important component vector p in the attribute important component estimator 212 according to the second embodiment outputs Suppose that
If the data type of the input data is an item acoustic signal, the feature extraction unit 111 reads the item acoustic signal (content signal) (step S304). Next, the feature extraction unit 111 extracts features from the read item acoustic signal and generates an item feature vector f (step S305). Next, the attribute important component estimation unit 212 uses the item feature vector f generated by the feature extraction unit 111 and the attribute important component estimation parameter stored in the attribute important component estimation parameter storage unit 230 to determine the item attribute important calculating a component vector p in (step S306).

次に、リスト作成部113は、楽曲データベース150から読み出し完了フラグが立っていないアイテム属性重要成分ベクトルを検索する(ステップS307)。楽曲データベース150に読み出し完了フラグが立っていないアイテム属性重要ベクトルがあれば、リスト作成部113は、楽曲データベース150から該当するアイテム属性重要成分ベクトルpを読み出し、読み出したアイテム属性重要成分ベクトルpに読み出し完了フラグを立てる(ステップS308)。リスト作成部113は、楽曲データベース150から読み出したアイテム属性重要成分ベクトルpと、属性重要成分推定部212が算出したアイテム属性重要成分ベクトルpinとの類似度を計算する(ステップS309)。リスト作成部113は、楽曲データベース150から全てのアイテム属性重要成分ベクトルを読み出すまでステップS307以降の処理を行う。
全てのアイテム属性重要成分ベクトルを読み出したら、リスト作成部113は、楽曲データベース150上の類似度の高いアイテムのアイテムデータのリストを作成する(ステップS310)。特徴抽出部111においてアイテム音響信号を複数の短時間のセグメントに分割した場合は、第2の実施形態と同様に、それぞれのセグメントについて類似度の計算を行い、類似度の高いセグメントが属するアイテムのアイテムデータをリストとして出力する。
Next, the list creation unit 113 searches the song database 150 for an item attribute important component vector for which no read completion flag is set (step S307). If the item attributes important vector read completion flag is not set in the music database 150, the list creation unit 113 reads the item attribute important component vector p d corresponding the music database 150, the read item attributes important component vector p d A read completion flag is set at (Step S308). List creation unit 113 calculates the similarity of the item attributes important component vector p d read from the music database 150, an attribute item attribute important component estimator 212 calculates important component vector p in (step S309). The list creation unit 113 performs the processing from step S307 onward until all item attribute important component vectors are read from the music database 150.
When all the item attribute important component vectors have been read, the list creation unit 113 creates a list of item data of items with high similarity on the music database 150 (step S310). When the item sound signal is divided into a plurality of short-time segments in the feature extraction unit 111, similar to the second embodiment, the similarity is calculated for each segment, and the item to which the segment having a high similarity belongs is calculated. Output item data as a list.

次に、入力されたデータについて、入力済みフラグが立っていないデータ種別が存在するかどうかを確認する(ステップS311)。入力済みフラグが立っていないデータ種別が存在する場合は、該当するデータ種別に対し、ステップS1以降の処理を行う。入力されたデータの全てのデータ種別に対する処理が終わったら、リスト作成部413は、全てのリストに対し、類似度順に整列するなどの統合を行ったリストを作成し、出力する(ステップS312)。   Next, it is confirmed whether or not there is a data type for which the input completion flag is not set for the input data (step S311). If there is a data type for which the input completion flag is not set, the processing after step S1 is performed for the corresponding data type. When the processing for all the data types of the input data is completed, the list creation unit 413 creates and outputs an integrated list such as arranging all the lists in order of similarity (step S312).

第4の実施形態を用いることによって、アイテム属性重要成分ベクトルpを用いることにより、計算時間の短縮及び精度の向上を図ることができる。また、アイテム属性データとアイテム音響信号とを有するアイテムに対しては、入力されたアイテム属性データから得られるアイテム属性重要成分ベクトルに基づく類似度計算をさらに行うことで、第2の実施形態よりも精度の高い類似アイテム検索を行うことができる。   By using the item attribute important component vector p by using the fourth embodiment, calculation time can be shortened and accuracy can be improved. In addition, for an item having item attribute data and an item acoustic signal, the similarity calculation based on the item attribute important component vector obtained from the input item attribute data is further performed, thereby making it more than the second embodiment. A similar item search with high accuracy can be performed.

以上、図面を参照してこの発明の一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。   As described above, the embodiment of the present invention has been described in detail with reference to the drawings. However, the specific configuration is not limited to the above, and various design changes and the like can be made without departing from the scope of the present invention. It is possible to

上述した類似アイテム検索装置は内部に、コンピュータシステムを有している。そして、上述した各処理の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって、上記処理が行われる。ここでコンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等をいう。
また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしても良い。
The similar item search apparatus described above has a computer system therein. Each process described above is stored in a computer-readable recording medium in the form of a program, and the above process is performed by the computer reading and executing the program. Here, the computer-readable recording medium means a magnetic disk, a magneto-optical disk, a CD-ROM, a DVD-ROM, a semiconductor memory, or the like.
Alternatively, the computer program may be distributed to the computer via a communication line, and the computer that has received the distribution may execute the program.

また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。   The program may be for realizing a part of the functions described above. Furthermore, what can implement | achieve the function mentioned above in combination with the program already recorded on the computer system, and what is called a difference file (difference program) may be sufficient.

本発明の第1の実施形態による類似アイテム検索装置の構成を示す概略ブロック図である。It is a schematic block diagram which shows the structure of the similar item search device by the 1st Embodiment of this invention. アイテム音響信号からアイテム特徴ベクトルを算出する方法の概念を表す図である。It is a figure showing the concept of the method of calculating an item feature vector from an item acoustic signal. アイテム特徴ベクトルからアイテム属性ベクトルを算出する方法の概念を表す図である。It is a figure showing the concept of the method of calculating an item attribute vector from an item feature vector. 本発明の第1の実施形態による推薦リスト作成部の処理を表すフローチャートである。It is a flowchart showing the process of the recommendation list preparation part by the 1st Embodiment of this invention. 本発明の第2の実施形態による類似アイテム検索装置の構成を示す概略ブロック図である。It is a schematic block diagram which shows the structure of the similar item search device by the 2nd Embodiment of this invention. アイテム属性ベクトルからアイテム属性重要成分ベクトルを算出する方法の概念を表す図である。It is a figure showing the concept of the method of calculating an item attribute important component vector from an item attribute vector. アイテム特徴ベクトルからアイテム属性重要成分ベクトルを算出する方法の概念を表す図である。It is a figure showing the concept of the method of calculating an item attribute important component vector from an item feature vector. 本発明の第2の実施形態による推薦リスト作成部の処理を表すフローチャートである。It is a flowchart showing the process of the recommendation list preparation part by the 2nd Embodiment of this invention. 本発明の第3の実施形態による類似アイテム検索装置の構成を示す概略ブロック図である。It is a schematic block diagram which shows the structure of the similar item search device by the 3rd Embodiment of this invention. 本発明の第3の実施形態による推薦リスト作成部の処理を表すフローチャートである。It is a flowchart showing the process of the recommendation list preparation part by the 3rd Embodiment of this invention. 本発明の第4の実施形態による類似アイテム検索装置の構成を示す概略ブロック図である。It is a schematic block diagram which shows the structure of the similar item search device by the 4th Embodiment of this invention. 本発明の第4の実施形態による推薦リスト作成部の処理を表すフローチャートである。It is a flowchart showing the process of the recommendation list preparation part by the 4th Embodiment of this invention. アイテム属性データに基づく類似アイテム検索方法の概要を示す図である。It is a figure which shows the outline | summary of the similar item search method based on item attribute data. コンテンツ信号に基づく類似アイテム検索方法の概要を示す図である。It is a figure which shows the outline | summary of the similar item search method based on a content signal.

符号の説明Explanation of symbols

1…類似アイテム検索装置 110…推薦リスト作成部 111…特徴抽出部 112…属性推定部 113…リスト作成部 120…パラメータ学習部 121…特徴抽出部 122…パラメータ学習部 130…属性推定用パラメータ蓄積部 140…データベース登録部 141…属性登録部 142…特徴抽出部 143…属性推定部 150…楽曲データベース 212…属性重要成分推定部 222…属性重要成分推定用パラメータ学習部 223…属性/属性重要成分変換部 230…属性重要成分推定用パラメータ蓄積部 241…属性重要成分登録部 243…属性重要成分推定部 244…属性/属性重要成分変換部 414…属性/属性重要成分変換部   DESCRIPTION OF SYMBOLS 1 ... Similar item search device 110 ... Recommendation list creation part 111 ... Feature extraction part 112 ... Attribute estimation part 113 ... List creation part 120 ... Parameter learning part 121 ... Feature extraction part 122 ... Parameter learning part 130 ... Parameter accumulation part for attribute estimation 140 ... Database registration unit 141 ... Attribute registration unit 142 ... Feature extraction unit 143 ... Attribute estimation unit 150 ... Music database 212 ... Attribute important component estimation unit 222 ... Attribute important component estimation parameter learning unit 223 ... Attribute / attribute important component conversion unit 230 ... Attribute important component estimation parameter storage unit 241 ... Attribute important component registration unit 243 ... Attribute important component estimation unit 244 ... Attribute / attribute important component conversion unit 414 ... Attribute / attribute important component conversion unit

Claims (10)

あるアイテムの内容を表すコンテンツ信号の入力を受け付けることにより、当該アイテムと属性が類似するアイテムのアイテムデータをアイテムデータベースの中から検索し、検索結果をリストとして出力する類似アイテム検索装置であって、
属性推定用データベースと、
学習用コンテンツ信号と、当該学習用コンテンツ信号によって示されるアイテムの前記属性を表すアイテム属性ベクトルの組を入力として受け付け、当該学習用コンテンツ信号の特徴を要素とする学習用特徴ベクトルを生成し、複数の前記入力を受け付けたアイテム属性ベクトルと当該学習用特徴ベクトルとの関係に基づいて前記属性の推定に用いる属性推定用パラメータを得て、当該属性推定用パラメータを前記属性推定用データベースに蓄積するパラメータ学習手段と、
アイテム属性ベクトルを、前記アイテムデータベースのアイテムデータに対応付けて登録する属性登録手段と、
前記入力を受け付けたコンテンツ信号から当該コンテンツ信号の特徴を要素とするアイテム特徴ベクトルを抽出して出力する特徴抽出手段と、
前記アイテム特徴ベクトルと、前記属性推定用データベースに蓄積されている前記属性推定用パラメータとを属性データ算出式に代入することで、前記入力を受け付けたコンテンツ信号によって示されるアイテムのアイテム属性ベクトルを生成する属性推定手段と、
前記入力を受け付けたコンテンツ信号によって示されるアイテムのアイテム属性ベクトルと、前記アイテムデータベースに保存されている少なくとも1つのアイテム属性ベクトルとの類似度を算出し、当該類似度の値に基づいて前記リストを作成して出力するリスト作成手段と、
を有することを特徴とする類似アイテム検索装置。
A similar item search device that accepts input of a content signal representing the content of an item, searches for item data of an item having an attribute similar to the item from the item database, and outputs a search result as a list,
An attribute estimation database;
A learning content signal and a set of item attribute vectors representing the attribute of the item indicated by the learning content signal are accepted as input, and a learning feature vector having the characteristics of the learning content signal as an element is generated. A parameter for obtaining an attribute estimation parameter used for estimation of the attribute based on the relationship between the item attribute vector that has received the input and the feature vector for learning, and storing the attribute estimation parameter in the attribute estimation database Learning means,
Attribute registration means for registering an item attribute vector in association with item data in the item database;
A feature extraction means for extracting and outputting an item feature vector having the feature of the content signal as an element from the content signal that has received the input;
By substituting the item feature vector and the attribute estimation parameter stored in the attribute estimation database into an attribute data calculation formula, an item attribute vector of the item indicated by the content signal that has received the input is generated. Attribute estimation means to
The similarity between the item attribute vector of the item indicated by the content signal that has received the input and at least one item attribute vector stored in the item database is calculated, and the list is calculated based on the similarity value. A list creation means for creating and outputting;
A similar item retrieval apparatus characterized by comprising:
あるアイテムの内容を表すコンテンツ信号の入力を受け付けることにより、当該アイテムと属性が類似するアイテムデータをアイテムデータベースの中から検索し、検索結果をリストとして出力する類似アイテム検索装置であって、
属性重要成分推定用データベースと、
学習用コンテンツ信号と、当該学習用コンテンツ信号によって示されるアイテムの前記属性を表現する少なくとも1つの成分である属性重要成分を表すアイテム属性重要成分ベクトルの組を入力として受け付け、当該学習用コンテンツ信号の特徴を要素とする学習用特徴ベクトルを生成し、複数の前記入力を受け付けたアイテム属性重要成分ベクトルと当該学習用特徴ベクトルとの関係に基づいて前記属性重要成分の推定に用いる属性重要成分推定用パラメータを得て、当該属性重要成分推定用パラメータを前記属性重要成分推定用データベースに蓄積するパラメータ学習手段と、
アイテム属性重要成分ベクトルを、前記アイテムデータベースのアイテムデータに対応付けて登録する属性重要成分登録手段と、
前記入力を受け付けたコンテンツ信号から当該コンテンツ信号の特徴を要素とするアイテム特徴ベクトルを抽出して出力する特徴抽出手段と、
前記アイテム特徴ベクトルと、前記属性重要成分推定用データベースに蓄積されている属性重要成分推定用パラメータとを属性重要成分データ算出式に代入することで、前記入力を受け付けたコンテンツ信号によって示されるアイテムのアイテム属性重要成分ベクトルを生成する属性重要成分推定手段と、
前記入力を受け付けたコンテンツ信号によって示されるアイテムのアイテム属性重要成分ベクトルと、前記アイテムデータベースに保存された少なくとも1つのアイテム属性重要成分ベクトルとの類似度を算出し、当該類似度の値に基づいて前記リストを作成して出力するリスト作成手段と、
を有することを特徴とする類似アイテム検索装置。
By receiving input of a content signal representing the contents of a certain item, a similar item search device that searches item data having an attribute similar to the item from the item database and outputs a search result as a list,
Attribute important component estimation database;
A set of a learning content signal and an item attribute important component vector representing an attribute important component that is at least one component expressing the attribute of the item indicated by the learning content signal is received as an input, and the learning content signal A feature vector for learning having features as elements is generated, and an attribute important component estimation used for estimating the attribute important component based on the relationship between the item attribute important component vector that has received a plurality of inputs and the learning feature vector. Parameter learning means for obtaining a parameter and storing the attribute important component estimation parameter in the attribute important component estimation database;
Attribute important component registration means for registering an item attribute important component vector in association with item data in the item database;
A feature extraction means for extracting and outputting an item feature vector having the feature of the content signal as an element from the content signal that has received the input;
By substituting the item feature vector and the attribute important component estimation parameter stored in the attribute important component estimation database into the attribute important component data calculation formula, the item indicated by the content signal that has received the input Attribute important component estimation means for generating an item attribute important component vector;
The similarity between the item attribute important component vector of the item indicated by the content signal that has received the input and at least one item attribute important component vector stored in the item database is calculated, and based on the similarity value A list creation means for creating and outputting the list;
A similar item retrieval apparatus characterized by comprising:
前記リスト作成手段は、コンテンツ信号のみでなく、前記属性を示す属性データを入力して前記アイテムデータベースに保存された少なくとも1つのアイテム属性ベクトルとの類似度の算出を行うことを特徴とする請求項1に記載の類似アイテム検索装置。   The list creating means inputs not only the content signal but also attribute data indicating the attribute, and calculates the similarity with at least one item attribute vector stored in the item database. The similar item search device according to 1. 前記リスト作成手段は、コンテンツ信号のみでなく、前記属性を示す属性データを入力し、当該属性データによって算出された属性重要成分ベクトルを用いて、前記アイテムデータベースに保存された少なくとも1つのアイテム属性重要成分ベクトルとの類似度の算出を行うことを特徴とする請求項2に記載の類似アイテム検索装置。   The list creating means inputs not only the content signal but also attribute data indicating the attribute, and using the attribute important component vector calculated from the attribute data, at least one item attribute important stored in the item database The similarity item search device according to claim 2, wherein the similarity is calculated with the component vector. 前記特徴抽出手段において、入力されるコンテンツ信号が音響信号であることを特徴とする請求項1から請求項4のいずれかに記載の類似アイテム検索装置。   The similar item search apparatus according to claim 1, wherein the content signal input is an acoustic signal in the feature extraction unit. 前記特徴抽出手段において、出力されるアイテム特徴ベクトルの各要素は、対数周波数軸上で等間隔になる各周波数における音響パワースペクトルであることを特徴とする請求項5に記載の類似アイテム検索装置。   6. The similar item search apparatus according to claim 5, wherein each element of the item feature vector to be output in the feature extraction means is an acoustic power spectrum at each frequency that is equally spaced on a logarithmic frequency axis. あるアイテムの内容を表すコンテンツ信号の入力を受け付けることにより、当該アイテムと属性が類似するアイテムデータをアイテムデータベースの中から検索して検索結果をリストとして出力し、属性推定用データベースを備える類似アイテム検索装置における類似アイテム検索方法であって、
パラメータ学習手段は、学習用コンテンツ信号と当該学習用コンテンツ信号によって示されるアイテムの前記属性を表すアイテム属性ベクトルの組を入力として受け付け、当該学習用コンテンツ信号の特徴を要素とする学習用特徴ベクトルを生成し、複数の前記入力を受け付けたアイテム属性ベクトルと当該学習用特徴ベクトルとの関係に基づいて前記属性の推定に用いる属性推定用パラメータを得て、当該属性推定用パラメータを前記属性推定用データベースに蓄積し、
属性登録手段は、アイテム属性ベクトルを前記アイテムデータベースのアイテムデータに対応付けて登録し、
特徴抽出手段は、前記入力を受け付けたコンテンツ信号から当該コンテンツ信号の特徴を要素とするアイテム特徴ベクトルを抽出して出力し、
属性推定手段は、前記アイテム特徴ベクトルと、前記属性推定用データベースに蓄積されている属性推定用パラメータとを属性データ算出式に代入することで、前記入力を受け付けたコンテンツ信号によって示されるアイテムのアイテム属性ベクトルを生成し、
リスト作成手段は、前記入力を受け付けたコンテンツ信号によって示されるアイテムのアイテム属性ベクトルを用いて、前記アイテムデータベースに保存されている少なくとも1つのアイテム属性ベクトルとの類似度を算出し、当該類似度の値に基づいて前記リストを作成して出力することを特徴とする類似アイテム検索方法。
By receiving input of a content signal representing the contents of a certain item, search for item data similar in attribute to the item in the item database, output the search results as a list, and search for similar items provided with an attribute estimation database A similar item search method in an apparatus,
The parameter learning means receives as input a set of an item attribute vector representing the attribute of the item indicated by the learning content signal and the learning content signal, and receives a learning feature vector having the feature of the learning content signal as an element. Generating an attribute estimation parameter to be used for estimation of the attribute based on the relationship between the item attribute vector that has been generated and received the plurality of inputs and the learning feature vector, and using the attribute estimation parameter as the attribute estimation database; Accumulate in
The attribute registration means registers the item attribute vector in association with the item data of the item database,
The feature extraction means extracts and outputs an item feature vector having the feature of the content signal as an element from the content signal that has received the input,
The attribute estimation unit substitutes the item feature vector and the attribute estimation parameter stored in the attribute estimation database into an attribute data calculation formula, thereby the item of the item indicated by the content signal that has received the input Generate an attribute vector,
The list creation means calculates the similarity with at least one item attribute vector stored in the item database using the item attribute vector of the item indicated by the content signal that has received the input, A similar item search method, wherein the list is created and output based on a value.
あるアイテムの内容を表すコンテンツ信号の入力を受け付けることにより、当該アイテムと属性が類似するアイテムデータをアイテムデータベースの中から検索して検索結果をリストとして出力し、属性重要成分推定用データベースを備える類似アイテム検索装置における類似アイテム検索方法であって、
パラメータ学習手段は、学習用コンテンツ信号と、当該学習用コンテンツ信号によって示されるアイテムの前記属性を表現する少なくとも1つの成分である属性重要成分を表すアイテム属性重要成分ベクトルの組を入力として受け付け、当該学習用コンテンツ信号の特徴を要素とする学習用特徴ベクトルを生成し、複数の前記入力を受け付けたアイテム属性重要成分ベクトルと当該学習用特徴ベクトルとの関係に基づいて属性重要成分の推定に用いる属性重要成分推定用パラメータを得て、当該属性重要成分推定用パラメータを前記属性重要成分推定用データベースに蓄積し、
属性重要成分登録手段は、アイテム属性重要成分ベクトルを前記アイテムデータベースのアイテムデータに対応付けて登録し、
特徴抽出手段は、前記入力を受け付けたコンテンツ信号から当該コンテンツ信号の特徴を要素とするアイテム特徴ベクトルを抽出して出力し、
属性重要成分推定手段は、前記アイテム特徴ベクトルと、前記属性重要成分推定用データベースに蓄積されている属性重要成分推定用パラメータとを属性重要成分データ算出式に代入することで、前記入力を受け付けたコンテンツ信号によって示されるアイテムのアイテム属性重要成分ベクトルを生成し、
リスト作成手段は、前記入力を受け付けたコンテンツ信号によって示されるアイテムのアイテム属性重要成分ベクトルを用いて、前記アイテムデータベースに保存された少なくとも1つのアイテム属性重要成分ベクトルとの類似度を算出し、当該類似度の値に基づいて前記リストを作成して出力することを特徴とする類似アイテム検索方法。
By receiving the input of a content signal representing the content of an item, search for item data having similar attributes to the item in the item database, output the search results as a list, and provide a database for estimating attribute important components A similar item search method in an item search device,
The parameter learning means accepts as input a set of a learning content signal and an item attribute important component vector representing an attribute important component that is at least one component expressing the attribute of the item indicated by the learning content signal, An attribute used for estimating an attribute important component based on the relationship between an item attribute important component vector that has received a plurality of the inputs and the learning feature vector, by generating a learning feature vector whose elements are the features of the learning content signal Obtain an important component estimation parameter, accumulate the attribute important component estimation parameter in the attribute important component estimation database,
The attribute important component registration means registers the item attribute important component vector in association with the item data of the item database,
The feature extraction means extracts and outputs an item feature vector having the feature of the content signal as an element from the content signal that has received the input,
The attribute important component estimation means receives the input by substituting the item feature vector and the attribute important component estimation parameter stored in the attribute important component estimation database into the attribute important component data calculation formula Generate an item attribute important component vector for the item indicated by the content signal,
The list creation means calculates the similarity with at least one item attribute important component vector stored in the item database using the item attribute important component vector of the item indicated by the content signal that has received the input, A similar item search method comprising: generating and outputting the list based on a similarity value.
請求項1または請求項2の何れかに記載の類似アイテム検索装置のコンピュータに実行させるプログラム。  A program to be executed by a computer of the similar item search device according to claim 1. 請求項9に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
A computer-readable recording medium on which the program according to claim 9 is recorded.
JP2008133158A 2008-05-21 2008-05-21 Similar item search device, similar item search method, program thereof, and recording medium Active JP5153451B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008133158A JP5153451B2 (en) 2008-05-21 2008-05-21 Similar item search device, similar item search method, program thereof, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008133158A JP5153451B2 (en) 2008-05-21 2008-05-21 Similar item search device, similar item search method, program thereof, and recording medium

Publications (2)

Publication Number Publication Date
JP2009282681A true JP2009282681A (en) 2009-12-03
JP5153451B2 JP5153451B2 (en) 2013-02-27

Family

ID=41453090

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008133158A Active JP5153451B2 (en) 2008-05-21 2008-05-21 Similar item search device, similar item search method, program thereof, and recording medium

Country Status (1)

Country Link
JP (1) JP5153451B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018116454A (en) * 2017-01-18 2018-07-26 株式会社カブク Supply chain retrieval system and supply chain retrieval program

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005010771A (en) * 2003-05-26 2005-01-13 Matsushita Electric Ind Co Ltd Music retrieval device
JP2006323438A (en) * 2005-05-17 2006-11-30 Sharp Corp Musical piece retrieval system
JP2007114798A (en) * 2006-11-14 2007-05-10 Matsushita Electric Ind Co Ltd Music retrieval device, music retrieval method, and program and recording medium thereof
JP2008041043A (en) * 2006-08-10 2008-02-21 Matsushita Electric Ind Co Ltd Information processing apparatus

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005010771A (en) * 2003-05-26 2005-01-13 Matsushita Electric Ind Co Ltd Music retrieval device
JP2006323438A (en) * 2005-05-17 2006-11-30 Sharp Corp Musical piece retrieval system
JP2008041043A (en) * 2006-08-10 2008-02-21 Matsushita Electric Ind Co Ltd Information processing apparatus
JP2007114798A (en) * 2006-11-14 2007-05-10 Matsushita Electric Ind Co Ltd Music retrieval device, music retrieval method, and program and recording medium thereof

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018116454A (en) * 2017-01-18 2018-07-26 株式会社カブク Supply chain retrieval system and supply chain retrieval program

Also Published As

Publication number Publication date
JP5153451B2 (en) 2013-02-27

Similar Documents

Publication Publication Date Title
JP5565374B2 (en) Device for changing the segmentation of audio works
Logan Music Recommendation from Song Sets.
JP4775379B2 (en) Apparatus and method for specifying various segment classes
US7521620B2 (en) Method of and system for browsing of music
JP5066963B2 (en) Database construction device
US10104356B2 (en) Scenario generation system, scenario generation method and scenario generation program
JP4560544B2 (en) Music search device, music search method, and music search program
JP4775380B2 (en) Apparatus and method for grouping time segments of music
Lee et al. The geographic flow of music
JP2007287256A (en) Play list retrieval system and method for retrieval play list
EP1531405B1 (en) Information search apparatus, information search method, and information recording medium on which information search program is recorded
JP6181499B2 (en) Product recommendation system, product recommendation server, and product recommendation program
KR20080082022A (en) Likelihood measurement apparatus and method based on music characteristics and music recommendation system and method using its
JP5153451B2 (en) Similar item search device, similar item search method, program thereof, and recording medium
JP2007233515A (en) Information processor and information processing method, information providing apparatus and information providing method, and program
US20130071089A1 (en) Category creating program, category creating apparatus, and category creating method
JP2010086273A (en) Apparatus, method, and program for searching for music
KR20070061887A (en) Method of providing compliance information
JP2005018205A (en) Musical piece retrieving system and method, and musical piece retrieving device
JP2010165160A (en) Musical piece classification device, musical piece retrieval system and computer program
JP5618150B2 (en) Information processing apparatus, information processing method, and program
JP2006243887A (en) Information retrieval device, method and computer program
JP2007041823A (en) Content retrieval system and its retrieval method
KR101968206B1 (en) Method for automatically generating music playlist by analyzing user prior information
JP2014164112A (en) Electric apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100819

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120711

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120724

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120921

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121127

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121204

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151214

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 5153451

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151214

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350