JP6433270B2 - Content search result providing system and content search result providing method - Google Patents

Content search result providing system and content search result providing method Download PDF

Info

Publication number
JP6433270B2
JP6433270B2 JP2014244832A JP2014244832A JP6433270B2 JP 6433270 B2 JP6433270 B2 JP 6433270B2 JP 2014244832 A JP2014244832 A JP 2014244832A JP 2014244832 A JP2014244832 A JP 2014244832A JP 6433270 B2 JP6433270 B2 JP 6433270B2
Authority
JP
Japan
Prior art keywords
search
content
user
category
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014244832A
Other languages
Japanese (ja)
Other versions
JP2016110260A (en
Inventor
健 榎園
健 榎園
飛飛 張
飛飛 張
佑介 深澤
佑介 深澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2014244832A priority Critical patent/JP6433270B2/en
Publication of JP2016110260A publication Critical patent/JP2016110260A/en
Application granted granted Critical
Publication of JP6433270B2 publication Critical patent/JP6433270B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、コンテンツ検索結果提供システム及びコンテンツ検索結果提供方法に関する。   The present invention relates to a content search result providing system and a content search result providing method.

従来、ユーザの興味関心に沿ったコンテンツを提供するため、ユーザの過去の検索履歴に基づいて、検索クエリに応じた検索結果を出力する技術がある。例えば、特許文献1に記載の技術では、ユーザのクリック操作によって閲覧要求がされたウェブページのコンテンツを解析した結果をデータベースに記憶し、当該データベースに基づき、出力する検索結果の優先度を変える。   2. Description of the Related Art Conventionally, there is a technique for outputting a search result corresponding to a search query based on a user's past search history in order to provide content according to the user's interests. For example, in the technique described in Patent Document 1, the result of analyzing the content of a web page requested to be browsed by a user's click operation is stored in a database, and the priority of search results to be output is changed based on the database.

特開2011−227572号公報JP 2011-227572 A

上記の従来技術では、ユーザのクリック操作等によって検索結果からコンテンツが選択されたことを示す検索クリック履歴(以下、「検索クリック履歴」と称する)を用いることで、ユーザの嗜好性が反映されたコンテンツを提供する。よって、検索要求を行うユーザの検索クリック履歴が十分にない場合には、そのユーザの嗜好性が反映されたコンテンツを提供することができない。   In the above prior art, the user's palatability is reflected by using the search click history (hereinafter referred to as “search click history”) indicating that the content is selected from the search result by the user's click operation or the like. Provide content. Therefore, when there is not enough search click history of a user who makes a search request, it is not possible to provide content that reflects the user's preference.

そこで、本発明は、検索要求を行うユーザの検索クリック履歴が十分にない場合にも、そのユーザの嗜好性が反映されたコンテンツを提供することができるコンテンツ検索結果提供装置及びコンテンツ検索結果提供方法を提供することを目的とする。   Therefore, the present invention provides a content search result providing apparatus and a content search result providing method capable of providing content reflecting the user's preference even when there is not enough search click history of the user who makes the search request. The purpose is to provide.

本発明に係るコンテンツ検索結果提供システムは、所定の検索クエリと、コンテンツのカテゴリ毎の所定の検索クエリに対する対応度合いとを関連付けた情報が格納されるクエリカテゴリ辞書と、ユーザ端末から送信された過去の検索クエリを示す検索クエリ履歴を取得する検索履歴取得手段と、検索クエリ履歴を用いて、クエリカテゴリ辞書から、コンテンツのカテゴリ毎の過去の検索クエリに対する対応度合いを関連付けた情報を抽出し、抽出された情報に基づき、コンテンツのカテゴリに対するユーザ毎の嗜好性の対応度合いを示すユーザ特徴量を算出するユーザ特徴量算出手段と、ユーザ端末から送信された検索要求時の検索クエリに対応すると共にカテゴリに対応付けられたコンテンツを示す情報を含むコンテンツの検索結果を取得する検索結果取得手段と、ユーザ特徴量に基づき、コンテンツの検索結果を出力する出力手段と、を備える。   The content search result providing system according to the present invention includes a query category dictionary in which information relating a predetermined search query and a degree of correspondence to a predetermined search query for each content category is stored, and a past transmitted from a user terminal Using the search history acquisition means to acquire the search query history indicating the search query of the search query and the search query history, the information that correlates the degree of correspondence with the past search query for each content category is extracted from the query category dictionary and extracted. User feature amount calculating means for calculating a user feature amount indicating the degree of correspondence of each user's preference with respect to a content category, and a category corresponding to a search query at the time of a search request transmitted from a user terminal. Search results for content that contains information indicating content associated with Comprises a search result acquisition means for, based on the user's feature quantity, and output means for outputting the search results of the content, the.

また、本発明に係るコンテンツ検索結果提供方法は、所定の検索クエリと、コンテンツのカテゴリ毎の所定の検索クエリに対する対応度合いとを関連付けた情報が格納されるクエリカテゴリ辞書を備えたコンテンツ検索結果提供システムの動作方法であるコンテンツ検索結果提供方法であって、ユーザ端末から送信された過去の検索クエリを示す検索クエリ履歴を取得する検索履歴取得ステップと、検索クエリ履歴を用いて、クエリカテゴリ辞書から、コンテンツのカテゴリ毎の過去の検索クエリに対する対応度合いを関連付けた情報を抽出し、抽出された情報に基づき、コンテンツのカテゴリに対するユーザ毎の嗜好性の対応度合いを示すユーザ特徴量を算出するユーザ特徴量算出ステップと、ユーザ端末から送信された検索要求時の検索クエリに対応すると共にカテゴリに対応付けられたコンテンツを示す情報を含むコンテンツの検索結果を取得する検索結果取得ステップと、ユーザ特徴量に基づき、コンテンツの検索結果を出力する出力ステップと、を含む。   Also, the content search result providing method according to the present invention provides a content search result provided with a query category dictionary in which information relating a predetermined search query and a degree of correspondence to the predetermined search query for each category of content is stored. A content search result providing method, which is an operation method of the system, including a search history acquisition step for acquiring a search query history indicating a past search query transmitted from a user terminal, and a query category dictionary using the search query history Extracting information that associates the degree of correspondence to past search queries for each content category, and calculating a user feature amount that indicates the degree of preference for each user with respect to the content category based on the extracted information Amount calculation step and search at the time of search request sent from user terminal Including a search result obtaining step of obtaining search results of content including information indicating the content associated with the category with corresponding area, based on the user's feature quantity, and outputting the search results of content and.

このようなコンテンツ検索結果提供システム及びコンテンツ検索結果提供方法によれば、クエリカテゴリ辞書から、コンテンツのカテゴリ毎の過去の検索クエリに対する対応度合いを関連付けた情報が抽出され、この抽出された情報に基づき、コンテンツのカテゴリに対するユーザ毎の嗜好性の対応度合いを示すユーザ特徴量が算出される。よって、当該ユーザ特徴量は、検索要求を行うユーザの検索クリック履歴を用いることなく算出される。そして、当該ユーザ特徴量に基づき検索要求時の検索クエリに対応するコンテンツの検索結果が出力されるので、検索要求を行うユーザの検索クリック履歴がない場合にも、そのユーザの嗜好性が反映された検索結果を出力することができる。以上より、検索要求を行うユーザの検索クリック履歴がない場合にも、そのユーザの嗜好性が反映されたコンテンツを提供することができる。   According to such a content search result providing system and content search result providing method, information associating the degree of correspondence with a past search query for each content category is extracted from the query category dictionary, and based on the extracted information. Then, the user feature amount indicating the degree of correspondence of the preference for each user with respect to the content category is calculated. Therefore, the user feature amount is calculated without using the search click history of the user who makes the search request. Since the search result of the content corresponding to the search query at the time of the search request is output based on the user feature amount, the user's preference is reflected even when there is no search click history of the user who makes the search request. Search results can be output. As described above, even when there is no search click history of a user who makes a search request, it is possible to provide content that reflects the user's preference.

また、本発明に係るコンテンツ検索結果提供システムでは、ユーザ特徴量に基づき、コンテンツの検索結果に含まれるコンテンツを示す情報の順序を決定する順位算出手段を更に備え、出力手段は、順位算出手段により決定された順序に従いコンテンツの検索結果を出力してもよい。この場合、ユーザ特徴量に基づく順序のコンテンツの検索結果が出力されるので、検索要求を行うユーザの検索クリック履歴がない場合にも、そのユーザの嗜好性に応じた順で並べられた検索結果を出力することができる。   The content search result providing system according to the present invention further comprises rank calculating means for determining the order of information indicating the content included in the content search result based on the user feature amount, and the output means is provided by the rank calculating means. Content search results may be output according to the determined order. In this case, since the search result of the content in the order based on the user feature amount is output, even when there is no search click history of the user who makes the search request, the search result arranged in the order corresponding to the user's preference Can be output.

また、本発明に係るコンテンツ検索結果提供システムでは、所定の検索クエリは、過去の検索クエリを含み、検索履歴取得手段は、複数のユーザ毎に、過去の検索クエリと、過去の検索クエリに対応するコンテンツのうち、ユーザが選択したコンテンツのカテゴリとを関連付けた情報である複数ユーザ履歴を取得しており、複数ユーザ履歴に基づいて、クエリカテゴリ辞書を作成する作成手段を更に備え本発明に係るコンテンツ検索結果提供方法では、所定の検索クエリは、過去の検索クエリを含み、検索履歴取得ステップにおいて、複数のユーザ毎に、過去の検索クエリと、過去の検索クエリに対応するコンテンツのうち、ユーザが選択したコンテンツのカテゴリとを関連付けた情報である複数ユーザ履歴を取得しており、複数ユーザ履歴に基づいて、クエリカテゴリ辞書を作成する作成ステップを更に含む。この場合、複数のユーザ毎に過去の検索クエリとカテゴリとが関連付けられた複数ユーザ履歴に基づきクエリカテゴリ辞書が作成されるので、クエリカテゴリ辞書に格納される情報の信頼性をより高めることができる。 Further, in the content search result providing system according to the present invention, the predetermined search query includes a past search query, and the search history acquisition unit corresponds to the past search query and the past search query for each of a plurality of users. of the content, the user has to acquire a multi-user history is information associating the category of content selected, based on a plurality user history, further Ru comprising a creating means for creating a query category dictionary. In the content search result providing method according to the present invention, the predetermined search query includes a past search query, and in the search history acquisition step, the past search query and the content corresponding to the past search query for each of a plurality of users. A plurality of user histories that are information associated with the content category selected by the user, and a creation step of creating a query category dictionary based on the plurality of user histories. In this case, since a query category dictionary is created based on a plurality of user histories in which past search queries and categories are associated with a plurality of users, the reliability of information stored in the query category dictionary can be further increased. .

また、本発明に係るコンテンツ検索結果提供システムでは、ユーザ端末から送信された検索要求時の検索クエリに対応するコンテンツを検索する検索手段を更に備えてもよい。この場合、検索手段により、ユーザ端末から送信された検索要求時の検索クエリに対応するコンテンツを検索することができる。   The content search result providing system according to the present invention may further include search means for searching for content corresponding to the search query at the time of the search request transmitted from the user terminal. In this case, the content corresponding to the search query at the time of the search request transmitted from the user terminal can be searched by the search means.

本発明によれば、検索要求を行うユーザの検索クリック履歴がない場合にも、そのユーザの嗜好性が反映されたコンテンツを提供することができるコンテンツ検索結果提供システム及びコンテンツ検索結果提供方法を提供することができる。   According to the present invention, there are provided a content search result providing system and a content search result providing method capable of providing content reflecting the user's preference even when there is no search click history of a user who makes a search request. can do.

本実施形態に係るコンテンツ検索結果提供システムの機能構成を示すブロック図である。It is a block diagram which shows the function structure of the content search result provision system which concerns on this embodiment. 統合サーバ及び検索サーバのハードウェア構成図である。It is a hardware block diagram of an integrated server and a search server. 検索履歴情報記憶部により記憶される情報の内容を示す説明図である。It is explanatory drawing which shows the content of the information memorize | stored by the search history information storage part. クエリカテゴリ辞書に格納される情報の内容を示す説明図である。It is explanatory drawing which shows the content of the information stored in a query category dictionary. ユーザ特徴ベクトル記憶部により記憶される情報の内容を示す説明図である。It is explanatory drawing which shows the content of the information memorize | stored by the user feature vector memory | storage part. 一回目の検索アクションが行われた場合におけるユーザ特徴ベクトル評価値の算出過程を示す表である。It is a table | surface which shows the calculation process of the user feature vector evaluation value when the search action of the 1st time is performed. 二回目の検索アクションが行われた場合におけるユーザ特徴ベクトル評価値の算出過程を示す表である。It is a table | surface which shows the calculation process of the user characteristic vector evaluation value when the search action of the 2nd time is performed. 検索結果コンテンツ取得部からの検索結果コンテンツの一覧情報をユーザ特徴ベクトルに基づき並び替える方法を示す説明図である。It is explanatory drawing which shows the method of rearranging the list information of the search result content from a search result content acquisition part based on a user feature vector. 図1に示されるコンテンツ検索結果提供システムの全体的な動作手順を示すシーケンス図である。It is a sequence diagram which shows the whole operation | movement procedure of the content search result provision system shown by FIG. 図1に示されるコンテンツ検索結果提供システムの全体的な動作手順を示すフロー図である。It is a flowchart which shows the whole operation | movement procedure of the content search result provision system shown by FIG. 図10に示されるS20の詳細な処理方法を示すフロー図である。It is a flowchart which shows the detailed processing method of S20 shown by FIG. 図10に示されるS30の詳細な処理方法を示すフロー図である。It is a flowchart which shows the detailed processing method of S30 shown by FIG. 図12に示されるS32の詳細な処理方法を示すフロー図である。It is a flowchart which shows the detailed processing method of S32 shown by FIG. 図12に示されるS33の詳細な処理方法を示すフロー図である。It is a flowchart which shows the detailed processing method of S33 shown by FIG. 図10に示されるS70の詳細な処理方法を示すフロー図である。It is a flowchart which shows the detailed processing method of S70 shown by FIG.

以下、添付図面を参照して、本発明の実施形態について詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings. In the description of the drawings, the same elements are denoted by the same reference numerals, and redundant description is omitted.

図1は、本実施形態に係るコンテンツ検索結果提供システムの機能構成を示すブロック図である。図1に示されるように、コンテンツ検索結果提供システム200は、統合サーバ(統合エンジン)300と、検索サーバ(検索エンジン)400とを備えている。携帯電話等のユーザ端末100は、ネットワークNを介して統合サーバ300と接続されている。   FIG. 1 is a block diagram showing a functional configuration of a content search result providing system according to the present embodiment. As shown in FIG. 1, the content search result providing system 200 includes an integrated server (integrated engine) 300 and a search server (search engine) 400. A user terminal 100 such as a mobile phone is connected to the integrated server 300 via a network N.

例えば、統合サーバ300は、移動体通信網であるネットワークNを介し、通信事業者により運営されるコンテンツ配信サービスを、ユーザ端末100に対して提供する。コンテンツ配信サービスは、例えば通信事業者のネットワークN上で、ユーザからの要求に応じて様々なコンテンツを配信するサービスである。コンテンツとは、情報の内容又は中身を意味する。コンテンツには、例えば、音楽、動画、電子書籍、ゲーム等のデジタルコンテンツが含まれる。また、コンテンツには、オンラインショッピングサービス等で取り扱われる商品情報等が含まれる。   For example, the integrated server 300 provides the user terminal 100 with a content distribution service operated by a telecommunications carrier via the network N that is a mobile communication network. The content distribution service is a service that distributes various contents in response to a request from a user, for example, on a network N of a telecommunications carrier. Content means the content or contents of information. The content includes digital content such as music, moving images, electronic books, and games. The content includes product information handled by an online shopping service or the like.

コンテンツ配信サービスが配信するコンテンツには、予めコンテンツがどのような情報かを示すメタデータ(属性情報)が対応付けられている。例えば、コンテンツには、通信事業者により、タイトル又はカテゴリ等のメタデータが予め対応付けられている。タイトルとは、コンテンツに与えられる名称である。例えば、コンテンツ配信サービスにおいて配信されるコンテンツが曲である場合にはその曲に対するタイトルとして、その曲名が与えられる。カテゴリとは、コンテンツをその性質に応じて区分するための分類である。例えば、コンテンツ配信サービスにおいて配信されたコンテンツがあるアイドルの曲である場合には、そのコンテンツは音楽という性質を有するので、カテゴリ「音楽」と対応付けられる。また、当該コンテンツは、アイドルの曲という性質も有するので、カテゴリ「アイドル」とも対応付けられる。   The content distributed by the content distribution service is associated with metadata (attribute information) indicating in advance what kind of information the content is. For example, metadata such as a title or category is associated with the content in advance by a communication carrier. The title is a name given to the content. For example, when the content distributed in the content distribution service is a song, the song name is given as the title for the song. A category is a classification for classifying content according to its nature. For example, if the content distributed in the content distribution service is an idle song, the content has the property of music and is associated with the category “music”. Further, since the content also has the property of an idol song, it is also associated with the category “idol”.

なお、コンテンツ配信サービスが配信するコンテンツにカテゴリが予め対応付けられていることにより、コンテンツ配信サービスは、例えばカテゴリ別に整理されたコンテンツを配信可能である。コンテンツには、コンテンツそのものだけでなく、コンテンツのメタデータが含まれてもよい。   Note that, by associating a category with the content distributed by the content distribution service in advance, the content distribution service can distribute, for example, content organized by category. The content may include not only the content itself but also content metadata.

統合サーバ300は、ユーザ端末100から検索クエリを受信して検索要求を受け付ける。検索クエリとは、検索結果として情報を引き出すための検索要求を示す。検索クエリは、例えばユーザ端末100において検索の際に入力される単語又はフレーズ(複合語)である。例えば、ユーザ端末100において表示された上記コンテンツ配信サービス上の検索窓に、ユーザからアーティスト名等の単語が入力されると、この入力された単語(検索クエリ)がコンテンツ配信サービスにおいて検索要求として受け付けられる。これにより、統合サーバ300は、ユーザ端末100からの検索要求を受け付ける。   The integrated server 300 receives a search query from the user terminal 100 and accepts a search request. A search query indicates a search request for extracting information as a search result. The search query is, for example, a word or a phrase (compound word) that is input when searching on the user terminal 100. For example, when a user inputs a word such as an artist name in the search window on the content distribution service displayed on the user terminal 100, the input word (search query) is accepted as a search request in the content distribution service. It is done. Thereby, the integrated server 300 receives a search request from the user terminal 100.

統合サーバ300は、検索クエリに対応するコンテンツの検索結果を検索サーバ400から取得する。検索クエリに対応するコンテンツとは、例えば検索クエリが示す単語又はフレーズに関連するコンテンツ等、検索クエリによる検索要求にヒットする(当てはまる)コンテンツを示す。検索クエリによる検索要求にヒットするコンテンツは、検索サーバ400によって算出されて複数取得される。以下、このように検索クエリによる検索結果として複数取得されるコンテンツを、単に「検索結果コンテンツ」とも称する。統合サーバ300は、検索サーバ400により取得された検索結果コンテンツを示す情報を、検索結果としてユーザ端末100へ出力する。ユーザ端末100は、ディスプレイ等の表示部を備えており、統合サーバ300から出力された検索結果コンテンツを示す情報を、当該表示部で表示する。ユーザ端末100の表示部において、検索結果コンテンツを示す情報は、例えば検索結果コンテンツに含まれる各コンテンツのネットワーク上の場所を示すリンク情報等の、コンテンツを示す情報を含んだ一覧情報である。以下、検索結果コンテンツを示す情報を、単に「検索結果コンテンツの一覧情報」とも称する。   The integration server 300 acquires the search result of the content corresponding to the search query from the search server 400. The content corresponding to the search query indicates content that hits (applies to) a search request by the search query, such as content related to a word or a phrase indicated by the search query. The search server 400 calculates and acquires a plurality of contents that hit the search request based on the search query. Hereinafter, a plurality of contents acquired as search results based on the search query will be simply referred to as “search result contents”. The integrated server 300 outputs information indicating the search result content acquired by the search server 400 to the user terminal 100 as a search result. The user terminal 100 includes a display unit such as a display, and displays information indicating the search result content output from the integrated server 300 on the display unit. In the display unit of the user terminal 100, the information indicating the search result content is list information including information indicating the content such as link information indicating the location of each content included in the search result content on the network. Hereinafter, the information indicating the search result content is also simply referred to as “search result content list information”.

ユーザ端末100において、このような検索結果コンテンツの一覧情報の中から、所望のコンテンツを示す情報がユーザにより選択される。ここで、選択とは、一覧情報の中から一つのコンテンツを示す情報を選ぶことにより、その情報が示すコンテンツを選択することをいう。選択には、閲覧を意味する選択(例えば、コンテンツ詳細情報のリンク選択等)だけでなく、購入を目的とする選択(例えば、コンテンツ購入用のリンク選択等)も含まれる。選択は、例えばクリック操作等によって実現される。以下、本実施形態では、ユーザがクリック操作によってコンテンツを選択した場合を想定して説明する。以下、クリック操作によるコンテンツの選択を、単に「クリック」という。例えば、ユーザ端末100の表示部で表示された検索結果コンテンツの一覧情報のうちのいずれかの情報をユーザがクリックした場合、そのクリックされた情報が示すコンテンツが選択されたことを示す。このようにしてコンテンツが選択されると、選択されたコンテンツを取得するように、ユーザ端末100から統合サーバ300へコンテンツの送信要求が行われる。   In the user terminal 100, information indicating the desired content is selected by the user from such search result content list information. Here, selection refers to selecting the content indicated by the information by selecting information indicating one content from the list information. The selection includes not only selection meaning browsing (for example, link selection of content detailed information) but also selection for purchase (for example, link selection for content purchase). The selection is realized by, for example, a click operation. Hereinafter, in the present embodiment, the case where the user selects content by a click operation will be described. Hereinafter, selection of content by a click operation is simply referred to as “click”. For example, when the user clicks on any of the search result content list information displayed on the display unit of the user terminal 100, it indicates that the content indicated by the clicked information has been selected. When content is selected in this way, a content transmission request is made from the user terminal 100 to the integrated server 300 so as to acquire the selected content.

図2は、統合サーバ300及び検索サーバ400のハードウェア構成図である。図1に示される統合サーバ300及び検索サーバ400は、物理的には、図2に示されるように、1又は複数のCPU11、主記憶装置であるRAM12及びROM13、入力デバイスであるキーボード及びマウス等の入力装置14、ディスプレイ等の出力装置15、ネットワークカード等のデータ送受信デバイスである通信モジュール16、半導体メモリ等の補助記憶装置17などを含むコンピュータシステムとして構成されている。コンテンツ検索結果提供システムが有する各機能は、図2に示されるCPU11、RAM12等のハードウェア上に1又は複数の所定のコンピュータソフトウェアを読み込ませることにより、CPU11の制御のもとで入力装置14、出力装置15、通信モジュール16を動作させるとともに、RAM12や補助記憶装置17におけるデータの読み出し及び書き込みを行うことで実現される。   FIG. 2 is a hardware configuration diagram of the integrated server 300 and the search server 400. As shown in FIG. 2, the integrated server 300 and the search server 400 shown in FIG. 1 physically include one or a plurality of CPUs 11, a RAM 12 and a ROM 13 that are main storage devices, a keyboard and a mouse that are input devices, and the like. The computer system includes an input device 14, an output device 15 such as a display, a communication module 16 that is a data transmission / reception device such as a network card, an auxiliary storage device 17 such as a semiconductor memory, and the like. Each function of the content search result providing system is configured such that one or a plurality of predetermined computer software is read on the hardware such as the CPU 11 and the RAM 12 shown in FIG. This is realized by operating the output device 15 and the communication module 16 and reading and writing data in the RAM 12 and the auxiliary storage device 17.

以下、再び図1を参照し、統合サーバ300の機能構成について説明する。統合サーバ300は、検索履歴取得部301(検索履歴取得手段)、検索履歴情報記憶部302(記憶手段)、クエリカテゴリ辞書303、クエリカテゴリ辞書作成部304(作成手段)、ユーザ特徴ベクトル算出部(ユーザ特徴量算出手段)305、ユーザ特徴ベクトル記憶部306、検索要求受付部307、検索要求送信部308、検索結果コンテンツ取得部309(検索結果取得手段)、順位算出部310(順位算出手段)、及び検索結果コンテンツ出力部311(出力手段)を含んで構成されている。   Hereinafter, the functional configuration of the integrated server 300 will be described with reference to FIG. 1 again. The integrated server 300 includes a search history acquisition unit 301 (search history acquisition unit), a search history information storage unit 302 (storage unit), a query category dictionary 303, a query category dictionary creation unit 304 (creation unit), and a user feature vector calculation unit ( (User feature amount calculation means) 305, user feature vector storage section 306, search request reception section 307, search request transmission section 308, search result content acquisition section 309 (search result acquisition means), rank calculation section 310 (rank calculation means), And the search result content output part 311 (output means) is comprised.

検索履歴取得部301は、検索要求を行ったユーザ端末100のユーザIDと、そのユーザIDのユーザ端末100からの検索クエリと、その検索クエリによるコンテンツの検索結果のうちユーザ端末100において選択されたコンテンツとを取得する。ユーザ端末100のユーザIDとは、ユーザ端末100を識別するための番号又は略称である。ユーザIDは、例えば各ユーザがコンテンツ配信サービスを利用するために必要な情報である。ユーザIDは、ユーザ端末100においてコンテンツ配信サービスを利用する際、ユーザ端末100の表示部において表示されるコンテンツ配信サービスのログイン画面等にユーザにより入力される。ユーザIDが入力されると、このユーザIDはユーザ端末100に記憶される。   The search history acquisition unit 301 is selected in the user terminal 100 among the user ID of the user terminal 100 that has made the search request, the search query from the user terminal 100 of the user ID, and the search result of the content based on the search query. Get content and. The user ID of the user terminal 100 is a number or abbreviation for identifying the user terminal 100. The user ID is information necessary for each user to use the content distribution service, for example. When the user terminal 100 uses the content distribution service, the user ID is input by the user on the login screen of the content distribution service displayed on the display unit of the user terminal 100. When the user ID is input, this user ID is stored in the user terminal 100.

検索クエリは、ユーザ端末100の表示部において表示された上記コンテンツ配信サービス上の検索窓にユーザによって入力される。検索クエリが入力されると、当該検索クエリを示す情報が、上記ユーザIDと対応付けられた状態でユーザ端末100に記憶される。このようにしてユーザ端末100にユーザIDと対応付けられて記憶される過去の検索クエリを示す履歴情報(以下、単に「検索クエリ履歴」とも称する)が、例えば検索クエリを示す情報が記憶(検索クエリ履歴が更新)される度にユーザ端末100から統合サーバ300へ送信される。検索履歴取得部301は、ユーザ端末100から統合サーバ300へ送信された検索クエリ履歴を受信して取得する。   The search query is input by the user in the search window on the content distribution service displayed on the display unit of the user terminal 100. When a search query is input, information indicating the search query is stored in the user terminal 100 in a state associated with the user ID. The history information indicating the past search query (hereinafter also simply referred to as “search query history”) stored in association with the user ID in the user terminal 100 in this manner, for example, information indicating the search query is stored (searched). Each time the query history is updated), it is transmitted from the user terminal 100 to the integrated server 300. The search history acquisition unit 301 receives and acquires the search query history transmitted from the user terminal 100 to the integrated server 300.

なお、本実施形態では、検索クエリがユーザ端末100に記憶される際、当該検索クエリが入力された日時を示す情報が、検索クエリ履歴に対応付けられて記憶される。そして、当該日時を示す情報が、検索クエリ履歴と共に、ユーザ端末100から統合サーバ300へ送信される。検索履歴取得部301は、上述のように検索クエリ履歴を取得する際、検索クエリ履歴と共に、当該日時を示す情報を併せて受信して取得する。なお、ユーザ端末100から統合サーバ300へ検索クエリ履歴及びこれに対応付けられた日時を示す情報が送信されるタイミングは、検索クエリを示す情報が記憶される度でなくてもよく、所定のタイミングで送信されてもよい。   In the present embodiment, when a search query is stored in the user terminal 100, information indicating the date and time when the search query is input is stored in association with the search query history. Then, information indicating the date and time is transmitted from the user terminal 100 to the integrated server 300 together with the search query history. When acquiring the search query history as described above, the search history acquisition unit 301 receives and acquires information indicating the date and time together with the search query history. Note that the timing at which the search query history and the information indicating the date and time associated with the search query history are transmitted from the user terminal 100 to the integrated server 300 may not be the time at which the information indicating the search query is stored. May be transmitted.

また、上記コンテンツ配信サービス上で入力された検索クエリによる検索結果として取得された検索結果コンテンツの一覧情報のうちの一つがユーザによりクリックされると、検索結果コンテンツに含まれるコンテンツのうち当該クリックされたコンテンツを示す情報(例えば、タイトル及びカテゴリ等のメタデータ)が、上記ユーザIDと、その検索結果コンテンツを取得するのに用いた検索クエリと対応付けられた状態で、ユーザ端末100に記憶される。このようにしてユーザ端末100にユーザID及び検索クエリと対応付けられて記憶される、過去のクリックされたコンテンツを示す情報(以下、単に「検索クリック履歴」とも称する)が、例えば当該クリックされたコンテンツを示す情報が記憶(検索クリック履歴が更新)される度にユーザ端末100から統合サーバ300へ送信される。検索履歴取得部301は、ユーザ端末100から統合サーバ300へ送信された検索クリック履歴を受信して取得する。   In addition, when one of the search result content list information acquired as a search result by the search query input on the content distribution service is clicked by the user, the content is included in the search result content. Information indicating the content (for example, metadata such as title and category) is stored in the user terminal 100 in a state in which the user ID is associated with the search query used to acquire the search result content. The Information indicating the past clicked content (hereinafter simply referred to as “search click history”) stored in the user terminal 100 in association with the user ID and the search query in this way is, for example, clicked. Each time information indicating content is stored (search click history is updated), the information is transmitted from the user terminal 100 to the integrated server 300. The search history acquisition unit 301 receives and acquires the search click history transmitted from the user terminal 100 to the integrated server 300.

なお、本実施形態では、クリックされたコンテンツを示す情報がユーザ端末100に記憶される際、当該コンテンツがクリックされた日時を示す情報が、検索クリック履歴に対応付けられて記憶される。そして、当該日時を示す情報が、検索クリック履歴と共に、ユーザ端末100から統合サーバ300へ送信される。検索履歴取得部301は、上述のように検索クリック履歴を取得する際、検索クリック履歴と共に、当該日時を示す情報を併せて受信して取得する。なお、ユーザ端末100から統合サーバ300へ検索クリック履歴及びこれに対応付けられた日時を示す情報が送信されるタイミングは、クリックされたコンテンツを示す情報が記憶される度でなくてもよく、所定のタイミングで送信されてもよい。   In this embodiment, when information indicating the clicked content is stored in the user terminal 100, information indicating the date and time when the content is clicked is stored in association with the search click history. Then, information indicating the date and time is transmitted from the user terminal 100 to the integrated server 300 together with the search click history. When acquiring the search click history as described above, the search history acquisition unit 301 receives and acquires information indicating the date and time together with the search click history. Note that the timing at which the search click history and the information indicating the date and time associated with the search click history are transmitted from the user terminal 100 to the integrated server 300 may not be the time at which the information indicating the clicked content is stored. It may be transmitted at the timing.

以上のようにして、検索履歴取得部301は、複数のユーザID毎に、過去の検索クエリと、過去の検索クエリに対応するコンテンツのうち、ユーザが選択したコンテンツのカテゴリとを関連付けた情報である複数ユーザ履歴(以下、単に「複数ユーザ履歴」とも称する)を取得する。検索履歴取得部301は、取得した複数ユーザ履歴を、検索履歴情報記憶部302に出力する。検索履歴取得部301は、複数ユーザ履歴を取得する度に検索履歴情報記憶部302に出力を行ってもよいし、所定時間毎にその出力を行ってもよい。   As described above, the search history acquisition unit 301 is information that associates the past search query with the category of the content selected by the user among the contents corresponding to the past search query for each of the plurality of user IDs. A certain multiple user history (hereinafter, also simply referred to as “multiple user history”) is acquired. The search history acquisition unit 301 outputs the acquired multiple user history to the search history information storage unit 302. The search history acquisition unit 301 may output to the search history information storage unit 302 every time a plurality of user histories are acquired, or may output it every predetermined time.

検索履歴情報記憶部302は、検索履歴取得部301から出力された複数ユーザ履歴を記憶する。図3は、検索履歴情報記憶部302により記憶される情報の内容を示す説明図である。図3に示されるように、検索履歴情報記憶部302には、複数ユーザ履歴として、ユーザID、検索クエリ、クリックしたコンテンツ、及び日時を示す各情報が互いに対応付けられて格納されている。ユーザIDは、上述したように、ユーザ端末100を識別するための番号又は略称である。図3において、ユーザIDは例えば「User1」で示されている。検索クエリを示す情報とは、上述した検索クエリ履歴である。クリックしたコンテンツを示す情報とは、上述した検索クリック履歴(タイトル及びカテゴリのメタデータ)である。日時を示す情報とは、上述したように、検索クエリ履歴又は検索クリック履歴に対応付けられた日時を示す情報である。図3において、コンテンツの検索結果を示す一覧情報の中からいずれかの情報がクリックされた場合にはその情報をクリックした日時(すなわち、検索クリック履歴に対応付けられた日時)を示す情報が格納され、いずれの情報もクリックされていない場合には検索要求を行った日時(すなわち、検索クエリ履歴に対応付けられた日時)を示す情報が格納される。   The search history information storage unit 302 stores the multiple user history output from the search history acquisition unit 301. FIG. 3 is an explanatory diagram showing the contents of information stored in the search history information storage unit 302. As shown in FIG. 3, the search history information storage unit 302 stores, as a plurality of user histories, information indicating a user ID, a search query, clicked content, and date and time in association with each other. As described above, the user ID is a number or abbreviation for identifying the user terminal 100. In FIG. 3, the user ID is indicated by “User1”, for example. The information indicating the search query is the above-described search query history. The information indicating the clicked content is the search click history (title and category metadata) described above. The information indicating the date and time is information indicating the date and time associated with the search query history or the search click history as described above. In FIG. 3, when any information is clicked from the list information indicating the content search result, information indicating the date and time when the information is clicked (that is, the date and time associated with the search click history) is stored. If no information is clicked, information indicating the date and time when the search request is made (that is, the date and time associated with the search query history) is stored.

例えば、図3では、ユーザID「User1」のユーザ端末100は、検索クエリ「アイドルA」で検索要求を行っており、その検索クエリによる検索結果コンテンツの一覧情報のうち、タイトル「曲K」及びカテゴリ「ミュージック、アイドル」のメタデータで対応付けられたコンテンツを示す情報を、2014年9月15日にクリックしたことが示されている。なお、図3において、アルファベットを用いた文字列によって固有名詞を示している。例えば、検索クエリ「アイドルA」とは、アイドルの固有名詞「A」という検索クエリであることを示している。   For example, in FIG. 3, the user terminal 100 with the user ID “User1” makes a search request with the search query “Idol A”, and among the search result content list information based on the search query, the title “Song K” and It is shown that the information indicating the content associated with the metadata of the category “Music, Idol” was clicked on September 15, 2014. In FIG. 3, proper nouns are indicated by character strings using alphabets. For example, the search query “idol A” indicates that the search query is a proper noun “A” of the idol.

また、例えば、ユーザID「User6」の欄において、検索クエリ「アイドルA」及びこの検索クエリにより2014年9月13日に検索されたという日時のみが格納され、クリックしたコンテンツのメタデータ(タイトル及びカテゴリ)が格納されていない。これは、ユーザID「User6」のユーザ端末100は、検索クエリ「アイドルA」で検索要求を行ったが、その検索クエリによる検索結果コンテンツの一覧情報のうちの何れもクリックしなかったことを示している。すなわち、図3では、ユーザID「User6」のユーザ端末100は、検索クリック履歴を有していないことを示している。   Further, for example, in the column of the user ID “User6”, only the search query “Idle A” and the date and time searched for on September 13, 2014 by this search query are stored, and the metadata (title and title) of the clicked content is stored. Category) is not stored. This indicates that the user terminal 100 with the user ID “User6” made a search request with the search query “Idle A”, but did not click on any of the search result content list information based on the search query. ing. That is, FIG. 3 shows that the user terminal 100 with the user ID “User6” does not have a search click history.

検索履歴情報記憶部302は、検索履歴取得部301によって情報が出力される度にその情報を記憶する。よって、図3に示されるデータベースは、検索履歴取得部301によって情報が出力される度に更新される。よって、図3では、ユーザID「User1」〜「User6」のデータを図示しているが、これは一例に過ぎず、ユーザID「User1」〜「User6」による更なるデータ、又はその他のユーザIDのデータ等を含み得る。   The search history information storage unit 302 stores the information every time the search history acquisition unit 301 outputs information. Therefore, the database shown in FIG. 3 is updated each time information is output by the search history acquisition unit 301. Therefore, FIG. 3 illustrates data of the user IDs “User1” to “User6”, but this is only an example, and further data by the user IDs “User1” to “User6” or other user IDs Data may be included.

クエリカテゴリ辞書303は、所定の検索クエリと、コンテンツのカテゴリ毎の所定の検索クエリに対する対応度合いとを関連付けた情報とが格納されるデータベースである。本実施形態において、クエリカテゴリ辞書303は、後述のクエリカテゴリ辞書作成部304により作成される。   The query category dictionary 303 is a database in which a predetermined search query and information that associates the degree of correspondence with the predetermined search query for each content category are stored. In this embodiment, the query category dictionary 303 is created by a query category dictionary creation unit 304 described later.

図4は、クエリカテゴリ辞書303に格納される情報の内容を示す説明図である。図4の(a)は、クエリカテゴリ辞書303の一例を示している。図4の(a)に示されるクエリカテゴリ辞書303には、所定の検索クエリと、所定の検索クエリに対応する各カテゴリと、所定の検索クエリに対応する各カテゴリの当該検索クエリに対する対応度合いを示す評価値(以下、単に「クエリカテゴリ評価値」と称する)と、が格納されている。   FIG. 4 is an explanatory diagram showing the contents of information stored in the query category dictionary 303. FIG. 4A shows an example of the query category dictionary 303. In the query category dictionary 303 shown in FIG. 4A, a predetermined search query, each category corresponding to the predetermined search query, and the degree of correspondence of each category corresponding to the predetermined search query with respect to the search query. The evaluation value to be shown (hereinafter simply referred to as “query category evaluation value”) is stored.

図4の(a)のクエリカテゴリ辞書303では、検索クエリ「アイドルA」に対応するカテゴリ「アイドル」、「ミュージック」、「動画」、及び「画像」のそれぞれのクエリカテゴリ評価値が「1.0」、「0.50」、「0.25」、及び「0.25」である。すなわち、図4の(a)のクエリカテゴリ辞書303では、検索クエリ「アイドルA」に関し、カテゴリ「アイドル」との対応度合いが最も高く、続いてカテゴリ「ミュージック」、続いてカテゴリ「動画」及びカテゴリ「画像」の順に、その対応度合いが低くなることを示している。   In the query category dictionary 303 of FIG. 4A, the query category evaluation values of the categories “idol”, “music”, “movie”, and “image” corresponding to the search query “idol A” are “1. 0, “0.50”, “0.25”, and “0.25”. That is, in the query category dictionary 303 of FIG. 4A, the search query “idol A” has the highest degree of correspondence with the category “idol”, followed by the category “music”, followed by the category “video” and the category. The order of “image” indicates that the degree of correspondence decreases.

クエリカテゴリ辞書作成部304は、例えば検索履歴情報記憶部302により記憶された複数ユーザ履歴に基づき、上述のクエリカテゴリ辞書303を作成する。クエリカテゴリ辞書作成部304は、複数ユーザ履歴に含まれる全てのデータに基づきクエリカテゴリ辞書303を作成してもよいし、複数ユーザ履歴に含まれるデータのうち例えば予め設定された期間遡ったデータだけに基づきクエリカテゴリ辞書303を作成してもよい。クエリカテゴリ辞書作成部304は、検索履歴情報記憶部302における複数ユーザ履歴を参照し、所定の検索クエリと、その検索クエリに対応する各カテゴリとを抽出する。そしてクエリカテゴリ辞書作成部304は、クエリカテゴリ評価値を、次のように算出する。   The query category dictionary creation unit 304 creates the above-described query category dictionary 303 based on, for example, a plurality of user histories stored by the search history information storage unit 302. The query category dictionary creation unit 304 may create the query category dictionary 303 based on all the data included in the multiple user history, or only data that goes back for a preset period among the data included in the multiple user history, for example. The query category dictionary 303 may be created based on the above. The query category dictionary creation unit 304 refers to a plurality of user histories in the search history information storage unit 302 and extracts a predetermined search query and each category corresponding to the search query. Then, the query category dictionary creation unit 304 calculates a query category evaluation value as follows.

クエリカテゴリ辞書作成部304は、各カテゴリが何回抽出されるかをカウントする。各カテゴリが抽出された回数は、各カテゴリと対応付けられたコンテンツがクリックされた回数(以下、単に「クリック数」と称する)を示す。例えば、クエリカテゴリ辞書作成部304は、図3に示される複数ユーザ履歴を参照し、検索クエリ「アイドルA」と、この検索クエリに対応付けられたカテゴリ「アイドル」、「ミュージック」、「動画」、及び「画像」を抽出する。そしてこれらの各カテゴリのクリック数(各カテゴリと対応付けられたコンテンツがクリックされた回数)をカウントする。   The query category dictionary creation unit 304 counts how many times each category is extracted. The number of times each category has been extracted indicates the number of times the content associated with each category has been clicked (hereinafter simply referred to as “number of clicks”). For example, the query category dictionary creation unit 304 refers to the plurality of user histories shown in FIG. 3 and searches the search query “idol A” and the categories “idol”, “music”, and “video” associated with the search query. , And “image” are extracted. Then, the number of clicks of each category (the number of times the content associated with each category has been clicked) is counted.

図4の(b)は、クエリカテゴリ辞書303の作成過程で算出される各カテゴリのクリック数Xと、そのクリック数Xのうち最大となる数を示す最大クリック数Max(X)とを示している。例えば、図3に示される複数ユーザ履歴には、検索クエリ「アイドルA」に対応するカテゴリ「アイドル」が4つ存在するので、カテゴリ「アイドル」が4回抽出される。よって、カテゴリ「アイドル」のクリック数Xは「4」とカウントされる。同様にして、検索クエリ「アイドルA」に対応するカテゴリ「ミュージック」のクリック数Xは「2」、検索クエリ「アイドルA」に対応するカテゴリ「動画」のクリック数Xは「1」、検索クエリ「アイドルA」に対応するカテゴリ「画像」のクリック数Xは「1」とカウントされる。よって、検索クエリ「アイドルA」に対応する各カテゴリのクリック数Xのうち、最大クリック数Max(X)は、カテゴリ「ミュージック」のクリック数Xである。   FIG. 4B shows the number of clicks X of each category calculated in the process of creating the query category dictionary 303 and the maximum number of clicks Max (X) indicating the maximum number of clicks X. Yes. For example, in the multiple user history shown in FIG. 3, there are four categories “idle” corresponding to the search query “idle A”, so the category “idle” is extracted four times. Therefore, the click number X of the category “idle” is counted as “4”. Similarly, the click number X of the category “music” corresponding to the search query “idol A” is “2”, the click number X of the category “video” corresponding to the search query “idol A” is “1”, and the search query. The number of clicks X of the category “image” corresponding to “idle A” is counted as “1”. Therefore, the maximum click number Max (X) among the click number X of each category corresponding to the search query “idol A” is the click number X of the category “music”.

クエリカテゴリ辞書作成部304は、図4の(b)に示されるような各カテゴリ別にカウントされたクリック数を用いて、次の数式(1)に基づき、各カテゴリのクエリカテゴリ評価値を算出する。当該クエリカテゴリ評価値の算出は、検索クエリに対応する全てのカテゴリについて行う。
Y(i)=X(i)/max(X(j)) ・・・(1)
ただし、1≦j≦n
Y(i):i番目のカテゴリのクエリカテゴリ評価値
X(i):i番目のカテゴリのクリック数
n:カテゴリ種類数
The query category dictionary creation unit 304 uses the number of clicks counted for each category as shown in FIG. 4B to calculate a query category evaluation value for each category based on the following equation (1). . The query category evaluation value is calculated for all categories corresponding to the search query.
Y (i) = X (i) / max (X (j)) (1)
However, 1 ≦ j ≦ n
Y (i): Query category evaluation value of i-th category X (i): Number of clicks of i-th category n: Number of category types

例えば、検索クエリ「アイドルA」に対応する各カテゴリのクエリカテゴリ評価値を算出する場合、クエリカテゴリ辞書303は、図4の(b)に示されるように、検索クエリ「アイドルA」に対応する各カテゴリのうちクリック数が最大となる「ミュージック」のクリック数「4」で、各カテゴリのクリック数をそれぞれ除算することにより、各カテゴリのクエリカテゴリ評価値を算出する。これにより、検索クエリ「アイドルA」に対応する各カテゴリ「アイドル」、「ミュージック」、「動画」、及び「画像」の各クエリカテゴリ評価値は、図4の(a)に示されるように、それぞれ「1.0」、「0.50」、「0.25」、及び「0.25」と算出される。   For example, when the query category evaluation value of each category corresponding to the search query “idol A” is calculated, the query category dictionary 303 corresponds to the search query “idol A” as shown in FIG. The query category evaluation value of each category is calculated by dividing the number of clicks of each category by the number of clicks “4” of “music” having the maximum number of clicks in each category. As a result, the query category evaluation values of the categories “idol”, “music”, “movie”, and “image” corresponding to the search query “idol A” are as shown in FIG. “1.0”, “0.50”, “0.25”, and “0.25” are calculated, respectively.

クエリカテゴリ辞書作成部304は、検索履歴情報記憶部302における複数ユーザ履歴に含まれる検索クエリ毎に、上述の処理を行う(検索クエリを変えて上述の処理を繰り返す)。すなわち、複数ユーザ履歴に含まれる全ての検索クエリについて、その検索クエリに対応付けられた各カテゴリを抽出し、上述の計算方法によって、抽出した各カテゴリのクエリカテゴリ評価値を算出する。なお、クエリカテゴリ辞書作成部304は、複数ユーザ履歴に含まれる全ての検索クエリについてクエリカテゴリ評価値を算出しなくてもよい。例えば、上記コンテンツ配信サービスの利用者であるユーザや当該サービスの提供元である事業者等により、予め統合サーバ300に設定された検索クエリについてのみクエリカテゴリ評価値を算出してもよい。   The query category dictionary creation unit 304 performs the above process for each search query included in the plurality of user histories in the search history information storage unit 302 (repeats the above process by changing the search query). That is, for all search queries included in a plurality of user histories, each category associated with the search query is extracted, and the query category evaluation value of each extracted category is calculated by the above-described calculation method. Note that the query category dictionary creation unit 304 does not have to calculate query category evaluation values for all search queries included in a plurality of user histories. For example, a query category evaluation value may be calculated only for a search query set in advance in the integrated server 300 by a user who is a user of the content distribution service, a business operator who is a provider of the service, or the like.

なお、上記数式(1)の代わりに、例えば以下に示す数式(2)によって各カテゴリの評価値を算出してもよい。
Y(i)={X(i)}/{max(X(j))} ・・・(2)
この数式(2)によれば、数式(1)と比べて、抽出されたカテゴリのクリック数が少ない場合には、そのカテゴリのクエリカテゴリ評価値がより小さな値として算出される。このため、数式(2)を用いる場合、クリック数が少ないカテゴリのクエリカテゴリ評価値の上昇傾向を緩やかにする効果がある。よって、数式(2)は、クリック数が多いカテゴリほど、検索クエリとの対応度合いを強めたい場合に好適である。
Note that the evaluation value of each category may be calculated by, for example, the following formula (2) instead of the above formula (1).
Y (i) = {X (i)} 2 / {max (X (j))} 2 (2)
According to the formula (2), when the number of clicks of the extracted category is small compared to the formula (1), the query category evaluation value of the category is calculated as a smaller value. For this reason, when using formula (2), there is an effect of moderating the upward trend of the query category evaluation value of the category with a small number of clicks. Therefore, the formula (2) is suitable when the category having a larger number of clicks is desired to have a higher degree of correspondence with the search query.

また、上記数式(1)の代わりに、例えば以下に示す数式(3)によってカテゴリ毎のクエリカテゴリ評価値を算出してもよい。
Y(i)={X(i)/max(X(j))}1/2 ・・・(3)
この数式(3)によれば、数式(2)とは逆に、数式(1)と比べて、抽出されたカテゴリのクリック数が少ない場合にも、そのカテゴリのクエリカテゴリ評価値がより大きな値として算出される。このため、クリック数が多い場合のクエリカテゴリ評価値の上昇傾向を緩やかにする効果がある。よって、数式(3)は、クリック数が少ないカテゴリでも、検索クエリとの対応度合いを持たせたい場合に好適である。
Moreover, you may calculate the query category evaluation value for every category instead of the said Numerical formula (1), for example by Numerical formula (3) shown below.
Y (i) = {X (i) / max (X (j))} 1/2 (3)
According to the formula (3), in contrast to the formula (2), the query category evaluation value of the category is larger even when the number of clicks of the extracted category is smaller than the formula (1). Is calculated as This has the effect of moderating the upward trend of the query category evaluation value when the number of clicks is large. Therefore, Equation (3) is suitable when it is desired to provide a degree of correspondence with the search query even in a category with a small number of clicks.

クエリカテゴリ辞書作成部304は、上述のようにして算出したクエリカテゴリ評価値を、検索クエリ及びカテゴリ毎に対応付けてデータベースとして格納する。これにより、クエリカテゴリ辞書303が作成される。   The query category dictionary creation unit 304 stores the query category evaluation value calculated as described above as a database in association with each search query and category. Thereby, the query category dictionary 303 is created.

なお、クエリカテゴリ辞書作成部304は、検索クエリに対応する各カテゴリのクエリカテゴリ評価値の算出を、検索履歴情報記憶部302における複数ユーザ履歴が更新される度に行ってもよく、所定期間毎に行ってもよい。すなわち、クエリカテゴリ辞書作成部304は、複数ユーザ履歴が更新される度にクエリカテゴリ辞書303を更新してもよいし、複数ユーザ履歴の更新とは異なるタイミング等で所定期間毎にクエリカテゴリ辞書303を更新してもよい。   Note that the query category dictionary creation unit 304 may calculate the query category evaluation value of each category corresponding to the search query each time a plurality of user histories in the search history information storage unit 302 is updated. You may go to That is, the query category dictionary creation unit 304 may update the query category dictionary 303 every time the multiple user history is updated, or the query category dictionary 303 every predetermined period at a timing different from the update of the multiple user history. May be updated.

ユーザ特徴ベクトル算出部(算出手段)305は、コンテンツのカテゴリに対するユーザID毎の嗜好性の対応度合いを示すユーザ特徴量を算出する。コンテンツのカテゴリに対するユーザID毎の嗜好性の対応度合いを示すユーザ特徴量とは、どのカテゴリのコンテンツにユーザの興味関心がどれほど向いているかを示す各カテゴリに対する評価値を含むベクトル量として示される情報である。以下、コンテンツのカテゴリに対するユーザID毎の嗜好性の対応度合いを示すユーザ特徴量を、単に「ユーザ特徴ベクトル」と称する。ユーザ特徴ベクトル算出部305は、算出したユーザ特徴ベクトルをユーザ特徴ベクトル記憶部306に出力する。ユーザ特徴ベクトル記憶部306は、出力されたユーザ特徴ベクトルを記憶する。   The user feature vector calculation unit (calculation unit) 305 calculates a user feature amount indicating the degree of correspondence of the preference for each user ID with respect to the content category. The user feature amount indicating the degree of preference correspondence for each user ID with respect to the content category is information indicated as a vector amount including an evaluation value for each category indicating how much content the user is interested in to which category of content. It is. Hereinafter, the user feature quantity indicating the degree of preference for each user ID with respect to the content category is simply referred to as a “user feature vector”. The user feature vector calculation unit 305 outputs the calculated user feature vector to the user feature vector storage unit 306. The user feature vector storage unit 306 stores the output user feature vector.

図5は、ユーザ特徴ベクトル記憶部306により記憶される情報の内容を示す説明図である。図5では、上述のユーザID「UserA」のユーザ特徴ベクトル評価値x’が格納されたデータベースの例を示している。ユーザ特徴ベクトル評価値x’とは、ユーザ特徴ベクトルが示す各カテゴリに対する評価値である。図5のデータベースでは、ユーザID「UserA」に対応付けられた各カテゴリと、各カテゴリに対するユーザ特徴ベクトル評価値x’とが、格納されている。ユーザID「UserA」に対応付けられた各カテゴリとは、ユーザID「UserA」の興味関心が向けられたカテゴリを示している。各カテゴリに対するユーザ特徴ベクトル評価値x’とは、ユーザID「UserA」の興味関心が向けられた各カテゴリに対し、その興味関心の度合いがどれほどかを評価する指標である。   FIG. 5 is an explanatory diagram showing the contents of information stored in the user feature vector storage unit 306. FIG. 5 shows an example of a database in which the user feature vector evaluation value x ′ of the above-described user ID “UserA” is stored. The user feature vector evaluation value x ′ is an evaluation value for each category indicated by the user feature vector. In the database of FIG. 5, each category associated with the user ID “UserA” and a user feature vector evaluation value x ′ for each category are stored. Each category associated with the user ID “UserA” indicates a category to which the interest of the user ID “UserA” is directed. The user feature vector evaluation value x ′ for each category is an index for evaluating the degree of interest of each category to which the interest of the user ID “UserA” is directed.

本実施形態では、ユーザ特徴ベクトル評価値x’の値が大きいほど、各カテゴリに対するユーザの興味関心の度合いが高いことを示している。図5のデータベースでは、ユーザID「UserA」の興味関心が向けられた各カテゴリ「アイドル」、「ミュージック」、「動画」、「画像」、「コミック」、「映画」、及び「アニメ」の各ユーザ特徴ベクトル評価値x’を比較すると、カテゴリ「コミック」のユーザ特徴ベクトル評価値x’が最も大きい。よって、ユーザID「UserA」の興味関心の度合いは、カテゴリ「コミック」に対し最も高いことが示されている。   In the present embodiment, the larger the user feature vector evaluation value x ′, the higher the degree of interest of the user for each category. In the database of FIG. 5, each category “idol”, “music”, “video”, “image”, “comic”, “movie”, and “anime” to which the interest of the user ID “UserA” is directed. When the user feature vector evaluation value x ′ is compared, the user feature vector evaluation value x ′ of the category “comic” is the largest. Therefore, it is indicated that the degree of interest of the user ID “UserA” is the highest for the category “comic”.

ユーザ特徴ベクトル算出部305は、図5に示されるようなユーザ特徴ベクトルを、例えば検索クエリ履歴を用いて算出する。ユーザ特徴ベクトル算出部305は、クエリカテゴリ辞書303から、クエリカテゴリ評価値(コンテンツのカテゴリ毎の過去の検索クエリに対応する対応度合いを関連付けた情報)を抽出し、抽出されたクエリカテゴリ評価値に基づき、ユーザ特徴ベクトルを算出する。以下、より具体的に説明する。   The user feature vector calculation unit 305 calculates a user feature vector as shown in FIG. 5 using, for example, a search query history. The user feature vector calculation unit 305 extracts a query category evaluation value (information associated with a correspondence degree corresponding to a past search query for each content category) from the query category dictionary 303, and uses the extracted query category evaluation value. Based on this, a user feature vector is calculated. More specific description will be given below.

ユーザ特徴ベクトル算出部305は、まず、検索履歴情報記憶部302における複数ユーザ履歴を参照し、ユーザ特徴ベクトルの算出対象であるユーザ端末100の検索クエリ履歴を抽出する。ユーザ特徴ベクトル算出部305は、クエリカテゴリ辞書303から、抽出した検索クエリ履歴が示す過去の検索クエリに対応する各カテゴリのクエリカテゴリ評価値を抽出する。ユーザ特徴ベクトル算出部305は、この抽出されたクエリカテゴリ評価値に基づき、ユーザ特徴ベクトルを算出する。   First, the user feature vector calculation unit 305 refers to a plurality of user histories in the search history information storage unit 302 and extracts a search query history of the user terminal 100 that is a calculation target of the user feature vector. The user feature vector calculation unit 305 extracts a query category evaluation value of each category corresponding to the past search query indicated by the extracted search query history from the query category dictionary 303. The user feature vector calculation unit 305 calculates a user feature vector based on the extracted query category evaluation value.

また、本実施形態において、ユーザ特徴ベクトル算出部305は、検索履歴情報記憶部302における複数ユーザ履歴を参照し、所定のユーザ端末100における検索クリック履歴を抽出する。ユーザ特徴ベクトル算出部305は、ユーザ特徴ベクトルの算出に、この検索クリック履歴を用いてもよい。   In the present embodiment, the user feature vector calculation unit 305 refers to a plurality of user histories in the search history information storage unit 302 and extracts a search click history in a predetermined user terminal 100. The user feature vector calculation unit 305 may use this search click history for calculating the user feature vector.

ユーザ特徴ベクトル算出部305は、検索クエリ履歴及び検索クリック履歴のうち、例えば前回の抽出から今回の抽出までに新たに記憶されたものを、所定期間毎に抽出する。そしてユーザ特徴ベクトル算出部305は、所定期間毎に抽出された検索クエリ履歴及び検索クリック履歴を用いてユーザ特徴ベクトルを算出する。なお、ユーザ特徴ベクトル算出部305は、検索クエリ履歴及び検索クリック履歴が更新される度に、検索クエリ履歴及び検索クリック履歴を抽出してユーザ特徴ベクトルを算出してもよい。   The user feature vector calculation unit 305 extracts, for example, a newly stored search query history and search click history from the previous extraction to the current extraction every predetermined period. Then, the user feature vector calculation unit 305 calculates a user feature vector using the search query history and the search click history extracted every predetermined period. Note that the user feature vector calculation unit 305 may calculate the user feature vector by extracting the search query history and the search click history each time the search query history and the search click history are updated.

ユーザ特徴ベクトル算出部305は、例えば次の数式(4)によって、ユーザ特徴ベクトルが示す各カテゴリに対する評価値(以下、「ユーザ特徴ベクトル評価値」と称する)を算出する。なお、xに係る重み係数α、yに係る重み係数β、及びzに係る重み係数γは、統合サーバ300に予め設定されて記憶されている。これらの係数は、通常、x、y、及びzの何れに重きを置きたいかに応じて種々の値として設定可能である。例えば、これらの係数は、正の値として設定される。
x'=αx+βy+γz ・・・(4)
ただし、y=z=0の場合は、x’=x
x’:新たなユーザ特徴ベクトル評価値
x :既存のユーザ特徴ベクトル評価値
y :検索クエリ履歴に基づくユーザ特徴ベクトル評価値
z :検索クリック履歴に基づくユーザ特徴ベクトル評価値
α :xに係る重み係数
β :yに係る重み係数
γ :zに係る重み係数
The user feature vector calculation unit 305 calculates an evaluation value (hereinafter referred to as “user feature vector evaluation value”) for each category indicated by the user feature vector, for example, using the following mathematical formula (4). Note that the weighting factor α related to x, the weighting factor β related to y, and the weighting factor γ related to z are preset and stored in the integrated server 300. These coefficients can usually be set as various values depending on which of x, y, and z is to be emphasized. For example, these coefficients are set as positive values.
x ′ = αx + βy + γz (4)
However, when y = z = 0, x ′ = x
x ′: New user feature vector evaluation value x: Existing user feature vector evaluation value y: User feature vector evaluation value based on search query history z: User feature vector evaluation value based on search click history α: Weight coefficient related to x β: Weight coefficient related to y γ: Weight coefficient related to z

すなわち、ユーザ特徴ベクトル算出部305は、既存のユーザ特徴ベクトル評価値xと、検索クエリ履歴に基づくユーザ特徴ベクトル評価値yと、検索クリック履歴に基づくユーザ特徴ベクトル評価値zとに基づき、新たなユーザ特徴ベクトル評価値x’を算出する。なお、既存のユーザ特徴ベクトル評価値xとは、今回の新たなユーザ特徴ベクトル評価値x’の算出前に、上記数式(4)により導出され、又は予め設定されることにより、既にユーザID毎に対応付けられたユーザ特徴ベクトル評価値である。   That is, the user feature vector calculation unit 305 creates a new feature based on the existing user feature vector evaluation value x, the user feature vector evaluation value y based on the search query history, and the user feature vector evaluation value z based on the search click history. A user feature vector evaluation value x ′ is calculated. Note that the existing user feature vector evaluation value x is derived by the above formula (4) or set in advance before the calculation of the new user feature vector evaluation value x ′ this time, so that each user ID has already been set. Is a user feature vector evaluation value associated with.

検索クエリ履歴に基づくユーザ特徴ベクトル評価値y(以下、「クエリ評価値y」と称する)とは、コンテンツのカテゴリに対するユーザID毎の嗜好性の対応度合いを、過去の検索クエリとそのカテゴリとの対応度合いに基づき評価する値である。検索クリック履歴に基づくユーザ特徴ベクトル評価値z(以下、「クリック評価値z」と称する)とは、コンテンツのカテゴリに対するユーザID毎の嗜好性の対応度合いを、予めカテゴリが対応付けられたコンテンツを示す情報がクリックされたか否かに基づき評価する値である。   The user feature vector evaluation value y based on the search query history (hereinafter referred to as “query evaluation value y”) is the degree of correspondence of the preference for each user ID with respect to the content category, and the past search query and its category. This value is evaluated based on the degree of correspondence. The user feature vector evaluation value z (hereinafter referred to as “click evaluation value z”) based on the search click history is the degree of correspondence of the preference for each user ID with respect to the content category, and the content with which the category is previously associated. It is a value to be evaluated based on whether or not the indicated information is clicked.

クエリ評価値yは、例えばユーザID毎の過去の検索クエリに関し、この検索クエリに対応付けられたカテゴリ毎の各クエリカテゴリ評価値を、クエリカテゴリ辞書303から抽出することによって算出される。クリック評価値zは、ユーザID毎の検索クリック履歴に基づき、検索結果のうちクリックされたコンテンツに対応付けられたカテゴリを抽出することによって算出される。なお、これらクエリ評価値y及びクリック評価値zの詳細な算出方法は、図6及び図7を参照し、より具体的な例を用いて後述する。   The query evaluation value y is calculated, for example, by extracting each query category evaluation value for each category associated with the search query from the query category dictionary 303 for a past search query for each user ID. The click evaluation value z is calculated by extracting a category associated with the clicked content from the search results based on the search click history for each user ID. A detailed method for calculating the query evaluation value y and the click evaluation value z will be described later with reference to FIGS. 6 and 7 and more specific examples.

クエリ評価値yと、クリック評価値zとは、上記数式(4)においてそれぞれ独立した加算項で示されているように、互いに依存することなく算出される。クエリ評価値y及びクリック評価値zのうち、少なくともクエリ評価値yが算出されていればよく、クリック評価値zは算出されなくてもよい。すなわち、新たなユーザ特徴ベクトル評価値x’は、クリック評価値zを用いなくても算出することができる。このため、例えば図3に示されるユーザID「User6」のように検索クリック履歴を有していないユーザに対しても、新たなユーザ特徴ベクトル評価値x’を算出することができる。   The query evaluation value y and the click evaluation value z are calculated without depending on each other, as indicated by the independent addition terms in the equation (4). Of the query evaluation value y and the click evaluation value z, it is sufficient that at least the query evaluation value y is calculated, and the click evaluation value z does not have to be calculated. That is, the new user feature vector evaluation value x ′ can be calculated without using the click evaluation value z. Therefore, for example, a new user feature vector evaluation value x ′ can be calculated even for a user who does not have a search click history, such as the user ID “User6” shown in FIG. 3.

また、ユーザ特徴ベクトル算出部305は、新たなユーザ特徴ベクトル評価値x’を算出する際、上記数式(4)により算出された新たなユーザ特徴ベクトル評価値x’のうち、いずれかのカテゴリに対する評価値が所定の閾値(本実施形態では、「1.0」)を超えていた場合には、正規化を行う。すなわち、その所定の閾値を超えていた評価値のうち最大値で、上記数式(4)により算出された各カテゴリに対するユーザ特徴ベクトル評価値x’をそれぞれ除算することで正規化を行い、その結果を新たなユーザ特徴ベクトル評価値x’とする。   In addition, when calculating a new user feature vector evaluation value x ′, the user feature vector calculation unit 305 corresponds to one of the categories of the new user feature vector evaluation value x ′ calculated by Equation (4). When the evaluation value exceeds a predetermined threshold value (“1.0” in the present embodiment), normalization is performed. That is, normalization is performed by dividing the user feature vector evaluation value x ′ for each category calculated by the above equation (4) by the maximum value among the evaluation values exceeding the predetermined threshold, and the result Is a new user feature vector evaluation value x ′.

以下、図6及び図7を参照して、ユーザ特徴ベクトル算出部305による上記数式(4)を用いたユーザ特徴ベクトル評価値x’の算出過程の一例について、詳細に説明する。   Hereinafter, an example of a calculation process of the user feature vector evaluation value x ′ using the above equation (4) by the user feature vector calculation unit 305 will be described in detail with reference to FIGS. 6 and 7.

一例として、ユーザID「UserA」のユーザ端末100において、二回の検索アクションが行われた場合を想定して説明する。一回目の検索アクションは、検索クエリ「アイドルA」により検索要求が行われ、その検索クエリによる検索結果コンテンツの一覧情報のうち、メタデータとしてタイトル「曲K」、カテゴリ「ミュージック」、「アイドル」が予め対応付けられたコンテンツを示す情報がクリックされている。二回目の検索アクションは、検索クエリ「コミックS」により検索要求が行われ、その検索クエリによる検索結果コンテンツの一覧情報のうち、メタデータとしてタイトル「コミックS コミックモノクロ版」、及びカテゴリ「コミック」が対応付けられたコンテンツを示す情報がクリックされている。   As an example, the case where two search actions are performed in the user terminal 100 with the user ID “UserA” will be described. In the first search action, a search request is made by the search query “Idol A”, and the title “Song K”, the category “Music”, and “Idle” are included as metadata in the list information of the search result contents by the search query. Is clicked on information indicating a content that is previously associated. In the second search action, a search request is made by the search query “Comic S”, and the title “Comic S Comic Monochrome” and the category “Comic” are included as metadata in the list information of the search result contents by the search query. The information indicating the content associated with is clicked.

ここで、以下のユーザ特徴ベクトル評価値x’の算出においては、クエリカテゴリ辞書303として図4に示すデータベースを用いる。また、上記数式(4)において、α=1.0、β=0.5、γ=0.7とする。また、一回目の検索アクションが「UserA」による初めての検索アクションであり、ユーザID「UserA」は既存のユーザ特徴ベクトル評価値xを予め有していないものとする。   Here, in the calculation of the following user feature vector evaluation value x ′, the database shown in FIG. 4 is used as the query category dictionary 303. In the above mathematical formula (4), α = 1.0, β = 0.5, and γ = 0.7. Further, it is assumed that the first search action is the first search action by “UserA”, and the user ID “UserA” does not have an existing user feature vector evaluation value x in advance.

まず、一回目の検索アクションが行われた場合におけるユーザ特徴ベクトル評価値x’の算出方法を説明する。図6は、一回目の検索アクションが行われた場合におけるユーザ特徴ベクトル評価値x’の算出過程を示す表である。図6では、検索クエリ「アイドルA」に対応付けられた各カテゴリと、各カテゴリについての既存のユーザ特徴ベクトル評価値x、クエリ履歴によるユーザ特徴ベクトル加算部であるクエリ評価値y、クリック履歴によるユーザ特徴ベクトル加算部であるクリック評価値z、及び一回目の検索アクションを反映した新たなユーザ特徴ベクトル評価値x’が格納されている。   First, a method for calculating the user feature vector evaluation value x ′ when the first search action is performed will be described. FIG. 6 is a table showing the calculation process of the user feature vector evaluation value x ′ when the first search action is performed. In FIG. 6, each category associated with the search query “idol A”, an existing user feature vector evaluation value x for each category, a query evaluation value y that is a user feature vector addition unit based on a query history, and a click history A click evaluation value z, which is a user feature vector addition unit, and a new user feature vector evaluation value x ′ reflecting the first search action are stored.

上述の通り、一回目の検索アクションがユーザID「UserA」による初めての検索アクションであり、ユーザID「UserA」は既存のユーザ特徴ベクトル評価値xを有していないため、図6に示される既存のユーザ特徴ベクトル評価値xはいずれのカテゴリについても初期値「0」である。図6に示されるクエリ評価値y及びクリック評価値zは、ユーザ特徴ベクトル算出部305によってそれぞれ次のように算出される。   As described above, the first search action is the first search action by the user ID “UserA”, and the user ID “UserA” does not have the existing user feature vector evaluation value x. The user feature vector evaluation value x is an initial value “0” for any category. The query evaluation value y and the click evaluation value z shown in FIG. 6 are calculated by the user feature vector calculation unit 305 as follows.

一回目の検索アクションが行われた場合におけるユーザID「UserA」のクエリ評価値yの算出方法を説明する。まず、ユーザ特徴ベクトル算出部305は、ユーザID「UserA」の過去の検索クエリ「アイドルA」に関し、クエリカテゴリ辞書303を参照して、この検索クエリ「アイドルA」に対応付けられたカテゴリ(「アイドル」、「ミュージック」、「動画」、及び「画像」)毎の各クエリカテゴリ評価値を抽出する。ユーザ特徴ベクトル算出部305は、抽出した各クエリカテゴリ評価値を、クエリ評価値yとして設定する。ユーザ特徴ベクトル算出部305は、検索クエリ「アイドルA」に対応付けられていないその他のカテゴリについては、値「0」を、クエリ評価値yとして設定する。このようにして、一回目の検索アクションが反映された、ユーザID「UserA」の各カテゴリに対するクエリ評価値yが算出される。   A method of calculating the query evaluation value y of the user ID “UserA” when the first search action is performed will be described. First, the user feature vector calculation unit 305 refers to the query category dictionary 303 regarding the past search query “idol A” of the user ID “UserA” and associates the category (“ Each query category evaluation value is extracted for each of “Idle”, “Music”, “Movie”, and “Image”). The user feature vector calculation unit 305 sets each extracted query category evaluation value as a query evaluation value y. The user feature vector calculation unit 305 sets the value “0” as the query evaluation value y for other categories not associated with the search query “idol A”. In this way, the query evaluation value y for each category of the user ID “UserA” reflecting the first search action is calculated.

一回目の検索アクションが行われた場合におけるユーザID「UserA」のクリック評価値zの算出方法を説明する。まず、ユーザ特徴ベクトル算出部305は、ユーザID「UserA」の検索クリック履歴に基づき、検索結果コンテンツの一覧情報のうちユーザによりクリックされた情報が示すコンテンツに対応付けられたカテゴリを抽出する。例えば、一回目の検索アクションにおいてクリックされたコンテンツには、カテゴリ「ミュージック」及びカテゴリ「アイドル」が予め対応付けられているため、これらのカテゴリを抽出する。ユーザ特徴ベクトル算出部305は、抽出されたカテゴリのそれぞれについて、予め統合サーバ300に記憶された所定の定数(本実施形態では、「1.0」)を、カテゴリ毎のクリック評価値zとして設定する。ユーザ特徴ベクトル算出部305は、抽出されたカテゴリ以外のその他のカテゴリについては、値「0」を、カテゴリ毎のクリック評価値zとして設定する。このようにして、一回目の検索アクションが反映された、ユーザID「UserA」の各カテゴリに対するクリック評価値zが算出される。   A method of calculating the click evaluation value z of the user ID “UserA” when the first search action is performed will be described. First, the user feature vector calculation unit 305 extracts a category associated with the content indicated by the information clicked by the user from the list information of the search result content based on the search click history of the user ID “UserA”. For example, since the category “music” and the category “idol” are associated in advance with the content clicked in the first search action, these categories are extracted. For each of the extracted categories, the user feature vector calculation unit 305 sets a predetermined constant (“1.0” in this embodiment) stored in advance in the integrated server 300 as the click evaluation value z for each category. To do. The user feature vector calculation unit 305 sets the value “0” as the click evaluation value z for each category for other categories other than the extracted category. In this way, the click evaluation value z for each category of the user ID “UserA” reflecting the first search action is calculated.

このようにして算出されたクエリ評価値y及びクリック評価値zに基づき、ユーザ特徴ベクトル算出部305は、上記数式(4)に従い新たなユーザ特徴ベクトル評価値x’を算出する。すなわち、各カテゴリについて、以下のような計算を行う。ただし、以下の「x’(カテゴリ)」は、そのカテゴリに関する新たなユーザ特徴ベクトル評価値を示す。なお、本説明の計算過程においては小数点以下4桁目を四捨五入するが、有効桁数は本実施形態に係るシステムにおいて任意に決定してよい。
x’(アイドル)=(1.0×1.0)+(0.5×1.0)+(0.7×1.0)=1.20
x’(ミュージック)=(1.0×0.0)+(0.5×0.5)+(0.7×1.0)=0.95
x’(動画)=(1.0×0.0)+(0.5×0.25)+(0.7×0.0)=0.125
x’(画像)=(1.0×0.0)+(0.5×0.25)+(0.7×0.0)=0.125
Based on the query evaluation value y and the click evaluation value z calculated in this way, the user feature vector calculation unit 305 calculates a new user feature vector evaluation value x ′ according to Equation (4). That is, the following calculation is performed for each category. However, “x ′ (category)” below indicates a new user feature vector evaluation value for the category. In the calculation process of this description, the fourth digit after the decimal point is rounded off, but the number of significant digits may be arbitrarily determined in the system according to the present embodiment.
x ′ (idle) = (1.0 × 1.0) + (0.5 × 1.0) + (0.7 × 1.0) = 1.20
x ′ (music) = (1.0 × 0.0) + (0.5 × 0.5) + (0.7 × 1.0) = 0.95
x ′ (video) = (1.0 × 0.0) + (0.5 × 0.25) + (0.7 × 0.0) = 0.125
x ′ (image) = (1.0 × 0.0) + (0.5 × 0.25) + (0.7 × 0.0) = 0.125

上記の場合、カテゴリ「アイドル」のユーザ特徴ベクトル評価値x’が所定の閾値である「1.0」を超えている。よって、ユーザ特徴ベクトル算出部305は、このユーザ特徴ベクトル評価値x’で、上記数式(4)により算出された各カテゴリに対するユーザ特徴ベクトル評価値x’をそれぞれ除算することで正規化を行い、その結果を新たなユーザ特徴ベクトル評価値x’とする。これにより、新たなユーザ特徴ベクトル評価値x’が次のように算出される。
x’(アイドル)=1.0
x’(ミュージック)=0.792
x’(動画)=0.104
x'(画像)=0.104
In the above case, the user feature vector evaluation value x ′ of the category “idle” exceeds the predetermined threshold “1.0”. Therefore, the user feature vector calculation unit 305 performs normalization by dividing the user feature vector evaluation value x ′ for each category calculated by the above equation (4) by the user feature vector evaluation value x ′. The result is set as a new user feature vector evaluation value x ′. Thereby, a new user feature vector evaluation value x ′ is calculated as follows.
x '(idol) = 1.0
x '(music) = 0.792
x '(video) = 0.104
x ′ (image) = 0.104

続いて、二回目の検索アクションが行われた場合におけるユーザ特徴ベクトルの算出方法を説明する。図7は、二回目の検索アクションが行われた場合におけるユーザ特徴ベクトル評価値x’の算出過程を示す表である。図7では、検索クエリ「コミックS」に対応付けられた各カテゴリと、各カテゴリについての既存のユーザ特徴ベクトル評価値x、クエリ評価値y、クリック評価値z、及び新たなユーザ特徴ベクトル評価値x’が格納されている。   Next, a user feature vector calculation method when the second search action is performed will be described. FIG. 7 is a table showing a calculation process of the user feature vector evaluation value x ′ when the second search action is performed. In FIG. 7, each category associated with the search query “comic S”, an existing user feature vector evaluation value x, a query evaluation value y, a click evaluation value z, and a new user feature vector evaluation value for each category. x ′ is stored.

二回目の検索アクションなので、ユーザID「UserA」は一回目の検索アクションによる既存のユーザ特徴ベクトル評価値xを有している。すなわち、図7に示される既存のユーザ特徴ベクトル評価値xは、図6に示されるユーザ特徴ベクトル評価値x’である。上述の一回目の検索アクションと同様、図6に示されるクエリ評価値y及びクリック評価値zは、ユーザ特徴ベクトル算出部305によってそれぞれ次のように算出される。   Since this is the second search action, the user ID “UserA” has the existing user feature vector evaluation value x obtained by the first search action. That is, the existing user feature vector evaluation value x shown in FIG. 7 is the user feature vector evaluation value x ′ shown in FIG. 6. Similar to the first search action described above, the query evaluation value y and the click evaluation value z shown in FIG. 6 are calculated by the user feature vector calculation unit 305 as follows.

二回目の検索アクションが行われた場合におけるユーザID「UserA」のクエリ評価値yの算出方法を説明する。まず、ユーザ特徴ベクトル算出部305は、ユーザID「UserA」の過去の検索クエリ「コミックS」に関し、クエリカテゴリ辞書303を参照して、この検索クエリ「コミックS」に対応付けられたカテゴリ(「コミック」、「動画」、「映画」、及び「アニメ」)毎の各クエリカテゴリ評価値を抽出する。一回目の検索アクションが行われた場合と同様、ユーザ特徴ベクトル算出部305は、これらのカテゴリのクエリ評価値yとして、抽出された各クエリカテゴリ評価値を設定し、その他のカテゴリのクエリ評価値yとして、値「0」を設定する。このようにして、二回目の検索アクションが反映された、ユーザID「UserA」の各カテゴリに対するクエリ評価値yが算出される。   A method of calculating the query evaluation value y of the user ID “UserA” when the second search action is performed will be described. First, the user feature vector calculation unit 305 refers to the query category dictionary 303 regarding the past search query “comic S” of the user ID “UserA”, and associates the category (“ Each query category evaluation value is extracted for each of “comic”, “moving image”, “movie”, and “animation”. As in the case where the first search action is performed, the user feature vector calculation unit 305 sets each extracted query category evaluation value as the query evaluation value y of these categories, and the query evaluation values of other categories. The value “0” is set as y. In this way, the query evaluation value y for each category of the user ID “UserA” reflecting the second search action is calculated.

二回目の検索アクションが行われた場合におけるユーザID「UserA」のクリック評価値zの算出方法を説明する。まず、ユーザ特徴ベクトル算出部305は、ユーザID「UserA」の検索クリック履歴に基づき、検索結果コンテンツの一覧情報のうちユーザによりクリックされた情報が示すコンテンツに対応付けられたカテゴリを抽出する。例えば、二回目の検索アクションにおいてクリックされたコンテンツには、カテゴリ「コミック」が予め対応付けられているため、このカテゴリを抽出する。一回目の検索アクションが行われた場合と同様、ユーザ特徴ベクトル算出部305は、この抽出されたカテゴリのクリック評価値zとして、所定の定数「1.0」を設定し、その他のカテゴリのクリック評価値zとして、値「0」を設定する。このようにして、二回目の検索アクションが反映された、ユーザID「UserA」の各カテゴリに対するクリック評価値zが算出される。   A method of calculating the click evaluation value z of the user ID “UserA” when the second search action is performed will be described. First, the user feature vector calculation unit 305 extracts a category associated with the content indicated by the information clicked by the user from the list information of the search result content based on the search click history of the user ID “UserA”. For example, since the category “comic” is associated in advance with the content clicked in the second search action, this category is extracted. As in the case where the first search action is performed, the user feature vector calculation unit 305 sets a predetermined constant “1.0” as the click evaluation value z of the extracted category, and clicks on other categories A value “0” is set as the evaluation value z. In this way, the click evaluation value z for each category of the user ID “UserA” reflecting the second search action is calculated.

一回目の検索アクションの場合と同様、ユーザ特徴ベクトル算出部305は、各カテゴリについて、上記数式(4)に従い新たなユーザ特徴ベクトル評価値x’を算出する。すなわち、各カテゴリについて、以下のような計算を行う。
x’(アイドル)=(1.0×1.0)+(0.5×0.0)+(0.7×0.0)=1.0
x’(ミュージック)=(1.0×0.792)+(0.5×0.0)+(0.7×0.0)=0.792
x’(動画)=(1.0×0.104)+(0.5×0.75)+(0.7×0.0)=0.479
x’(画像)=(1.0×0.104)+(0.5×0.0)+(0.7×0.0)=0.104
x’(コミック)=(1.0×0.0)+(0.5×1.0)+(0.7×1.0)=1.2
x’(映画)=(1.0×0.0)+(0.5×0.5)+(0.7×0.0)=0.25
x’(アニメ)=(1.0×0.0)+(0.5×0.25)+(0.7×0.0)=0.125
As in the case of the first search action, the user feature vector calculation unit 305 calculates a new user feature vector evaluation value x ′ for each category according to the equation (4). That is, the following calculation is performed for each category.
x ′ (idle) = (1.0 × 1.0) + (0.5 × 0.0) + (0.7 × 0.0) = 1.0
x '(music) = (1.0 x 0.792) + (0.5 x 0.0) + (0.7 x 0.0) = 0.792
x ′ (video) = (1.0 × 0.104) + (0.5 × 0.75) + (0.7 × 0.0) = 0.479
x ′ (image) = (1.0 × 0.104) + (0.5 × 0.0) + (0.7 × 0.0) = 0.104
x '(comic) = (1.0 x 0.0) + (0.5 x 1.0) + (0.7 x 1.0) = 1.2
x ′ (movie) = (1.0 × 0.0) + (0.5 × 0.5) + (0.7 × 0.0) = 0.25
x '(animation) = (1.0 x 0.0) + (0.5 x 0.25) + (0.7 x 0.0) = 0.125

上記の場合、カテゴリ「コミック」及び「アイドル」のユーザ特徴ベクトル評価値x’(コミック)が所定の閾値である「1.0」を超えており、その中でもカテゴリ「コミック」のユーザ特徴ベクトル評価値x’が最大値となっている。よって、ユーザ特徴ベクトル算出部305は、このカテゴリ「コミック」のユーザ特徴ベクトル評価値x’の値で、上記数式(4)により算出された各カテゴリに対するユーザ特徴ベクトル評価値x’をそれぞれ除算することで正規化を行い、その結果を新たなユーザ特徴ベクトル評価値x’とする。これにより、新たなユーザ特徴ベクトル評価値x’が次のように算出される。
x’(アイドル)=0.833
x’(ミュージック)=0.66
x’(動画)=0.399
x'(画像)=0.087
x’(コミック)=1.0
x’(映画)=0.208
x’(アニメ)=0.104
In the above case, the user feature vector evaluation value x ′ (comic) of the categories “comic” and “idol” exceeds a predetermined threshold “1.0”, and among them, the user feature vector evaluation of the category “comic” The value x ′ is the maximum value. Therefore, the user feature vector calculation unit 305 divides the user feature vector evaluation value x ′ for each category calculated by the above equation (4) by the value of the user feature vector evaluation value x ′ of the category “comic”. Then, normalization is performed, and the result is set as a new user feature vector evaluation value x ′. Thereby, a new user feature vector evaluation value x ′ is calculated as follows.
x '(idol) = 0.833
x '(music) = 0.66
x '(video) = 0.399
x '(image) = 0.087
x '(comic) = 1.0
x '(movie) = 0.208
x '(animation) = 0.104

なお、上述の例では、ユーザ特徴ベクトル算出部305は、所定時間毎に抽出された履歴情報が一つであった場合(前回の抽出から今回の抽出までに新たに記憶された検索クエリ及びクリックされたコンテンツが一つであった場合)の例を説明したが、これに限られない。すなわち、所定時間毎に抽出される履歴情報が複数であってもよく(前回の抽出から今回の抽出までに新たに記憶された検索クエリ及びクリックされたコンテンツが複数であってもよく)、この場合には複数の履歴情報に基づきユーザ特徴ベクトル評価値x’が算出される。なお、複数の履歴情報に基づきユーザ特徴ベクトル評価値x’を算出する場合のクエリ評価値y及びクリック評価値zの算出方法の詳細については、図13及び図14のフローチャートを参照して後述する。ユーザ特徴ベクトル算出部305は、上述のようにして算出したユーザID毎のユーザ特徴ベクトル評価値x’を、ユーザ特徴ベクトル記憶部306に出力する。   In the above example, the user feature vector calculation unit 305, when there is one history information extracted every predetermined time (search query and click newly stored from the previous extraction to the current extraction) However, the present invention is not limited to this. That is, there may be a plurality of pieces of history information extracted every predetermined time (a plurality of search queries and clicked contents newly stored from the previous extraction to the current extraction). In this case, the user feature vector evaluation value x ′ is calculated based on a plurality of history information. Note that details of the calculation method of the query evaluation value y and the click evaluation value z when the user feature vector evaluation value x ′ is calculated based on a plurality of history information will be described later with reference to the flowcharts of FIGS. 13 and 14. . The user feature vector calculation unit 305 outputs the user feature vector evaluation value x ′ for each user ID calculated as described above to the user feature vector storage unit 306.

なお、上記数式(4)において、クエリ評価値yとクリック評価値zとの和として、s=y+zを定義し、以下の数式(5)によって新たなユーザ特徴ベクトル評価値x’を計算してもよい。
x'=x(1+s)・・・・(5)(ただし、x=0の場合は、xを所定の定数として、x’=x(1+s)
この数式(5)を用いる方法では、クエリ評価値yとクリック評価値zとの和を既存のユーザ特徴ベクトル評価値xに乗算するので、新たなユーザ特徴ベクトル評価値x’が変動し易く、最新の検索クエリ履歴及び検索クリック履歴を優先的に影響させたい場合に好適である。なお、x=0の場合とは、すなわちそのカテゴリに関するユーザ特徴ベクトルが存在しない場合である。この場合における所定の定数xとしては、例えば他のカテゴリに関するユーザ特徴ベクトルに基づき算出された値を用いてもよい。具体的には、他のカテゴリについて算出された各ユーザ特徴ベクトル評価値xの平均値又は中央値等を所定の定数xとしてもよい。また、他のカテゴリについて算出されたユーザ特徴ベクトル評価値xが全く存在しない場合、すなわち既存のユーザ特徴ベクトルがない場合には、初期値として0.5を所定の定数xとしてもよい。
In the above equation (4), s = y + z is defined as the sum of the query evaluation value y and the click evaluation value z, and a new user feature vector evaluation value x ′ is calculated by the following equation (5). Also good.
x '= x (1 + s ) ···· (5) ( However, in the case of x = 0, the x 0 as a predetermined constant, x' = x 0 (1 + s)
In the method using Equation (5), the sum of the query evaluation value y and the click evaluation value z is multiplied by the existing user feature vector evaluation value x, so that the new user feature vector evaluation value x ′ is likely to fluctuate. This is suitable when the latest search query history and search click history are to be preferentially affected. The case where x = 0 is a case where there is no user feature vector related to the category. As the predetermined constant x 0 in this case, for example, a value calculated based on a user feature vector related to another category may be used. Specifically, it may be a predetermined constant x 0 the mean or median value or the like of each user feature vector evaluation value x calculated for other categories. Also, if another user characteristic vector evaluation value x calculated for the category is not present at all, that is, when there is no existing user characteristic vector may be 0.5 as an initial value as a predetermined constant x 0.

検索要求受付部307は、ユーザ端末100から、ユーザID及び検索クエリを取得すると共にコンテンツの検索要求を受け付ける。具体的には、検索クエリが、ユーザ端末100の表示部において表示されたログイン画面にユーザIDがユーザによって入力されると、当該ユーザIDを示す情報が、ユーザ端末100から統合サーバ300へ送信される。検索要求受付部307は、ユーザ端末100から統合サーバ300へ送信されたユーザIDを受信して取得する。また、上記コンテンツ配信サービス上の検索窓にユーザによって入力されると、当該検索クエリを示す情報が、ユーザ端末100から統合サーバ300へ送信される。検索要求受付部307は、ユーザ端末100から統合サーバ300へ送信された検索クエリを示す情報を受信して取得する。   The search request receiving unit 307 acquires a user ID and a search query from the user terminal 100 and receives a content search request. Specifically, when the user ID is input by the user on the login screen displayed on the display unit of the user terminal 100 as a search query, information indicating the user ID is transmitted from the user terminal 100 to the integration server 300. The The search request receiving unit 307 receives and acquires the user ID transmitted from the user terminal 100 to the integrated server 300. Further, when the user inputs the search window on the content distribution service, information indicating the search query is transmitted from the user terminal 100 to the integrated server 300. The search request receiving unit 307 receives and acquires information indicating a search query transmitted from the user terminal 100 to the integrated server 300.

検索要求受付部307は、取得した検索クエリを示す情報を検索要求送信部308へ出力する。検索要求送信部308は、検索要求受付部307から出力された検索クエリを示す情報を検索サーバ400へ送信する。   The search request reception unit 307 outputs information indicating the acquired search query to the search request transmission unit 308. The search request transmission unit 308 transmits information indicating the search query output from the search request reception unit 307 to the search server 400.

検索結果コンテンツ取得部309は、検索要求送信部308からの検索クエリに対応する検索結果コンテンツを検索サーバ400から受信して取得する。検索結果コンテンツに含まれるコンテンツには、コンテンツのメタデータ(タイトル及びカテゴリ)が予め対応付けられている(図8の(a)参照)。検索結果コンテンツ取得部309は、取得した検索結果コンテンツを検索結果コンテンツ出力部311へ出力する。   The search result content acquisition unit 309 receives and acquires the search result content corresponding to the search query from the search request transmission unit 308 from the search server 400. Content metadata (title and category) is associated in advance with the content included in the search result content (see FIG. 8A). The search result content acquisition unit 309 outputs the acquired search result content to the search result content output unit 311.

順位算出部310は、ユーザ特徴ベクトル算出部305により算出されたユーザ特徴ベクトルに基づき、検索結果コンテンツの一覧情報を並び替えるための順序を決定する。順位算出部310は、ユーザ特徴ベクトル記憶部306に記憶されたデータベースを参照し、算出対象のユーザについてカテゴリ毎のユーザ特徴ベクトル評価値x’を抽出し、当該ユーザ特徴ベクトル評価値x’に基づき、検索結果コンテンツの一覧情報を並び替えるための順序を決定する。以下、この順序により並べられた各コンテンツの順位を単に「コンテンツ順位」とも称する。順位算出部310は、例えば、ユーザ特徴ベクトル評価値x’が大きいカテゴリほど高くなるように、そのユーザ特徴ベクトルが対応付けられた該当ユーザIDに対するカテゴリの順序(以下、「カテゴリの優先度」とも称する。)を決定する(図8の(b)、図15のS71参照)。順位算出部310は、このカテゴリの優先度に基づき、コンテンツ順位を決定する(図8の(c),(d)、図15のS72参照)。順位算出部310は、決定されたコンテンツ順位を示す情報を、検索結果コンテンツ出力部311へ出力する。   The rank calculation unit 310 determines an order for rearranging the list information of the search result content based on the user feature vector calculated by the user feature vector calculation unit 305. The rank calculation unit 310 refers to the database stored in the user feature vector storage unit 306, extracts the user feature vector evaluation value x ′ for each category for the calculation target user, and based on the user feature vector evaluation value x ′. The order for rearranging the list information of the search result contents is determined. Hereinafter, the ranking of the contents arranged in this order is also simply referred to as “content ranking”. For example, the rank calculation unit 310 sets the category order for the corresponding user ID associated with the user feature vector so that the category with the larger user feature vector evaluation value x ′ is higher (hereinafter referred to as “category priority”). (Refer to S71 of FIG. 8B and FIG. 15). The rank calculation unit 310 determines the content rank based on the priority of the category (see (c) and (d) of FIG. 8 and S72 of FIG. 15). The rank calculation unit 310 outputs information indicating the determined content rank to the search result content output unit 311.

検索結果コンテンツ出力部311は、ユーザ特徴ベクトル算出部305により算出されたユーザ特徴ベクトルに基づいて、検索結果コンテンツ取得部309から出力された検索結果コンテンツの一覧情報をユーザ端末100へ出力する。検索結果コンテンツ出力部311は、例えば、順位算出部310により出力されたコンテンツ順位を示す情報に基づき、検索結果コンテンツ取得部309から出力された検索結果コンテンツの一覧情報を並び替える。すなわち、検索結果コンテンツ出力部311は、検索結果コンテンツに含まれる各コンテンツがコンテンツ順位に従うように、検索結果コンテンツの一覧情報を並び替えてユーザ端末100へ出力する。なお、カテゴリの優先度及びコンテンツ順位は、順位算出部310によらず検索結果コンテンツ出力部311によって算出してもよい。   The search result content output unit 311 outputs the search result content list information output from the search result content acquisition unit 309 to the user terminal 100 based on the user feature vector calculated by the user feature vector calculation unit 305. The search result content output unit 311 rearranges the search result content list information output from the search result content acquisition unit 309 based on, for example, information indicating the content order output by the rank calculation unit 310. That is, the search result content output unit 311 rearranges the search result content list information and outputs it to the user terminal 100 so that each content included in the search result content follows the content order. Note that the category priority and the content ranking may be calculated by the search result content output unit 311 instead of the rank calculation unit 310.

以下、図8を参照して、順位算出部310によって、検索結果コンテンツ取得部309からの検索結果コンテンツの一覧情報をユーザ特徴ベクトルに基づき並び替える方法について詳細に説明する。図8は、検索結果コンテンツ取得部309からの検索結果コンテンツの一覧情報をユーザ特徴ベクトルに基づき並び替える方法を示す説明図である。図8の例では、ユーザID「UserA」のユーザが検索クエリ「コミックR」で検索要求を行った場合を示している。   Hereinafter, a method of rearranging the search result content list information from the search result content acquisition unit 309 based on the user feature vector by the rank calculation unit 310 will be described in detail with reference to FIG. FIG. 8 is an explanatory diagram illustrating a method of rearranging search result content list information from the search result content acquisition unit 309 based on user feature vectors. The example of FIG. 8 shows a case where the user with the user ID “UserA” makes a search request with the search query “Comic R”.

図8の(a)は、検索結果コンテンツ取得部309により取得された検索結果コンテンツに含まれる各コンテンツに対応付けられた項番及びメタデータ(タイトル及びカテゴリ)を示す表である。検索結果コンテンツに対応付けられた項番は、検索結果コンテンツに含まれるコンテンツの識別番号である。項番は、例えばユーザ端末100の表示部において一覧情報として並ぶ際にどのコンテンツを示す情報が最も上位に並ぶかを示す優先順位に対応している。   FIG. 8A is a table showing item numbers and metadata (title and category) associated with each content included in the search result content acquired by the search result content acquisition unit 309. The item number associated with the search result content is an identification number of the content included in the search result content. The item number corresponds to, for example, a priority order indicating which information indicating which content is arranged at the top when being arranged as list information on the display unit of the user terminal 100.

図8の(b)は、ユーザ特徴ベクトル算出部305により算出されたユーザ特徴ベクトルに基づき、順位算出部310によって算出されたカテゴリの優先度を示す表である(図15のS71参照)。図8の(b)に示されるように、ユーザID「UserA」における特徴ベクトルが示す各カテゴリの優先度が、「画像」、「アニメ」、「映画」、「動画」、「ミュージック」、「アイドル」、及び「コミック」の順で高く算出されている。   FIG. 8B is a table showing the category priorities calculated by the rank calculation unit 310 based on the user feature vectors calculated by the user feature vector calculation unit 305 (see S71 in FIG. 15). As shown in FIG. 8B, the priority of each category indicated by the feature vector in the user ID “UserA” is “image”, “animation”, “movie”, “movie”, “music”, “ It is calculated in the order of “Idol” and “Comic”.

図8の(c)に示されるように、検索結果コンテンツ出力部311は、図8の(a)におけるコンテンツに対応付けられたカテゴリと、図8の(b)におけるカテゴリとを対応させることにより、コンテンツの項番をカテゴリの優先度に対応付ける。例えば、図8の(a)において、項番「5」,「6」のコンテンツには、カテゴリ「コミック」が対応付けられている。よって、カテゴリ「コミック」と、図8の(b)におけるカテゴリ「コミック」とを対応させることにより、コンテンツの項番「5」,「6」がカテゴリ「コミック」の優先度に対応付けられている。また、図8の(a)において項番「1」のコンテンツには、カテゴリ「映画」,「動画」が対応付けられている。このように、コンテンツに対応付けられたカテゴリが複数ある場合には、例えばより優先度が高いカテゴリを対応させる。すなわち、「映画」,「動画」のうち、より優先度が高いカテゴリ「動画」を対応させることにより、コンテンツの項番「1」がカテゴリ「動画」の優先度に対応付けられている。   As shown in FIG. 8C, the search result content output unit 311 associates the category associated with the content in FIG. 8A with the category in FIG. 8B. Associate the item number of the content with the priority of the category. For example, in (a) of FIG. 8, the category “comics” is associated with the contents of the item numbers “5” and “6”. Therefore, by associating the category “comic” with the category “comic” in FIG. 8B, the item numbers “5” and “6” of the contents are associated with the priority of the category “comic”. Yes. In addition, the category “movie” and “moving image” are associated with the content of the item number “1” in FIG. As described above, when there are a plurality of categories associated with the content, for example, a category having a higher priority is associated. In other words, by matching the category “moving image” having a higher priority among “movie” and “moving image”, the item number “1” of the content is associated with the priority of the category “moving image”.

図8の(d)は、上述のように対応付けられたカテゴリの優先度に従い、コンテンツの項番を並び替えた結果を示す表である。図8の(d)に示されるように、検索結果コンテンツに含まれるコンテンツの項番「1」〜「6」が、各項番に対応付けられたカテゴリの優先度に従い並び替えられている(図15のS72参照)。これにより、項番「1」のコンテンツのコンテンツ順位は、カテゴリの優先度に従い並び替えられて、上から5番目になっている。なお、項番「5」,「6」は、対応付けられたカテゴリの優先度に従うと同順となる。この場合には、元々の項番の順に従い、並べ替えられる。これにより、項番「5」のコンテンツのコンテンツ順位は、上から1番目であり、項番「6」のコンテンツのコンテンツ順位は、上から2番目となっている。   FIG. 8D is a table showing the result of rearranging the item numbers of contents in accordance with the priorities of the categories associated as described above. As shown in FIG. 8D, the item numbers “1” to “6” included in the search result content are rearranged according to the priority of the category associated with each item number ( (See S72 in FIG. 15). As a result, the content order of the content of item number “1” is rearranged according to the priority of the category, and is the fifth from the top. The item numbers “5” and “6” are in the same order according to the priority of the associated category. In this case, they are rearranged according to the order of the original item numbers. Accordingly, the content order of the content of item number “5” is the first from the top, and the content order of content of the item number “6” is the second from the top.

次に、再び図1を参照し、検索サーバ400(検索手段)の機能構成について説明する。図1に示されるように、検索サーバ400は、クエリ取得部401、コンテンツ算出部402、及び検索結果コンテンツ送信部403を含んで構成されている。   Next, the functional configuration of the search server 400 (search means) will be described with reference to FIG. 1 again. As shown in FIG. 1, the search server 400 includes a query acquisition unit 401, a content calculation unit 402, and a search result content transmission unit 403.

クエリ取得部401は、統合サーバ300の検索要求送信部308から送信された検索クエリを示す情報を受信して取得する。クエリ取得部401は、取得した検索クエリを示す情報をコンテンツ算出部402に出力する。   The query acquisition unit 401 receives and acquires information indicating the search query transmitted from the search request transmission unit 308 of the integrated server 300. The query acquisition unit 401 outputs information indicating the acquired search query to the content calculation unit 402.

コンテンツ算出部402は、クエリ取得部401からの検索クエリを示す情報に基づき、検索対象データベースに格納されたコンテンツの中から、その検索クエリによる検索要求にヒットする検索結果コンテンツを算出する。コンテンツ算出部402は、算出した検索結果コンテンツを検索結果コンテンツ送信部403に出力する。   Based on the information indicating the search query from the query acquisition unit 401, the content calculation unit 402 calculates the search result content that hits the search request by the search query from the content stored in the search target database. The content calculation unit 402 outputs the calculated search result content to the search result content transmission unit 403.

検索結果コンテンツ送信部403は、コンテンツ算出部402により出力された検索結果コンテンツを統合サーバ300における検索結果コンテンツ取得部309に送信する。   The search result content transmission unit 403 transmits the search result content output by the content calculation unit 402 to the search result content acquisition unit 309 in the integrated server 300.

次に、図9〜図14を参照して、本実施形態に係るコンテンツ検索結果提供システム200の動作について説明する。図9は、図1に示されるコンテンツ検索結果提供システム200の全体的な動作手順を示すシーケンス図である。   Next, the operation of the content search result providing system 200 according to the present embodiment will be described with reference to FIGS. FIG. 9 is a sequence diagram showing an overall operation procedure of the content search result providing system 200 shown in FIG.

図9に示されるように、コンテンツ検索結果提供システム200では、ユーザ端末100から統合サーバ300へ、複数ユーザ履歴が送信される(S1)。続いて、統合サーバ300において、複数ユーザ履歴に基づき、クエリカテゴリ辞書303が作成される(S2)。続いて、統合サーバ300において、ユーザ特徴ベクトルが算出される(S3)。   As shown in FIG. 9, in the content search result providing system 200, a multi-user history is transmitted from the user terminal 100 to the integrated server 300 (S 1). Subsequently, in the integrated server 300, a query category dictionary 303 is created based on the multiple user history (S2). Subsequently, in the integrated server 300, a user feature vector is calculated (S3).

続いて、ユーザ端末100から統合サーバ300へ検索クエリが送信され(S4)、統合サーバ300から検索サーバ400へ検索クエリが送信される(S5)。続いて、検索サーバ400において、受信した検索クエリに対応する(検索クエリによる検索要求にヒットする)検索結果コンテンツが算出される(S6)。続いて、検索サーバ400から統合サーバ300へ検索結果コンテンツが送信される(S7)。続いて、統合サーバ300において、検索結果コンテンツの一覧情報を並び替えるための順序(すなわち、検索結果コンテンツに含まれるコンテンツの順位)が算出される(S8)。続いて、統合サーバ300からユーザ端末100へ並び替えられた(ソートされた)検索結果コンテンツが一覧情報として出力される(S9)。   Subsequently, a search query is transmitted from the user terminal 100 to the integrated server 300 (S4), and a search query is transmitted from the integrated server 300 to the search server 400 (S5). Subsequently, the search server 400 calculates search result content corresponding to the received search query (hits a search request based on the search query) (S6). Subsequently, the search result content is transmitted from the search server 400 to the integrated server 300 (S7). Subsequently, in the integrated server 300, the order for rearranging the list information of the search result contents (that is, the order of the contents included in the search result contents) is calculated (S8). Subsequently, the search result contents rearranged (sorted) from the integrated server 300 to the user terminal 100 are output as list information (S9).

以下、より詳細な動作手順を説明する。図10は、図1に示されるコンテンツ検索結果提供システム200の全体的な動作手順を示すフロー図である。   Hereinafter, a more detailed operation procedure will be described. FIG. 10 is a flowchart showing an overall operation procedure of the content search result providing system 200 shown in FIG.

図10に示されるように、コンテンツ検索結果提供システム200では、検索履歴取得部301により、ユーザ端末100から送信された履歴(検索クエリ及びクリックしたコンテンツを示す情報)が取得され、取得された検索クエリ履歴及び検索クリック履歴が検索履歴情報記憶部302に出力される(S10:検索履歴取得ステップ)。   As illustrated in FIG. 10, in the content search result providing system 200, the search history acquisition unit 301 acquires the history (search query and information indicating the clicked content) transmitted from the user terminal 100, and the acquired search. The query history and search click history are output to the search history information storage unit 302 (S10: search history acquisition step).

続いて、クエリカテゴリ辞書作成部304により、検索履歴情報記憶部302における複数ユーザ履歴に基づき、クエリカテゴリ辞書303が作成される(S20)。なお、S20の詳細については後述する。   Subsequently, the query category dictionary creation unit 304 creates a query category dictionary 303 based on the plurality of user histories in the search history information storage unit 302 (S20). Details of S20 will be described later.

続いて、ユーザ特徴ベクトル算出部305により、過去の検索クエリを用いて、クエリカテゴリ辞書303からクエリカテゴリ評価値が抽出され、抽出されたクエリカテゴリ評価値に基づき、ユーザ特徴ベクトルが算出される(S30:ユーザ特徴量算出ステップ)。なお、S30の詳細については後述する。   Subsequently, the user feature vector calculation unit 305 extracts a query category evaluation value from the query category dictionary 303 using a past search query, and calculates a user feature vector based on the extracted query category evaluation value ( S30: User feature amount calculation step). Details of S30 will be described later.

続いて、検索要求受付部307により、ユーザ端末100からのユーザID及び検索クエリが受信及び取得されると共に、コンテンツの検索要求が受け付けられる(S40)。続いて、検索要求送信部308により、クエリ取得部401へ、検索クエリを示す情報が送信され、コンテンツ算出部402により、検索結果コンテンツが算出される(S50)。   Subsequently, the search request accepting unit 307 receives and acquires the user ID and the search query from the user terminal 100, and accepts a content search request (S40). Subsequently, the search request transmission unit 308 transmits information indicating the search query to the query acquisition unit 401, and the content calculation unit 402 calculates the search result content (S50).

続いて、検索結果コンテンツ送信部403により、検索結果コンテンツが送信され、検索結果コンテンツ取得部309により当該検索結果コンテンツが受信及び取得される(S60:検索結果取得ステップ)。続いて、順位算出部310により、ユーザID毎のユーザ特徴ベクトルを用いて、検索結果コンテンツに含まれるコンテンツのコンテンツ順位が算出される(S70)。なお、S70の処理の詳細は、後述する。続いて、検索結果コンテンツ出力部311により、コンテンツ順位に従い並べられた検索結果コンテンツの一覧情報が、ユーザ端末100に出力される(S80:出力ステップ)。   Subsequently, the search result content transmission unit 403 transmits the search result content, and the search result content acquisition unit 309 receives and acquires the search result content (S60: search result acquisition step). Subsequently, the content ranking of the content included in the search result content is calculated by the ranking calculation unit 310 using the user feature vector for each user ID (S70). Details of the process of S70 will be described later. Subsequently, the search result content output unit 311 outputs the search result content list information arranged in accordance with the content order to the user terminal 100 (S80: output step).

次に、図11を参照して、クエリカテゴリ辞書作成部304によるクエリカテゴリ辞書303の作成方法の詳細を説明する。図11は、図10に示されるS20の詳細な処理方法を示すフロー図である。   Next, details of a method for creating the query category dictionary 303 by the query category dictionary creation unit 304 will be described with reference to FIG. FIG. 11 is a flowchart showing a detailed processing method of S20 shown in FIG.

図11に示されるように、まず検索履歴情報記憶部302が記憶する複数ユーザ履歴から、所定の検索クエリとその検索クエリによる検索結果コンテンツに含まれるコンテンツのうちクリックされたコンテンツに対応付けられたカテゴリが抽出され、カテゴリ毎のクリック数が算出される(S21)。続いて、カテゴリ毎のクリック数を用いて、上記数式(1)により、i番目のカテゴリのクエリカテゴリ評価値が算出される(S22)。i番目の「i」とは、所定の検索クエリによる検索結果コンテンツに含まれるコンテンツのうちクリックされたコンテンツに対応付けられたカテゴリのインデックス(添え字)を示す。当該クリックされたコンテンツに対応付けられたカテゴリの種類数がnである場合、S22の処理はi=1番目からi=n番目まで繰り返される。すなわち、コンテンツに対応付けられた全てのカテゴリについて、S22の処理が行われる。S21〜S22の処理は、予め設定された全ての検索クエリについて行われる。   As illustrated in FIG. 11, first, a plurality of user histories stored in the search history information storage unit 302 are associated with the clicked content among the content included in the search result content based on the predetermined search query and the search query. A category is extracted, and the number of clicks for each category is calculated (S21). Subsequently, using the number of clicks for each category, the query category evaluation value of the i-th category is calculated by the above formula (1) (S22). The i-th “i” indicates an index (subscript) of a category associated with the clicked content among the contents included in the search result content by the predetermined search query. When the number of types of categories associated with the clicked content is n, the process of S22 is repeated from i = 1 to i = n. That is, the process of S22 is performed for all categories associated with the content. The processes of S21 to S22 are performed for all search queries set in advance.

次に、図12を参照して、ユーザ特徴ベクトル算出部305によるユーザ特徴ベクトルの算出方法の詳細を説明する。図12は、図10に示されるS30の詳細な処理方法を示すフロー図である。   Next, details of a user feature vector calculation method by the user feature vector calculation unit 305 will be described with reference to FIG. FIG. 12 is a flowchart showing a detailed processing method of S30 shown in FIG.

図12に示されるように、まずユーザ特徴ベクトルの算出対象であるユーザIDが選択される(S31)。続いて、当該選択されたユーザIDに関し、クエリ評価値yが算出され(S32)、クリック評価値zが算出される(S33)。なお、クエリ評価値y及びクリック評価値zの算出方法の詳細は、図13及び図14を参照して後述する。   As shown in FIG. 12, first, a user ID that is a target for calculating a user feature vector is selected (S31). Subsequently, for the selected user ID, a query evaluation value y is calculated (S32), and a click evaluation value z is calculated (S33). Details of the calculation method of the query evaluation value y and the click evaluation value z will be described later with reference to FIGS. 13 and 14.

続いて、S32において算出されたクエリ評価値y、ステップS33において算出されたクリック評価値zに基づき、ステップ数式(4)により、ユーザ特徴ベクトル評価値x’が算出される(S34)。続いて、いずれかのカテゴリのユーザ特徴ベクトル評価値x’が1.0より大きいか否かが判定される(S35)。ユーザ特徴ベクトル評価値x’が1.0以下であると判定された場合(S35;NO)、S36の処理へ進むことなく、S37の処理へ進む。すなわち、この場合には、後述するS36の正規化処理が行われることなく、S34において算出されたユーザ特徴ベクトル評価値x’が、S31で選択されたユーザIDに関するユーザ特徴ベクトル評価値x’とされてS37の処理へ進む。   Subsequently, based on the query evaluation value y calculated in S32 and the click evaluation value z calculated in Step S33, a user feature vector evaluation value x 'is calculated by Step Equation (4) (S34). Subsequently, it is determined whether or not the user feature vector evaluation value x ′ of any category is larger than 1.0 (S35). When it is determined that the user feature vector evaluation value x ′ is 1.0 or less (S35; NO), the process proceeds to S37 without proceeding to S36. That is, in this case, the user feature vector evaluation value x ′ calculated in S34 is the user feature vector evaluation value x ′ relating to the user ID selected in S31 without performing the normalization process in S36 described later. Then, the process proceeds to S37.

ユーザ特徴ベクトル評価値x’が1.0より大きいと判定された場合(S35;YES)、S36の処理へ進む。S36の処理では、ユーザ特徴ベクトル評価値x’が正規化される。すなわち、評価値x’の最大値で除算して正規化が行われ、その結果がユーザ特徴ベクトル評価値x’とされた上で、S37の処理へ進む。S37の処理では、複数ユーザ履歴に次のユーザIDが存在するか否かが判定される。次のユーザIDとは、ユーザ特徴ベクトルが算出されていないユーザIDを示す。次のユーザIDが存在する場合には(S37;YES)、S31において次のユーザIDが選択され、続いてS32〜S37の処理が行われる。次のユーザIDが存在しない場合には(S37;NO)、処理が終了する。   When it is determined that the user feature vector evaluation value x ′ is greater than 1.0 (S35; YES), the process proceeds to S36. In the process of S36, the user feature vector evaluation value x 'is normalized. That is, normalization is performed by dividing by the maximum value of the evaluation value x ′, and the result is set as the user feature vector evaluation value x ′. Then, the process proceeds to S37. In the process of S37, it is determined whether or not the next user ID exists in the multiple user history. The next user ID indicates a user ID for which a user feature vector has not been calculated. If the next user ID exists (S37; YES), the next user ID is selected in S31, and then the processes of S32 to S37 are performed. If the next user ID does not exist (S37; NO), the process ends.

次に、図13及び図14を参照して、クエリ評価値y及びクリック評価値zの算出方法の詳細を、それぞれ説明する。なお、以下の算出方法では、ユーザ特徴ベクトル算出部305により所定時間毎に抽出される履歴情報が複数ある場合に、複数の履歴情報に基づきクエリ評価値y及びクリック評価値zを算出する場合を説明する。すなわち、所定時間毎に抽出された履歴情報が複数ある場合(前回の抽出から今回の抽出までに新たに記憶された検索クエリ及びクリックされたコンテンツが複数である場合)におけるクエリ評価値y及びクリック評価値zの算出方法を説明する。図13は、図12に示されるS32の詳細な処理方法を示すフロー図である。すなわち、クエリ評価値yの詳細な算出方法を説明するフロー図である。   Next, details of a method for calculating the query evaluation value y and the click evaluation value z will be described with reference to FIGS. In the following calculation method, when there are a plurality of history information extracted by the user feature vector calculation unit 305 every predetermined time, the query evaluation value y and the click evaluation value z are calculated based on the plurality of history information. explain. That is, the query evaluation value y and the click when there are a plurality of history information extracted every predetermined time (when there are a plurality of search queries and clicked contents newly stored from the previous extraction to the current extraction) A method for calculating the evaluation value z will be described. FIG. 13 is a flowchart showing a detailed processing method of S32 shown in FIG. That is, it is a flowchart for explaining a detailed calculation method of the query evaluation value y.

図13に示されるように、まず、図12におけるS31で選択されたユーザ特徴ベクトルの算出対象であるユーザIDについてユーザ特徴ベクトル算出部305により抽出された履歴情報の中から、次の検索クエリが選択される(S41)。ここで次の検索クエリとは、算出対象である同じユーザIDにおいて抽出された履歴情報のうち、ユーザ特徴ベクトルの算出処理に用いられていない検索クエリを示す。続いて、当該選択された検索クエリがクエリカテゴリ辞書303に存在するか否かが判定される(S42)。当該選択された検索クエリがクエリカテゴリ辞書303に存在しない場合(S42;NO)、S41に戻り再び抽出された履歴情報の中から次の検索クエリが選択される。検索クエリがクエリカテゴリ辞書303に存在する場合(S42;YES)、S43の処理へ進む。   As shown in FIG. 13, first, from the history information extracted by the user feature vector calculation unit 305 for the user ID that is the target of calculation of the user feature vector selected in S31 in FIG. Selected (S41). Here, the next search query indicates a search query that is not used in the calculation process of the user feature vector among the history information extracted for the same user ID as the calculation target. Subsequently, it is determined whether or not the selected search query exists in the query category dictionary 303 (S42). If the selected search query does not exist in the query category dictionary 303 (S42; NO), the process returns to S41 and the next search query is selected from the history information extracted again. When the search query exists in the query category dictionary 303 (S42; YES), the process proceeds to S43.

S43の処理では、クエリカテゴリ辞書303から、S41で選択された検索クエリに対応するカテゴリと、各カテゴリのクエリカテゴリ評価値とが抽出され、抽出されたクエリカテゴリ評価値がp1とされる(S43)。続いて、S43におけるp1が、クエリカテゴリ辞書303から抽出された各カテゴリの評価値とされる(S44)。このS44において、クエリカテゴリ辞書303から抽出されたカテゴリが既に存在し、そのカテゴリの評価値が既に設定されている場合には、そのカテゴリの評価値に、S43におけるp1が足されて、新たなカテゴリの評価値とされる。   In the process of S43, the category corresponding to the search query selected in S41 and the query category evaluation value of each category are extracted from the query category dictionary 303, and the extracted query category evaluation value is set to p1 (S43). ). Subsequently, p1 in S43 is set as an evaluation value of each category extracted from the query category dictionary 303 (S44). In S44, when the category extracted from the query category dictionary 303 already exists and the evaluation value of the category is already set, p1 in S43 is added to the evaluation value of the category, and a new value is added. The evaluation value of the category.

続いて、同じユーザIDにおいて、抽出された履歴情報の中に次の検索クエリが存在するか否かを判定する(S45)。次の検索クエリが存在する場合(S45;YES)、再びS41に戻り、次の検索クエリが選択される。続いて、S42〜S45の処理が行われる。次の検索クエリが存在しない場合(S45;NO)、すなわち抽出された履歴情報に含まれる複数の検索クエリの全てについて、S41〜S44の処理が行われた場合、S46の処理へ進む。S46の処理では、S44においてカテゴリの評価値とされた値が、各カテゴリのクエリ評価値yとされて、クエリ評価値yの算出処理が終了する。   Subsequently, for the same user ID, it is determined whether or not the next search query exists in the extracted history information (S45). When the next search query exists (S45; YES), the process returns to S41 again, and the next search query is selected. Subsequently, the processes of S42 to S45 are performed. When the next search query does not exist (S45; NO), that is, when the processes of S41 to S44 are performed for all of the plurality of search queries included in the extracted history information, the process proceeds to S46. In the process of S46, the value determined as the category evaluation value in S44 is set as the query evaluation value y of each category, and the calculation process of the query evaluation value y ends.

図14は、図12に示されるS33の詳細な処理方法を示すフロー図である。すなわち、クリック評価値zの詳細な算出方法を説明するフロー図である。   FIG. 14 is a flowchart showing a detailed processing method of S33 shown in FIG. That is, it is a flowchart for explaining a detailed calculation method of the click evaluation value z.

図14に示されるように、まず図12におけるS31で選択されたユーザ特徴ベクトルの算出対象であるユーザIDについてユーザ特徴ベクトル算出部305により抽出された履歴情報の中から、次の検索クリック履歴が選択される(S51)。ここで次の検索クリック履歴とは、同じユーザIDにおいて抽出された履歴情報のうち、ユーザ特徴ベクトルの算出処理に用いられていない検索クリック履歴を示す。続いて、定数p2(本実施形態においては、1)が、当該選択された検索クリック履歴が示すクリックされたコンテンツに対応付けられた各カテゴリの評価値とされる(S52)このS53において、クリックされたコンテンツに対応付けられたカテゴリが既に存在し、そのカテゴリの評価値が既に設定されている場合には、そのカテゴリの評価値に、定数p2が足されて、新たなカテゴリの評価値とされる。   As shown in FIG. 14, the next search click history is first extracted from the history information extracted by the user feature vector calculation unit 305 for the user ID that is the calculation target of the user feature vector selected in S <b> 31 in FIG. 12. Selected (S51). Here, the next search click history indicates a search click history that is not used in the calculation process of the user feature vector among the history information extracted for the same user ID. Subsequently, the constant p2 (1 in the present embodiment) is set as the evaluation value of each category associated with the clicked content indicated by the selected search click history (S52). If a category associated with the selected content already exists and an evaluation value of the category has already been set, a constant p2 is added to the evaluation value of the category, and the evaluation value of the new category Is done.

続いて、同じユーザIDにおいて、抽出された履歴情報の中に次の検索クリック履歴が存在するか否かを判定する(S53)。次の検索クリック履歴が存在する場合(S53;YES)、再びS51に戻り、次の検索クリック履歴が選択される。続いて、S52〜S53の処理が行われる。次の検索クリック履歴が存在しない場合(S53;NO)、すなわち抽出された履歴情報に含まれる複数の検索クリック履歴の全てについて、S51〜S53の処理が行われた場合、S54の処理へ進む。S54の処理では、S54においてカテゴリの評価値とされた値が、各カテゴリのクリック評価値zとされて、クリック評価値zの算出処理が終了する。   Subsequently, it is determined whether or not the next search click history exists in the extracted history information with the same user ID (S53). When the next search click history exists (S53; YES), the process returns to S51 again, and the next search click history is selected. Subsequently, the processing of S52 to S53 is performed. When the next search click history does not exist (S53; NO), that is, when the processes of S51 to S53 are performed for all of the plurality of search click histories included in the extracted history information, the process proceeds to S54. In the processing of S54, the value determined as the category evaluation value in S54 is set as the click evaluation value z of each category, and the calculation processing of the click evaluation value z ends.

次に、図15を参照して、順位算出部310により、ユーザID毎のユーザ特徴ベクトルを用いて、検索結果コンテンツに含まれるコンテンツのコンテンツ順位を算出する方法の詳細を説明する。図15は、図10に示されるS70の詳細な処理方法を示すフロー図である。   Next, with reference to FIG. 15, the details of a method for calculating the content rank of the content included in the search result content using the user feature vector for each user ID by the rank calculation unit 310 will be described. FIG. 15 is a flowchart showing a detailed processing method of S70 shown in FIG.

図15に示されるように、まず、ユーザ特徴ベクトル算出部305によって算出されたユーザ特徴ベクトルが、ユーザ特徴ベクトル評価値x’について大きい値から小さい値に向かって降順に並び替えられ(ソートされ)、並び替えられたユーザ特徴ベクトルのカテゴリ順が、該当ユーザID(ユーザ特徴ベクトル算出対象のユーザID)に対するカテゴリ優先度とされる(S71)。続いて、検索結果コンテンツ取得部309によって取得した検索結果コンテンツにおいて、S71で求めたカテゴリ優先度に基づきユーザ端末100の表示部に表示する表示順(検索結果コンテンツに含まれるコンテンツのコンテンツ順位)が決定される(S72)。以上のようにして、順位算出部310によるコンテンツ順位の算出処理が終了する。   As shown in FIG. 15, first, the user feature vectors calculated by the user feature vector calculation unit 305 are rearranged (sorted) in descending order from the largest value to the smallest value for the user feature vector evaluation value x ′. The category order of the rearranged user feature vectors is set as the category priority for the corresponding user ID (user feature vector calculation target user ID) (S71). Subsequently, in the search result content acquired by the search result content acquisition unit 309, the display order (content order of content included in the search result content) displayed on the display unit of the user terminal 100 based on the category priority obtained in S71. It is determined (S72). As described above, the content rank calculation processing by the rank calculation unit 310 ends.

以上、本実施形態に係るコンテンツ検索結果提供システム200及びコンテンツ検索結果提供方法によれば、クエリカテゴリ辞書303から、コンテンツのカテゴリ毎の過去の検索クエリに対する対応度合いを関連付けたクエリカテゴリ評価値が抽出され、この抽出されたクエリカテゴリ評価値に基づき、コンテンツのカテゴリに対するユーザ毎の嗜好性の対応度合いを示すユーザ特徴ベクトルが算出される。よって、当該ユーザ特徴ベクトルは、検索要求を行うユーザの検索クリック履歴を用いることなく算出される。そして、当該ユーザ特徴ベクトルに基づき検索要求時の検索クエリに対応するコンテンツの検索結果が出力されるので、検索要求を行うユーザの検索クリック履歴がない場合にも、そのユーザの嗜好性が反映された検索結果を出力することができる。以上より、検索要求を行うユーザの検索クリック履歴がない場合にも、そのユーザの嗜好性が反映されたコンテンツを提供することができる。   As described above, according to the content search result providing system 200 and the content search result providing method according to the present embodiment, the query category evaluation value associated with the degree of correspondence to the past search query for each content category is extracted from the query category dictionary 303. Then, based on the extracted query category evaluation value, a user feature vector indicating the degree of correspondence of the preference for each user with respect to the content category is calculated. Therefore, the user feature vector is calculated without using the search click history of the user who makes the search request. Since the search result of the content corresponding to the search query at the time of the search request is output based on the user feature vector, even if there is no search click history of the user who makes the search request, the user's preference is reflected. Search results can be output. As described above, even when there is no search click history of a user who makes a search request, it is possible to provide content that reflects the user's preference.

また、本実施形態に係るコンテンツ検索結果提供システム200によれば、ユーザ特徴ベクトルに基づく順序のコンテンツの検索結果が出力されるので、検索要求を行うユーザの検索クリック履歴がない場合にも、そのユーザの嗜好性に応じた順で並べられた検索結果を出力することができる。   Further, according to the content search result providing system 200 according to the present embodiment, the search result of the content in the order based on the user feature vector is output, so even when there is no search click history of the user who makes the search request, Search results arranged in order according to the user's preference can be output.

また、本実施形態に係るコンテンツ検索結果提供システム200によれば、検索サーバ400により、ユーザ端末100から送信された検索要求時の検索クエリに対応するコンテンツを検索することができる。   Further, according to the content search result providing system 200 according to the present embodiment, the search server 400 can search for content corresponding to the search query at the time of the search request transmitted from the user terminal 100.

また、本発明に係るコンテンツ検索結果提供システム200によれば、複数のユーザ毎に過去の検索クエリとカテゴリとが関連付けられた複数ユーザ履歴に基づきクエリカテゴリ辞書303が作成されるので、クエリカテゴリ辞書303に格納される情報の信頼性をより高めることができる。   Further, according to the content search result providing system 200 according to the present invention, the query category dictionary 303 is created based on a plurality of user histories in which a past search query and a category are associated for each of a plurality of users. The reliability of the information stored in 303 can be further increased.

以上、本発明の実施形態について説明してきたが、本発明は必ずしも上述した実施形態に限定されるものではなく、その要旨を逸脱しない範囲で様々な変更が可能である。   As mentioned above, although embodiment of this invention has been described, this invention is not necessarily limited to embodiment mentioned above, A various change is possible in the range which does not deviate from the summary.

例えば、上記実施形態においては、クエリカテゴリ辞書作成部304によりクエリカテゴリ辞書303が作成されるとしたが、これに限られない。例えば、統合サーバ300は予め設定され記憶されたクエリカテゴリ辞書を有していてもよい。   For example, in the above embodiment, the query category dictionary 303 is created by the query category dictionary creation unit 304, but the present invention is not limited to this. For example, the integrated server 300 may have a query category dictionary that is preset and stored.

200…コンテンツ検索結果提供システム、301…検索履歴取得部(検索履歴取得手段)、303…クエリカテゴリ辞書、304…クエリカテゴリ辞書作成部、305…ユーザ特徴ベクトル算出部(ユーザ特徴量算出手段)、309…検索結果コンテンツ取得部(検索結果取得手段)、310…順位算出部(順位算出手段)、311…検索結果コンテンツ出力部(出力手段)、400…検索サーバ(検索手段)、S10…検索履歴取得ステップ、S30…ユーザ特徴量算出ステップ、S60…検索結果取得ステップ、S80…出力ステップ。
DESCRIPTION OF SYMBOLS 200 ... Content search result provision system, 301 ... Search history acquisition part (search history acquisition means), 303 ... Query category dictionary, 304 ... Query category dictionary creation part, 305 ... User feature vector calculation part (user feature amount calculation means), 309 ... Search result content acquisition unit (search result acquisition unit), 310 ... Rank calculation unit (rank calculation unit), 311 ... Search result content output unit (output unit), 400 ... Search server (search unit), S10 ... Search history Acquisition step, S30 ... User feature amount calculation step, S60 ... Search result acquisition step, S80 ... Output step.

Claims (4)

所定の検索クエリと、コンテンツのカテゴリ毎の前記所定の検索クエリに対する対応度合いとを関連付けた情報が格納されるクエリカテゴリ辞書と、
ユーザ端末から送信された過去の検索クエリを示す検索クエリ履歴を取得する検索履歴取得手段と、
前記検索クエリ履歴を用いて、前記クエリカテゴリ辞書から、前記コンテンツのカテゴリ毎の前記過去の検索クエリに対する対応度合いを関連付けた情報を抽出し、抽出された前記情報に基づき、前記コンテンツのカテゴリに対するユーザ毎の嗜好性の対応度合いを示すユーザ特徴量を算出するユーザ特徴量算出手段と、
ユーザ端末から送信された検索要求時の検索クエリに対応すると共にカテゴリに対応付けられたコンテンツを示す情報を含むコンテンツの検索結果を取得する検索結果取得手段と、
前記ユーザ特徴量に基づき、前記コンテンツの検索結果を出力する出力手段と、
を備え
前記所定の検索クエリは、前記過去の検索クエリを含み、
前記検索履歴取得手段は、複数のユーザ毎に、前記過去の検索クエリと、前記過去の検索クエリに対応するコンテンツのうち、ユーザが選択したコンテンツのカテゴリとを関連付けた情報である複数ユーザ履歴を取得しており、
前記複数ユーザ履歴に基づいて、前記クエリカテゴリ辞書を作成する作成手段を更に備える、コンテンツ検索結果提供システム。
A query category dictionary that stores information associating a predetermined search query with a degree of correspondence to the predetermined search query for each category of content;
Search history acquisition means for acquiring a search query history indicating a past search query transmitted from the user terminal;
Using the search query history, information that associates the degree of correspondence with the past search query for each category of the content is extracted from the query category dictionary, and the user for the content category is extracted based on the extracted information. User feature amount calculating means for calculating a user feature amount indicating a degree of preference for each preference;
Search result acquisition means for acquiring a search result of content corresponding to the search query at the time of the search request transmitted from the user terminal and including information indicating the content associated with the category;
Output means for outputting a search result of the content based on the user feature amount;
Equipped with a,
The predetermined search query includes the past search query,
The search history acquisition unit is configured to obtain, for each of a plurality of users, a plurality of user histories that are information in which the past search query is associated with a category of content selected by the user among contents corresponding to the past search query. Have acquired
A content search result providing system further comprising a creation unit that creates the query category dictionary based on the plurality of user histories .
前記ユーザ特徴量に基づき、前記コンテンツの検索結果に含まれるコンテンツを示す情報の順序を決定する順位算出手段を更に備え、
前記出力手段は、前記順位算出手段により決定された順序に従い前記コンテンツの検索結果を出力する、請求項1に記載のコンテンツ検索結果提供システム。
A rank calculating means for determining an order of information indicating the content included in the search result of the content based on the user feature amount;
The content search result providing system according to claim 1, wherein the output unit outputs the search result of the content according to the order determined by the rank calculation unit.
前記ユーザ端末から送信された検索要求時の検索クエリに対応するコンテンツを検索する検索手段を更に備える、請求項1又は2に記載のコンテンツ検索結果提供システム。 The content search result providing system according to claim 1 or 2 , further comprising search means for searching for content corresponding to a search query at the time of a search request transmitted from the user terminal. 所定の検索クエリと、コンテンツのカテゴリ毎の前記所定の検索クエリに対する対応度合いとを関連付けた情報が格納されるクエリカテゴリ辞書を備えたコンテンツ検索結果提供システムの動作方法であるコンテンツ検索結果提供方法であって、
ユーザ端末から送信された過去の検索クエリを示す検索クエリ履歴を取得する検索履歴取得ステップと、
前記検索クエリ履歴を用いて、前記クエリカテゴリ辞書から、前記コンテンツのカテゴリ毎の前記過去の検索クエリに対する対応度合いを関連付けた情報を抽出し、抽出された前記情報に基づき、前記コンテンツのカテゴリに対するユーザ毎の嗜好性の対応度合いを示すユーザ特徴量を算出するユーザ特徴量算出ステップと、
ユーザ端末から送信された検索要求時の検索クエリに対応すると共にカテゴリに対応付けられたコンテンツを示す情報を含むコンテンツの検索結果を取得する検索結果取得ステップと、
前記ユーザ特徴量に基づき、前記コンテンツの検索結果を出力する出力ステップと、
を含み、
前記所定の検索クエリは、前記過去の検索クエリを含み、
前記検索履歴取得ステップにおいて、複数のユーザ毎に、前記過去の検索クエリと、前記過去の検索クエリに対応するコンテンツのうち、ユーザが選択したコンテンツのカテゴリとを関連付けた情報である複数ユーザ履歴を取得しており、
前記複数ユーザ履歴に基づいて、前記クエリカテゴリ辞書を作成する作成ステップを更に含む、コンテンツ検索結果提供方法。
A content search result providing method which is an operation method of a content search result providing system including a query category dictionary in which information in which a predetermined search query is associated with a degree of correspondence to the predetermined search query for each content category is stored. There,
A search history acquisition step for acquiring a search query history indicating a past search query transmitted from the user terminal;
Using the search query history, information that associates the degree of correspondence with the past search query for each category of the content is extracted from the query category dictionary, and the user for the content category is extracted based on the extracted information. A user feature amount calculating step for calculating a user feature amount indicating a degree of preference for each preference;
A search result acquisition step for acquiring a search result of content corresponding to the search query at the time of the search request transmitted from the user terminal and including information indicating the content associated with the category;
An output step of outputting a search result of the content based on the user feature amount;
Only including,
The predetermined search query includes the past search query,
In the search history acquisition step, for each of a plurality of users, a plurality of user histories that are information that associates the past search query with a category of the content selected by the user among the contents corresponding to the past search query. Have acquired
A content search result providing method , further comprising a creation step of creating the query category dictionary based on the multi-user history .
JP2014244832A 2014-12-03 2014-12-03 Content search result providing system and content search result providing method Active JP6433270B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014244832A JP6433270B2 (en) 2014-12-03 2014-12-03 Content search result providing system and content search result providing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014244832A JP6433270B2 (en) 2014-12-03 2014-12-03 Content search result providing system and content search result providing method

Publications (2)

Publication Number Publication Date
JP2016110260A JP2016110260A (en) 2016-06-20
JP6433270B2 true JP6433270B2 (en) 2018-12-05

Family

ID=56124225

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014244832A Active JP6433270B2 (en) 2014-12-03 2014-12-03 Content search result providing system and content search result providing method

Country Status (1)

Country Link
JP (1) JP6433270B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6924807B2 (en) * 2019-10-23 2021-08-25 ヤフー株式会社 Information provision system, information provision method, and program
JP7079867B1 (en) 2021-03-19 2022-06-02 ヤフー株式会社 Generator, generation method and generation program
CN114491051B (en) * 2022-04-02 2022-07-29 四川省大数据中心 Project approval system for building site

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010097461A (en) * 2008-10-17 2010-04-30 Nippon Telegr & Teleph Corp <Ntt> Document search apparatus, document search method, and document search program
CN102289436B (en) * 2010-06-18 2013-12-25 阿里巴巴集团控股有限公司 Method and device for determining weighted value of search term and method and device for generating search results
CN102591876A (en) * 2011-01-14 2012-07-18 阿里巴巴集团控股有限公司 Sequencing method and device of search results
US8458213B2 (en) * 2011-02-28 2013-06-04 Ebay Inc. Method and system for classifying queries to improve relevance of search results

Also Published As

Publication number Publication date
JP2016110260A (en) 2016-06-20

Similar Documents

Publication Publication Date Title
JP5736469B2 (en) Search keyword recommendation based on user intention
US11681750B2 (en) System and method for providing content to users based on interactions by similar other users
US9223873B2 (en) Method and system for incrementally selecting and providing relevant search engines in response to a user query
KR101994987B1 (en) Related entities
KR101644817B1 (en) Generating search results
CN109168047B (en) Video recommendation method and device, server and storage medium
JP2008507041A (en) Personalize the ordering of place content in search results
JP6405343B2 (en) Information processing apparatus, information processing method, and program
US20230222136A1 (en) Information providing device
JP5281104B2 (en) Advertisement management apparatus, advertisement selection apparatus, advertisement management method, advertisement management program, and recording medium recording advertisement management program
JP6203304B2 (en) Information processing apparatus, information processing method, and information processing program
JP6433270B2 (en) Content search result providing system and content search result providing method
CN110766489A (en) Method for requesting content and providing content and corresponding device
CN111915414B (en) Method and device for displaying target object sequence to target user
CN107851114A (en) Automated information retrieval
CN111445302A (en) Commodity sorting method, system and device
US20180165741A1 (en) Information providing device, information providing method, information providing program, and computer-readable storage medium storing the program
US20150170035A1 (en) Real time personalization and categorization of entities
TW200828039A (en) List displaying method for web page searching result
JP6167029B2 (en) RECOMMENDATION INFORMATION GENERATION DEVICE AND RECOMMENDATION INFORMATION GENERATION METHOD
JP6246271B1 (en) Attribute evaluation apparatus, sales system, attribute evaluation method, and attribute evaluation program
JP6267252B2 (en) SEARCH DEVICE, SEARCH METHOD, AND SEARCH PROGRAM
JP6059595B2 (en) Content search result providing apparatus, content search result providing method, and content search result providing system
JP6027468B2 (en) Recommendation information acquisition apparatus, recommendation information acquisition method, and recommendation information provision system
US20080021875A1 (en) Method and apparatus for performing a tone-based search

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170818

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180516

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180522

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180612

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181009

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181106

R150 Certificate of patent or registration of utility model

Ref document number: 6433270

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250