JP2010181966A - Device and method for evaluating recommendation information - Google Patents
Device and method for evaluating recommendation information Download PDFInfo
- Publication number
- JP2010181966A JP2010181966A JP2009022880A JP2009022880A JP2010181966A JP 2010181966 A JP2010181966 A JP 2010181966A JP 2009022880 A JP2009022880 A JP 2009022880A JP 2009022880 A JP2009022880 A JP 2009022880A JP 2010181966 A JP2010181966 A JP 2010181966A
- Authority
- JP
- Japan
- Prior art keywords
- feature vector
- content
- feature
- vector
- selection target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
Description
本発明は、コンテンツの評価を行うレコメンド情報評価装置およびレコメンド情報評価方法に関する。 The present invention relates to a recommendation information evaluation apparatus and a recommendation information evaluation method for evaluating content.
ユーザの特徴に合致したレコメンド情報を配信するために、そのレコメンド情報を抽出するための情報フィルタリング方式として、Content−basedFiltering方式が考えられている。この方式は、ユーザがWebページの閲覧などの行動を取ることにより、閲覧された対象文書を解析し、文書に含まれている単語(キーワード)を抽出する。そして、これらの単語を、ユーザごとに区別して、ユーザプロファイルといわれる興味・嗜好情報として記録する。ユーザプロファイルには、1つの興味の概念が表現され、この概念を利用してユーザに情報を提供することが考えられている。例えば、広告商品等に割り当てられたキーワードとユーザプロファイル(キーワードで表現された)とをマッチングすることにより適切な広告の推薦を可能とするシステムが一般的に知られている。 In order to distribute recommended information that matches the user's characteristics, a Content-basedFiltering method is considered as an information filtering method for extracting the recommended information. In this method, when a user takes an action such as browsing a Web page, the browsed target document is analyzed, and words (keywords) included in the document are extracted. These words are distinguished for each user and recorded as interest / preference information called a user profile. One concept of interest is expressed in the user profile, and it is considered to provide information to the user using this concept. For example, a system is generally known that makes it possible to recommend an appropriate advertisement by matching a keyword assigned to an advertisement product or the like with a user profile (expressed by a keyword).
また、これに関連する技術として、特許文献1に記載されている技術が挙げられる。この特許文献1には、予め定められたレコメンド抽出ルールに従ってレコメンド情報を配信する配信先および配信すべきレコメンド情報を決定し、配信する技術が記載されている。
Moreover, the technique described in
しかしながら、上述の背景技術においては、マッチング処理をすることによりレコメンド情報を抽出するものであったり、また、特許文献1に記載の技術では、予め定められたレコメンド抽出ルールに基づいてレコメンド情報が決定され、レコメンド対象によって特徴空間ベクトルは更新されないことから、レコメンド情報に漏れが生じるおそれがある。
However, in the background art described above, recommendation information is extracted by performing a matching process, or in the technique described in
すなわち、特許文献1の技術においては、レコメンド抽出ルールに、趣味・嗜好が登録されていれば、その趣味・嗜好にあったレコメンド情報が決定され配信されることになり、また、購買履歴等に基づいて、ある商品を購入するとその購入した商品に関連する情報が配信されることになるが、これら配信される情報は、趣味・嗜好、購買履歴、またはアクセス履歴などの直接的な情報に基づいて決定され、またレコメンド対象によって特徴空間ベクトルは更新されないため、ユーザが潜在的に望んでいるコンテンツに漏れが生じる場合がある。
That is, in the technique of
特にアクセス履歴に基づいてレコメンド情報を配信使用とする場合には、特に漏れが大きくなるものと考えられる。すなわち、ユーザがサイトなどを閲覧する場合、閲覧しているサイト自体は、一つのキーワードによって表されるものではなく、複数のキーワードをもって表されているものが通常である。例えば、ユーザが映画aに関する情報を検索し、閲覧している場合において、その閲覧しているサイトは、映画aの紹介であったり、原作本を紹介していたり、興行映画館を紹介していたり、出演者を紹介していたり、いろいろな情報(ベクトル情報)を含んでいる。この場合、ユーザは原作本を探している場合には、その原作本に特化したフィルタリング処理を行い、そのためのだけのレコメンド情報を配信することがユーザにとって望まれるものである。 In particular, when recommendation information is distributed and used based on the access history, it is considered that the leakage is particularly large. That is, when a user browses a site or the like, the browsed site itself is not represented by a single keyword, but is usually represented by a plurality of keywords. For example, when a user searches and browses information related to the movie a, the browsing site introduces the movie a, introduces the original, or introduces the entertainment movie theater. Or introducing performers, and various information (vector information). In this case, when the user is searching for an original book, it is desirable for the user to perform a filtering process specialized for the original book and distribute recommendation information only for that purpose.
しかしながら、上述特許文献1に記載の技術では、閲覧しているサイトの全体を見てその全体に近い情報をレコメンド情報として配信することになり、上述のとおりユーザにとって潜在的に望んでいる情報を配信することができなかった。
However, with the technology described in
そこで、本発明は、ユーザが潜在的に望んでいるコンテンツなどのレコメンド情報を漏れなく配信することができるように、その評価を行うことができるレコメンド情報評価装置およびレコメンド情報評価方法を提供することを目的とする。 Therefore, the present invention provides a recommendation information evaluation apparatus and a recommendation information evaluation method that can perform evaluation so that recommendation information such as content that a user potentially desires can be delivered without omission. With the goal.
上述の課題を解決するために、本発明のレコメンド情報評価装置は、選択対象項目の特徴空間を構成する特徴ベクトルを生成する特徴ベクトル生成手段と、前記特徴ベクトル生成手段により生成された特徴ベクトルを記憶する特徴ベクトル記憶手段と、ユーザ操作により、複数の選択対象項目から一の選択対象項目を選択することを受け付ける受付手段と、前記受付手段により受け付けられ、選択された選択対象項目、および選択されなかった選択対象項目を区別して記憶する履歴記憶手段と、前記履歴記憶手段により記憶された、選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを特徴空間内で分離するための分離平面に直交する直交ベクトルをユーザ特性ベクトルとするユーザ特性ベクトル生成手段と、前記ユーザ特性ベクトル生成手段により生成されたユーザ特性ベクトルに基づいて、未知の選択対象項目の評価を行う評価手段と、を備え、前記特徴ベクトル生成手段は、生成した特徴ベクトルに基づいて、前記特徴ベクトル記憶手段に記憶されている特徴ベクトルを更新するように構成されている。 In order to solve the above-described problem, a recommendation information evaluation apparatus according to the present invention includes a feature vector generation unit that generates a feature vector constituting a feature space of a selection target item, and a feature vector generated by the feature vector generation unit. Feature vector storage means for storing, reception means for receiving selection of one selection target item from a plurality of selection target items by a user operation, selection target item selected and received by the reception means, and selected A history storage unit that distinguishes and stores the selection target item that has not been stored, and a satisfaction feature vector of the selected selection target item and an unsatisfied feature vector of the selection target item that has not been selected, which are stored by the history storage unit. The user characteristic vector with the orthogonal vector orthogonal to the separation plane for separation within the user characteristic vector And an evaluation unit that evaluates an unknown selection target item based on the user characteristic vector generated by the user characteristic vector generation unit, and the feature vector generation unit adds the generated feature vector to the generated feature vector. Based on the feature vector, the feature vector stored in the feature vector storage means is updated.
また、本発明のレコメンド情報評価方法は、選択対象項目の特徴空間を構成する特徴ベクトルを生成する特徴ベクトル生成ステップと、前記特徴ベクトル生成ステップにおいて生成された特徴ベクトルを特徴ベクトル記憶手段に記憶する特徴ベクトル記憶ステップと、ユーザ操作により、複数の選択対象項目から一の選択対象項目を選択することを受け付ける受付ステップと、前記受付ステップにおいて受け付けられ、選択された選択対象項目および選択されなかった選択対象項目を履歴記憶手段に記憶する履歴記憶ステップと、前記履歴記憶手段に記憶された、選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを、特徴空間内で分離するための分離平面に直交する直交ベクトルに基づいてユーザ特性ベクトルを生成するユーザ特性ベクトル生成ステップと、前記ユーザ特性ベクトル生成ステップにより生成されたユーザ特性ベクトルに基づいて、レコメンド情報の評価を行う評価ステップと、を備え、前記特徴ベクトル生成ステップは、生成した特徴ベクトルに基づいて、前記特徴ベクトル記憶手段に記憶された特徴ベクトルを更新するように構成されている。 In the recommendation information evaluation method of the present invention, a feature vector generation step for generating a feature vector constituting a feature space of a selection target item, and a feature vector generated in the feature vector generation step are stored in a feature vector storage unit. A feature vector storage step, a reception step for receiving selection of one selection target item from a plurality of selection target items by a user operation, and a selection target item selected and not selected in the reception step A history storage step of storing the target item in the history storage means, a satisfaction feature vector of the selected selection target item and an unsatisfied feature vector of the selection target item not selected stored in the history storage means, Based on orthogonal vector orthogonal to the separation plane for separation within A user characteristic vector generation step for generating a user characteristic vector; and an evaluation step for evaluating recommendation information based on the user characteristic vector generated by the user characteristic vector generation step, wherein the feature vector generation step comprises: Based on the generated feature vector, the feature vector stored in the feature vector storage means is updated.
この発明によれば、選択対象項目の特徴空間を構成する特徴ベクトルを生成し、生成された特徴ベクトルを記憶することで、生成した特徴ベクトルに基づいて、すでに記憶されている特徴ベクトルを更新する。一方、ユーザ操作により、複数の選択対象項目から一の選択対象項目を選択することを受け付けると、選択された選択対象項目、および選択されなかった選択対象項目を区別して記憶する。そして、選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを特徴空間内で分離するための分離平面に直交する直交ベクトルをユーザ特性ベクトルとし、このユーザ特性ベクトルに基づいて、未知の選択対象項目の評価を行うことができる。 According to the present invention, the feature vector constituting the feature space of the selection target item is generated, and the generated feature vector is stored, so that the already stored feature vector is updated based on the generated feature vector. . On the other hand, when receiving selection of one selection target item from a plurality of selection target items by a user operation, the selected selection target item and the selection target item that has not been selected are distinguished and stored. Then, an orthogonal vector orthogonal to the separation plane for separating the satisfaction feature vector of the selected selection target item and the unsatisfied feature vector of the selection target item not selected in the feature space is defined as a user characteristic vector, and this user characteristic Based on the vector, an unknown selection target item can be evaluated.
これにより、ユーザの特徴を示すベクトルにしたがって未知の選択対象項目、例えばコンテンツまたは操作メニュー項目などのレコメンド情報の評価を行うことができ、ユーザの趣味・嗜好など、またアクセス履歴などの直接的な情報に基づいて推薦すべきレコメンド情報を評価することがなく、漏れなくレコメンド情報をユーザに提供することができる。また、ユーザが潜在的に望んでいるコンテンツなどのレコメンド情報を漏れなく配信することができるようになる。すなわち、選択対象項目、例えばテレビ番組やCDの紹介情報などのコンテンツの種類に応じて特徴ベクトルが更新されることにより、コンテンツの種類に特化されたレコメンド情報をユーザに提供することができる。 As a result, it is possible to evaluate unknown selection target items, for example, recommendation information such as contents or operation menu items, according to a vector indicating the user's characteristics, and the user's hobbies / preferences, direct access history, etc. The recommendation information to be recommended based on the information is not evaluated, and the recommendation information can be provided to the user without omission. In addition, recommendation information such as contents that the user potentially desires can be distributed without omission. In other words, the feature vector is updated according to the type of content such as the selection target item, for example, TV program or CD introduction information, so that recommendation information specialized to the type of content can be provided to the user.
また、本発明のレコメンド情報評価装置は、前記履歴記憶手段により記憶されている選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを特徴空間内で分離するための分離平面を生成する分離平面生成手段をさらに備え、前記ユーザ特性ベクトル生成手段は、前記分離平面生成手段により生成された分離平面に従ってユーザ特性ベクトルを生成することが好ましい。 Also, the recommendation information evaluation apparatus of the present invention separates the satisfaction feature vector of the selected selection target item stored in the history storage unit and the unsatisfied feature vector of the selection target item that has not been selected in the feature space. It is preferable that the apparatus further includes a separation plane generation unit that generates a separation plane for generating the user characteristic vector according to the separation plane generated by the separation plane generation unit.
この発明によれば、選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを特徴空間内で分離するための分離平面を生成し、これに基づいてユーザ特性ベクトルを生成することにより、ユーザ特性ベクトルを精度良く生成することができる。 According to the present invention, the separation plane for separating the satisfactory feature vector of the selected selection target item and the unsatisfactory feature vector of the unselected selection target item in the feature space is generated, and based on this, the user characteristics By generating the vector, the user characteristic vector can be generated with high accuracy.
また、本発明のレコメンド情報評価装置において、前記特徴ベクトル生成手段は、更新するために必要な情報を選択項目対象である文書情報から取得することが好ましい。 In the recommendation information evaluation apparatus according to the present invention, it is preferable that the feature vector generation unit obtains information necessary for updating from document information that is a selection item target.
この発明によれば、更新するために必要な情報を選択項目対象である文書情報から取得することにより、特徴ベクトルを生成することができる。この文書情報は、Webページ、ワープロデータ(ワードプロセッサにより作成されたデータ)、表計算データ(表計算アプリケーションにより作成されたデータ)などの解析可能な文書が記述された情報である。 According to the present invention, a feature vector can be generated by acquiring information necessary for updating from document information that is a selection item target. This document information is information describing a document that can be analyzed such as a Web page, word processor data (data created by a word processor), spreadsheet data (data created by a spreadsheet application), and the like.
また、本発明のレコメンド情報評価装置において、前記特徴ベクトル生成手段は、選択対象項目の属性毎に特徴的な単語を品詞毎に抽出する特徴抽出手段をさらに備え、前記特徴抽出手段により抽出された単語に基づいて、特徴ベクトルを生成することが好ましい。 In the recommendation information evaluation apparatus according to the present invention, the feature vector generation unit further includes a feature extraction unit that extracts a characteristic word for each part of speech for each attribute of the selection target item, and is extracted by the feature extraction unit. It is preferable to generate a feature vector based on the word.
この発明によれば、選択対象項目の属性毎に特徴的な単語を品詞に毎に抽出し、抽出された単語に基づいて、特徴ベクトルを生成することで、適切な特徴ベクトルを生成することができる。 According to the present invention, it is possible to generate an appropriate feature vector by extracting a characteristic word for each attribute of the selection target item for each part of speech, and generating a feature vector based on the extracted word. it can.
また、本発明のレコメンド情報評価装置において、前記特徴抽出手段は、TF/IDF法に基づいて、選択対象項目の属性毎に特徴的な単語を抽出することが好ましい。 Moreover, in the recommendation information evaluation apparatus of this invention, it is preferable that the said feature extraction means extracts a characteristic word for every attribute of a selection object item based on TF / IDF method.
この発明によれば、TF/IDF法に基づいて、選択対象項目の属性毎に特徴的な単語を抽出することで、適切な特徴ベクトルを生成することができる。 According to the present invention, an appropriate feature vector can be generated by extracting a characteristic word for each attribute of a selection target item based on the TF / IDF method.
また、本発明のレコメンド情報評価装置において、前記特徴抽出手段は、PMM法に基づいて、選択対象項目の属性毎に特徴的な単語を抽出することが好ましい。 In the recommendation information evaluation apparatus according to the present invention, it is preferable that the feature extraction unit extracts a characteristic word for each attribute of the selection target item based on the PMM method.
この発明によれば、PMM法に基づいて、選択対象項目の属性毎に特徴的な単語を抽出することで、適切な特徴ベクトルを生成することができる。 According to this invention, an appropriate feature vector can be generated by extracting a characteristic word for each attribute of a selection target item based on the PMM method.
また、本発明のレコメンド情報評価装置において、前記特徴ベクトル生成手段は、特徴ベクトルを任意のタイミングで生成することが好ましい。 In the recommendation information evaluation apparatus according to the present invention, it is preferable that the feature vector generation unit generates a feature vector at an arbitrary timing.
この発明によれば、特徴ベクトルを任意のタイミングで生成することで、適切な特徴ベクトルを生成することができる。よって、選択対象項目、例えばテレビ番組やCDの紹介情報などのコンテンツの最新情報に追従して選択項目に基づくコンテンツ、例えばWebページを取得して、その特徴ベクトルを生成することができる。 According to the present invention, an appropriate feature vector can be generated by generating a feature vector at an arbitrary timing. Therefore, it is possible to acquire the content based on the selection item, for example, a Web page, following the latest information on the selection target item, for example, the introduction information of the TV program or CD, and generate the feature vector.
この発明によれば、ユーザの特徴を示すベクトルにしたがって未知の選択対象項目、例えばコンテンツまたは操作メニュー項目などのレコメンド情報の評価を行うことができ、ユーザの趣味・嗜好など、またアクセス履歴などの直接的な情報に基づいて推薦すべきレコメンド情報を評価することがなく、漏れなくレコメンド情報をユーザに提供することができる。 According to the present invention, it is possible to evaluate recommendation information such as an unknown selection target item, for example, content or an operation menu item, according to a vector indicating the user's characteristics, and the user's hobbies / preferences, access history, etc. The recommendation information to be recommended is not evaluated based on the direct information, and the recommendation information can be provided to the user without omission.
添付図面を参照しながら本発明の実施形態を説明する。可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。 Embodiments of the present invention will be described with reference to the accompanying drawings. Where possible, the same parts are denoted by the same reference numerals, and redundant description is omitted.
図1は、本実施形態の携帯電話機100および情報配信サーバ200を備えたレコメンド情報配信システムのシステム構成を示すシステム構成図である。携帯電話機100からの要求に応じて情報配信サーバ200は、予め記憶されているレコメンド情報となるコンテンツを、携帯電話機100に配信する。配信されるレコメンド情報は、携帯電話機100のユーザのアクセス履歴に基づいて編集されたものであり、ユーザにとって必要と思われる情報である。なお、この情報配信サーバ200は、携帯電話機100からのアクセス要求に応じて、他のコンテンツプロバイダからコンテンツを取得し、取得したコンテンツを配信するものであり、アクセス履歴はこのときに収集される。また、携帯電話機100がアクセス履歴を送信し、それを取得するように構成されてもよい。
FIG. 1 is a system configuration diagram illustrating a system configuration of a recommended information distribution system including a
このような情報配信サーバ200の構成について、図2を用いて説明する。図2は、情報配信サーバ200の機能構成を示すブロック図である。この情報配信サーバ200は、コンテンツ要求受信部201(受付手段)、レコメンド要求受信部202、履歴クラス分離部203(分離平面生成手段)、ユーザ特性ベクトル計算部204(ユーザ特性ベクトル生成手段)、配信情報格納部205、コンテンツ評価部206(評価手段)、履歴格納部207(特徴ベクトル記憶手段、履歴記憶手段)、コンテンツ送信部208、および特徴ベクトル生成部209(特徴ベクトル生成手段)を含んで構成されている。
The configuration of such an
図3は、情報配信サーバ200のハードウェア構成図である。図2に示される情報配信サーバ200は、物理的には、図3に示すように、CPU11、主記憶装置であるRAM12及びROM13、入力デバイスであるキーボード及びマウス等の入力装置14、ディスプレイ等の出力装置15、ネットワークカード等のデータ送受信デバイスである通信モジュール16、ハードディスク等の補助記憶装置17などを含むコンピュータシステムとして構成されている。図2において説明した各機能は、図3に示すCPU11、RAM12等のハードウェア上に所定のコンピュータソフトウェアを読み込ませることにより、CPU11の制御のもとで入力装置14、出力装置15、通信モジュール16を動作させるとともに、RAM12や補助記憶装置17におけるデータの読み出し及び書き込みを行うことで実現される。以下、図2に示す機能ブロックに基づいて、各機能ブロックを説明する。
FIG. 3 is a hardware configuration diagram of the
コンテンツ要求受信部201は、携帯電話機100からのコンテンツの要求に応じて、ネットワーク上のコンテンツプロバイダからコンテンツを取得する部分であり、携帯電話機100からコンテンツの要求とそのURLを受信することでアクセス履歴を収集することができる。収集したアクセス履歴(URLなど)は、履歴格納部207に出力される。なお、このコンテンツ要求受信部201は、アクセス履歴として、あるメニュー画面(事象)内において実際にアクセスされたコンテンツ(URL)と、メニュー画面には表示されているものの、実際にアクセスされなかったコンテンツとを区別して収集する。
The content
また、コンテンツ要求受信部201は、アクセス要求だけでなく、携帯電話機100において収集されたアクセス履歴情報を受信し、これを履歴格納部207に出力するようにしてもよい。この場合も同様に、携帯電話機100は、あるメニュー画面において選択されたコンテンツ、選択されなかったコンテンツを区別してアクセス履歴情報として情報配信サーバ200に送信するように構成される。
Further, the content
レコメンド要求受信部202は、携帯電話機100からレコメンド情報の配信要求を、携帯電話機100のユーザのユーザIDとともに受信する部分である。レコメンド要求受信部202は、その配信要求を受信すると、コンテンツ評価部206にその旨を通知し、予め計算されていたユーザ特性ベクトルに基づいて、配信情報格納部205に記憶されているコンテンツの評価を行うよう指示する。なお、変形例として、レコメンド要求のあった旨をユーザ特性ベクトル計算部204に出力し、現時点におけるユーザ特性ベクトルを計算させ、その結果をコンテンツ評価部206に通知し、コンテンツ送信部208にレコメンド情報の配信を行わせるようにしてもよい。
The recommendation
履歴クラス分離部203は、履歴格納部207(閲覧履歴テーブル207c:履歴記憶手段)に記憶されている閲覧履歴情報に含まれているコンテンツの特徴ベクトルに基づいて、あるユーザが閲覧したコンテンツをコンテンツ特徴ベクトル管理テーブル207bに記憶されている特徴ベクトルより構成される特徴空間で満足クラスと不満足クラスとに分離するための分離平面を生成する部分である。ここで、満足クラスとは、あるコンテンツにアクセスするためのメニュー画面において選択可能に表示された複数のコンテンツのうち、実際に選択されたコンテンツのみを含んだクラスをいい、不満足クラスとは、そのメニュー画面において選択されなかったコンテンツのみを含んだクラスをいう。この履歴クラス分離部203は、SVM法またはNN法を用いて、各コンテンツの特徴ベクトルを満足クラスと不満足クラスとに分離することができる分離平面を生成することで、これらクラスを分離することができる。ここでSVM(Support Vector Machine)法とは、それぞれのクラスのノード間(特徴ベクトル間)の最小距離を最大化する平面を分離平面とする方法であり、NN法とは、それぞれのクラスの重心間、すなわち各コンテンツの特徴ベクトルに基づいて算出された、満足クラスの重心と不満足クラスの重心とを結んだ直線を垂線とする平面を分離平面とする方法である。なお、NN法においては、必ずしも分離平面を求める必要はなく、不満足クラスの重心から満足クラスへの重心へ結んだ直線をユーザ特性ベクトルとするようにしてもよい。
The history
ここで分離平面を生成する具体的な方法について説明する。図4は、携帯電話機100に表示されるメニュー画面の一例を示す説明図である。図4に示すようにNode1〜Node5が表示されている。このNodeは、選択対象項目を示すものであり、例えばウェブ上のメニュー画面におけるカテゴリごとに区別された項目であったり、Webページなどの文書情報のタイトルである。例えば、Node1が、自動車に関するコンテンツ、Node2が、金融に関するコンテンツなどである。ユーザは、Node1〜Node5のいずれかを選択することにより、対応するコンテンツを閲覧することができる。
Here, a specific method for generating the separation plane will be described. FIG. 4 is an explanatory diagram illustrating an example of a menu screen displayed on the
図5は、分離平面を生成するときの処理概念を示す概念図である。図5は、上述図4におけるメニュー画面のうちユーザが選択したコンテンツおよび選択されなかったコンテンツにおける、特徴空間内における各コンテンツの特徴ベクトルの位置関係を示す。図5に示されている通り、円形で示されている部分が満足なコンテンツ(Node3、Node4)であり、三角形で示されている部分が不満足なコンテンツ(Node1、Node2、Node5)であり、四角形で示されている部分が未知の未評価コンテンツ(Node8、Node7)である。これら満足コンテンツと不満足コンテンツとを分離するように生成されたものが分離平面である。ここでは、未評価コンテンツは分離処理する際には考慮されない。なお、図においては、特徴空間を便宜上二次元平面で表現しているが、ベクトルを構成するパラメータ分だけベクトル軸が存在することになり、通常は20次元以上のベクトルで特徴空間は構成されている。 FIG. 5 is a conceptual diagram showing a processing concept when generating a separation plane. FIG. 5 shows the positional relationship between the feature vectors of each content in the feature space for the content selected by the user and the content not selected on the menu screen in FIG. As shown in FIG. 5, the parts indicated by circles are satisfactory contents (Node3, Node4), and the parts indicated by triangles are unsatisfactory contents (Node1, Node2, Node5), and are rectangular. The parts indicated by are unknown unevaluated contents (Node8, Node7). A separation plane is generated so as to separate the satisfactory content and the unsatisfied content. Here, the unevaluated content is not taken into consideration when the separation process is performed. In the figure, the feature space is represented by a two-dimensional plane for convenience. However, there are vector axes corresponding to the parameters constituting the vector, and the feature space is usually composed of vectors of 20 dimensions or more. Yes.
ユーザ特性ベクトル計算部204は、特徴ベクトル生成部209により生成された特徴ベクトルで構成された特徴ベクトル空間における、履歴クラス分離部203により生成された分離平面に対して直交する直交ベクトルを算出し、これをユーザ特性ベクトルとする部分である。図6にその具体例を示す。図6は、分離平面に基づいてユーザ特性ベクトルを算出し、さらにユーザ特性ベクトルに基づいて評価を行うときの概念を示す概念図である。図6に示すように、分離平面に直交する直交ベクトルであるユーザ特性ベクトルwが、ユーザ特性ベクトル計算部204により算出される。ユーザ特性ベクトル計算部204は、閲覧履歴が収集されるたびに計算され、ユーザ特性ベクトル管理テーブル207aに記憶されているユーザ特性ベクトルを更新させる。
The user characteristic
配信情報格納部205は、配信対象であるコンテンツ(レコメンド情報)およびその管理情報を記憶する部分であり、コンテンツ管理テーブル205aを記憶している。図7は、コンテンツ管理テーブル205aの記憶内容を示す説明図である。図7に示すように、このコンテンツ管理テーブル205aは、コンテンツID、カテゴリ、タイトル、およびレコメンド本文を対応付けて記憶している。コンテンツIDは、コンテンツを一意に特定するための識別情報であり、カテゴリは情報種別を示し、例えばCDに関連するもの、DVDに関連するもの、書籍に関連するもの、テレビ番組に関連するものなどを示すための情報である。タイトルは、レコメンド情報として表示するための見出し情報である。レコメンド情報を配信する際には、このタイトル部分が表示されることになる。レコメンド文は、レコメンド情報の本体部分であり、ユーザに有用な情報である。このコンテンツ管理テーブル205aに記憶される情報は、予めオペレータにより入力されたものでもよいし、自動的にコンテンツプロバイダから検索・抽出され所定のフィルターにより絞り込まれたものであってもよい。
The distribution
コンテンツ評価部206は、レコメンド要求受信部202によりレコメンドの要求が受信されると、配信情報格納部205に記憶されているコンテンツに対して、ユーザ特性ベクトル計算部204により計算されたユーザ特性ベクトルに基づいて評価し、そして評価の高い順にコンテンツのタイトルを並べたレコメンド情報を生成する部分である。具体的には、このコンテンツ評価部206は、ユーザ特性ベクトルと各コンテンツの特徴ベクトルとの内積を計算することにより評価値を算出し、その評価値の高い順にコンテンツのタイトルを並べたレコメンド情報を生成する。
When the recommendation request is received by the recommendation
概念的には、つぎの通りとなる。例えば、図6では、Node7およびNode8がコンテンツ管理テーブル205aに記憶された情報であるとして、未知のコンテンツとして扱われている。ここで、Node7およびNode8からユーザ特性ベクトルwに対して垂線をおろした点がユーザ特性ベクトルwに対する評価点となる。この垂線とユーザ特性ベクトルとの交点の位置が上位にある順にコンテンツ(タイトル部分)を表示するようにレコメンド情報を生成する。なお、分離平面を基準に、表示または非表示とするようにしてもよい。例えば、Node8からの垂線との交点は、分離平面を基準にした場合、それよりも上位に位置しているため、ユーザにとって評価は高いと判断されレコメンド情報として選択される。一方、Node7は基準より下にあるため、評価は低く、レコメンド情報として選択されない、というようなレコメンド情報としてもよい。 Conceptually, it is as follows. For example, in FIG. 6, Node 7 and Node 8 are treated as unknown content, assuming that the information is stored in the content management table 205a. Here, the point perpendicular to the user characteristic vector w from Node 7 and Node 8 is the evaluation point for the user characteristic vector w. The recommendation information is generated so that the content (title portion) is displayed in the order in which the position of the intersection of the perpendicular and the user characteristic vector is higher. Note that display or non-display may be performed with reference to the separation plane. For example, since the intersection with the perpendicular from Node 8 is positioned higher than the separation plane as a reference, it is determined that the evaluation is high for the user and is selected as recommendation information. On the other hand, since Node 7 is below the standard, the evaluation is low, and it may be recommended information that is not selected as recommended information.
履歴格納部207は、各履歴情報を記憶する部分であり、ユーザ特性ベクトル管理テーブル207a、コンテンツ特徴ベクトル管理テーブル207b、および閲覧履歴テーブル207cを記憶している。
The
ユーザ特性ベクトル管理テーブル207aは、ユーザ特性ベクトル計算部204により計算されたユーザ特性ベクトルを、ユーザを特定するためのユーザIDと対応付けて記憶する部分である。
The user characteristic vector management table 207a is a part that stores the user characteristic vector calculated by the user characteristic
コンテンツ特徴ベクトル管理テーブル207bは、コンテンツ管理テーブル205aに記憶されているコンテンツの特徴ベクトルを、そのコンテンツを特定するための情報(例えばコンテンツID、URLなど)と対応付けて記憶する部分である。このコンテンツ特徴ベクトルは、ユーザがアクセスしたときにそのコンテンツとともに、コンテンツ要求受信部201により取得されるもの、レコメンド情報を登録するときにそのオペレータにより設定されたものである。例えば、コンテンツ特徴ベクトル管理テーブル207bは、図8に示される情報が記憶されている。図8に示すように、コンテンツIDと対応付けて、特徴ベクトルを構成するパラメータが複数記憶されている。図8では、8個のパラメータを記載しているが、通常はさらに多くのパラメータから特徴ベクトルは構成されている。なお、規定のパラメータ以外に、コンテンツごとに形態素解析にしたがって抽出されたキーワードをパラメータとして追加するようにしてもよい。特徴ベクトルを構成するパラメータごとに、0から1の間で数値が記述されており、どの特徴ベクトルに特徴を持たせているかを表している。
The content feature vector management table 207b is a part that stores the feature vectors of content stored in the content management table 205a in association with information (for example, content ID, URL, etc.) for specifying the content. The content feature vector is acquired by the content
閲覧履歴テーブル207cは、コンテンツ要求受信部201により受信されたあて先または収集されたアクセス履歴情報を記憶する部分であり、例えば、コンテンツID(またはコンテンツのURL)およびそのコンテンツ(閲覧されたもの、閲覧されていないものそれぞれ)の特徴ベクトルを対応付けて記憶する部分である。このコンテンツの特徴ベクトルは、コンテンツ要求受信部201により取得されるコンテンツとともに取得されるものである。
The browsing history table 207c is a part for storing the destination or collected access history information received by the content
コンテンツ送信部208は、コンテンツ要求受信部201により受信されたコンテンツ要求またはレコメンド要求受信部202により受信されたレコメンド要求に応じて取得されたコンテンツを送信する部分である。例えば、コンテンツ送信部208は、コンテンツ要求受信部201により受信されたコンテンツ要求に応じて取得されたコンテンツを送信し、またレコメンド要求受信部202に応じて配信情報格納部205に記憶されているコンテンツに基づいてコンテンツ評価部206による評価結果にしたがって生成されたレコメンド情報を送信する。
The
特徴ベクトル生成部209は、Webページ等の文書情報からコンテンツ情報を収集し、収集したコンテンツ情報に対してキーワード解析を行って、その特徴ベクトルを計算することで、コンテンツの特徴ベクトルを生成する部分である。なお、文書情報には、Webページのほか、ワープロデータ(ワードプロセッサにより作成されたデータ)、表計算データ(表計算アプリケーションにより作成されたデータ)、PDFデータなどの解析可能な文書が記述された情報が含まれる。詳細な処理は以下の通りとおりである。そして、特徴ベクトル生成部209は、生成した特徴ベクトルを用いて、コンテンツ特徴ベクトル管理テーブル207bまたは必要に応じて閲覧履歴テーブル207cに記憶されている特徴ベクトルを更新する。
A feature
ここで特徴ベクトルを生成する具体的な方法について説明する。図23は、特徴ベクトルの計算処理を示すフローチャートである。図23に示すように、まずコンテンツ情報収集部209aによりWebページからコンテンツ情報(例えばWebページ)が収集される(S501)。
Here, a specific method for generating a feature vector will be described. FIG. 23 is a flowchart showing a feature vector calculation process. As shown in FIG. 23, first, content information (for example, a web page) is collected from a web page by the content
そして、収集されたコンテンツ情報は、特徴キーワード抽出部209bにより形態素解析のアルゴリズムにより品詞毎(名詞、固有名詞、動詞、助詞など)に分類される(S502)。そして、このコンテンツ情報から、当該コンテンツ情報の属性に従った特徴的なキーワードが特徴抽出アルゴリズムにより抽出される(S503)。この特徴キーワード抽出部209bの特徴抽出アルゴリズムは、TF/IDF法またはPMM法を用いて、コンテンツ情報の属性毎に特徴的なキーワードを品詞毎に抽出することができる。
The collected content information is classified into parts of speech (nouns, proper nouns, verbs, particles, etc.) by the feature
ここで、TF/IDF法とは、ある文書での出現頻度が高い単語のうち他の文書にはあまり出現し無いものをその文書に特徴的な単語とする方法であり、PMM(Parametric Mixture Model)法とは、多重トピックを有する文書の確率モデルを構成することにより、ある文書から多重トピックを同時に抽出する方法である。なお、特徴抽出アルゴリズムにおいては、必ずしもTF/IDF法またはPMM法を用いて抽出する必要はない。 Here, the TF / IDF method is a method in which words that do not frequently appear in other documents among words that appear frequently in a document are used as a characteristic word in the document. PMM (Parametric Mixture Model) ) Method is a method of simultaneously extracting multiple topics from a document by constructing a probabilistic model of documents having multiple topics. In the feature extraction algorithm, it is not always necessary to extract using the TF / IDF method or the PMM method.
抽出されたキーワードに基づいて、特徴ベクトル計算部209cにより特徴ベクトルが生成される(S504)。この生成された特徴ベクトルはコンテンツ特徴ベクトル管理テーブル207bに記憶される。
A feature vector is generated by the feature
特徴ベクトル生成部209は、Webページの情報が更新されるたび、または任意のタイミングで特徴ベクトル管理テーブル207bまたは必要に応じて閲覧履歴テーブル207cに記憶されている特徴ベクトルを更新させる。
The feature
このように構成された情報配信サーバ200は、携帯電話機100からの要求に応じて、ユーザ特性ベクトルに基づいて評価されたレコメンド情報を配信することができる。よって、嗜好・趣味などの情報を登録する必要はなく、またアクセスしたコンテンツに直接的に関連するコンテンツのみを抽出することがなく、漏れのないレコメンド情報を配信することを可能とする。
The
つぎに、携帯電話機100について説明する。図9は、携帯電話機100の機能構成を示すブロック図である。図9に示すとおり、携帯電話機100は、ブラウザ101、履歴送信部102、レコメンド要求送信部103、および配信情報表示部104を含んで構成されている。この携帯電話機100は、CPU、RAM、ROMなどのハードウェアにより構成されており、記憶されているプログラムにしたがってCPUは動作するよう構成されている。具体的には、情報配信サーバ200と同様の構成をとるものであって、図3に示されるハードウェア構成により実現される。以下、各構成について説明する。
Next, the
ブラウザ101は、インターネットに接続するためのアプリケーション部分であり、インターネット上に配置されているサイトに対してアクセスし、サイトに保持されているコンテンツをユーザに閲覧可能にさせるものである。このブラウザ101は、アクセス履歴を保持するように構成される。
The
履歴送信部102は、ブラウザ101を用いてアクセスしたコンテンツのアクセス履歴(同一メニュー画面上において選択されたコンテンツおよび選択されなかったコンテンツを示す情報)を送信する部分である。なお、この履歴送信部102は、情報配信サーバ200側でアクセスのたびに履歴情報を収集する機能を有している場合には、必須の構成ではない。
The
レコメンド要求送信部103は、図示しない操作部をユーザが操作することによりユーザIDとともにレコメンド情報の要求を情報配信サーバ200に送信する部分である。
The recommendation
配信情報表示部104は、ブラウザ101により取得されたメニュー画面およびコンテンツ(Webページ)を表示する部分である。
The distribution
このように構成された携帯電話機100は、ブラウザ101を用いてインターネットにアクセス可能にするとともに、そのアクセス履歴を保持し、履歴送信部102は、情報配信サーバ200からの要求または所定のタイミングでアクセス履歴を送信することができる。
The
つぎに、これら携帯電話機100および情報配信サーバ200の動作について説明する。図10は、携帯電話機100の要求に応じてコンテンツを配信するときの携帯電話機100と情報配信サーバ200との処理を示すシーケンス図である。
Next, operations of the
図10に示すとおり、携帯電話機100におけるブラウザ101からの要求に応じて、コンテンツ送信部208により情報配信サーバ200からメニュー画面が配信される(S101)。携帯電話機100のユーザは、そのメニュー画面から任意の一のコンテンツ(上述Nodeに相当)を選択し、携帯電話機100におけるブラウザ101がこれを受け付けると(S102)、コンテンツの接続要求およびそのあて先でURLが情報配信サーバ200に送信される(S103)。
As shown in FIG. 10, in response to a request from the
情報配信サーバ200では、URLはコンテンツ要求受信部201により受信され、閲覧履歴テーブル207cにアクセス履歴として記憶される。そして、このアクセス履歴に基づいて、ユーザ特性ベクトルの計算がなされ、記憶される(S104)。そして、コンテンツ送信部208によりS103において要求のあったあて先に基づいたコンテンツがコンテンツプロバイダ(図示せず)から取得され、配信される(S105)。なお、ユーザ特性ベクトルの計算処理と、コンテンツの配信処理の順番は逆でもよい。
In the
ここでS104におけるユーザ特性ベクトル計算の詳細に処理について説明する。図11は、ユーザ特性ベクトルの計算処理を示すフローチャートである。図11に示すように、まずコンテンツ要求受信部201により受信されたアクセス要求またはアクセス履歴により示されたアクセス履歴情報が、新たに追加されたアクセス履歴として閲覧履歴テーブル207cに記憶される(S201)。
Here, the process will be described in detail for the user characteristic vector calculation in S104. FIG. 11 is a flowchart showing the calculation process of the user characteristic vector. As shown in FIG. 11, first, access history information indicated by an access request or access history received by the content
そして、履歴クラス分離部203により、この閲覧履歴テーブル207cに記憶されているアクセス履歴情報に基づいて、各満足クラスまたは不満足クラスに属するコンテンツの特徴ベクトルが抽出される(S202)。そして、履歴クラス分離部203により、これら特徴ベクトルに基づいて満足クラスと不満足クラスとを分離するための分離平面が生成される(S202)。つぎに、ユーザ特性ベクトル計算部204により、生成された分離平面に直交する直交ベクトルが計算され、ユーザ特性ベクトルが求められる(S204)。ここで求められたユーザ特性ベクトルは、ユーザ特性ベクトル管理テーブル207aに保持され、レコメンド情報の配信時において配信情報格納部205に記憶されているコンテンツを評価する際に利用される。
Then, based on the access history information stored in the browsing history table 207c, the history
つぎに、本実施形態におけるレコメンド情報を配信するときのそのコンテンツの評価処理について説明する。図12は、レコメンド情報を配信するときのシーケンス図である。図12に示すように、携帯電話機100におけるレコメンド要求送信部103によりユーザIDを含んだレコメンド要求が送信され、このレコメンド要求は情報配信サーバ200におけるレコメンド要求受信部202により受信される(S301)。そして、情報配信サーバ200では、配信情報格納部205に記憶されているコンテンツに対して、コンテンツの評価が行われる(S302)。ここでは、コンテンツ評価部206により、ユーザ特性ベクトルにしたがって評価され、高評価順にコンテンツのタイトルを並べたレコメンド情報が生成される。そして、コンテンツ送信部208により、このように生成されたレコメンド情報が配信される(S303)。
Next, content evaluation processing when distributing recommendation information in the present embodiment will be described. FIG. 12 is a sequence diagram when distributing recommendation information. As shown in FIG. 12, a recommendation request including a user ID is transmitted by the recommendation
ここで、S302のコンテンツ評価についてさらに詳細な処理について説明する。図13は、コンテンツの評価処理を示すフローチャートである。図13に示すように、コンテンツ評価部206により、レコメンド要求とともに送信されたユーザIDに基づいて、ユーザ特性ベクトル管理テーブル207aから、対応するユーザ特性ベクトルが取得される(S401)。つぎに、コンテンツ評価部206により、コンテンツ特徴ベクトル管理テーブル207bから、各コンテンツの特徴ベクトルが取得される(S402)。
Here, further detailed processing for content evaluation in S302 will be described. FIG. 13 is a flowchart showing content evaluation processing. As shown in FIG. 13, the
そして、コンテンツ評価部206により、ユーザ特性ベクトルとコンテンツの特徴ベクトルとの内積が計算される(S403)。コンテンツ評価部206により計算された内積の大きい順に、コンテンツ管理テーブル205aに記憶されているコンテンツIDに対応するタイトルが抽出され、そのタイトルが評価の高い順に並べられることでレコメンド情報が生成される。そして、コンテンツ送信部208により、生成されたレコメンド情報が携帯電話機100に送信される(S404)。
Then, the
このように、ユーザ特性ベクトルにしたがって、レコメンド情報を提供することができ、漏れなくレコメンド情報をユーザに提供することができる。 Thus, according to the user characteristic vector, recommendation information can be provided, and recommendation information can be provided to the user without omission.
<相対空間における分離平面の生成>
以上の分離平面の生成方法は、絶対空間におけるコンテンツの特徴ベクトルにしたがって行われたものであるが、より精度高める方法として、相対的な位置関係を求めた相対空間を利用したものも考えられる。以下、相対空間を用いて分離平面を生成する方法について説明する。なお、このときの処理構成は上述と同様であり、履歴クラス分離部203における処理内容が異なるだけである。
<Generation of separation plane in relative space>
The above generation method of the separation plane is performed in accordance with the feature vector of the content in the absolute space. However, as a method for improving the accuracy, a method using a relative space for which a relative positional relationship is obtained can be considered. Hereinafter, a method for generating the separation plane using the relative space will be described. Note that the processing configuration at this time is the same as that described above, and only the processing content in the history
図14は、履歴事象aと履歴事象bとにおけるメニュー画面の構成例を示し、図14(a)が履歴事象aにおけるメニュー画面を示す図であり、このメニュー画面はNode1からNode3で構成されている。また、図14(b)が履歴事象bにおけるメニュー画面を示す図であり、このメニュー画面はNode6からNode9で構成されている。図14(a)では、Node3が選択されており、図14(b)では、Node9が選択されていることが示されている。 FIG. 14 shows a configuration example of the menu screen in the history event a and the history event b, and FIG. 14A is a diagram showing the menu screen in the history event a. This menu screen is composed of Node1 to Node3. Yes. FIG. 14B is a diagram showing a menu screen in the history event b, and this menu screen is composed of Node 6 to Node 9. FIG. 14A shows that Node 3 has been selected, and FIG. 14B shows that Node 9 has been selected.
図15は、図14で示されたそれぞれのメニュー画面おいて選択されたコンテンツの特徴ベクトルの特徴空間における位置関係を示す図である。図15(a)は、履歴事象aにおいて選択されたコンテンツの特徴空間(絶対空間)、図15(b)は、履歴事象bにおいて選択されたコンテンツの特徴空間(絶対空間)を示す図である。上述と同様に、選択されたコンテンツは満足なコンテンツ、選択されなかったコンテンツは不満足なコンテンツと定義され、それぞれ満足クラス、不満足クラスに分類することができる。 FIG. 15 is a diagram showing the positional relationship in the feature space of the feature vector of the content selected on each menu screen shown in FIG. FIG. 15A shows the feature space (absolute space) of the content selected in the history event a, and FIG. 15B shows the feature space (absolute space) of the content selected in the history event b. . As described above, the selected content is defined as satisfactory content, and the content not selected is defined as unsatisfactory content, and can be classified into a satisfaction class and a dissatisfaction class, respectively.
図16は、それぞれの履歴事象aおよびbを同一特徴空間上に、コンテンツの特徴ベクトルを表した図であって、不満足なコンテンツの特徴ベクトルを原点に取った場合における満足なコンテンツの特徴ベクトルの位置を示す相対空間を表した図である。例えば、Node2とNode3との相対比較、Node1とNode3との相対比較のため、それぞれNode1、Node2を原点とした場合のNode3の位置を表した特徴空間を相対空間としている。より具体的には、Node3の特徴ベクトルからNode1の特徴ベクトルを減算することにより、相対空間を形成することができる。他のNodeについても同様に、対象となるコンテンツの特徴ベクトルを減算する処理を行うことで相対空間を形成することができる。
FIG. 16 is a diagram showing the feature vectors of the contents in the same feature space for the respective history events a and b. When the feature vector of the unsatisfactory content is taken as the origin, the feature vector of the satisfactory content is shown. It is a figure showing the relative space which shows a position. For example, for relative comparison between Node 2 and Node 3 and relative comparison between
この相対空間において、図16に示すようにこのように満足なコンテンツの特徴ベクトル、不満足なコンテンツの特徴ベクトルに基づいて、満足クラスと不満足クラスとに分離するための分離平面が、履歴クラス分離部203により生成される。そして、ユーザ特性ベクトル計算部204により、この分離平面に直交する直交ベクトルであるユーザ特性ベクトルwが計算される。
In this relative space, as shown in FIG. 16, the separation plane for separating the satisfaction class and the unsatisfied class based on the feature vector of the satisfactory content and the feature vector of the unsatisfactory content as shown in FIG. 203. Then, the user characteristic
このように、履歴事象が異なる場合においても、相対空間を利用してユーザ特性ベクトルを生成することができ、より識別性の高いユーザ特性ベクトルを生成することができる。 As described above, even when the historical events are different, the user characteristic vector can be generated using the relative space, and the user characteristic vector with higher discriminability can be generated.
図17は、絶対空間における各コンテンツの特徴ベクトルに基づいて評価を行うときの概念を示した図であり、例えば、配信情報格納部205に記憶されている未知のコンテンツであるNode6〜Node8は、生成されたユーザ特性ベクトルに基づいて評価される。ここでは上述と同様に、コンテンツ評価部206はユーザ特性ベクトルと各コンテンツの特徴ベクトルとの内積を計算することにより、その評価値を算出することができる。概念的には、上述と同様に、ユーザ特性ベクトルに射影した点、すなわち垂線を下ろした点が、そのベクトル方向における上位の順にコンテンツの優先順が決定される。
FIG. 17 is a diagram illustrating a concept when the evaluation is performed based on the feature vector of each content in the absolute space. For example, Node 6 to Node 8 which are unknown contents stored in the distribution
このように相対空間を用いて分離平面を生成し、それによってユーザ特性ベクトルを生成することができる。ところで、図15から図17については、絶対空間として扱っても分離平面を生成することができるが、分離平面を生成することができない特徴ベクトルから構成される特徴空間も考えられる。その場合に、上述した相対空間を利用することにより分離平面を生成することができる。以下、その方法について説明する。 In this way, a separation plane can be generated using the relative space, and thereby a user characteristic vector can be generated. 15 to 17, a separation plane can be generated even if handled as an absolute space, but a feature space composed of feature vectors that cannot generate a separation plane is also conceivable. In that case, the separation plane can be generated by using the relative space described above. The method will be described below.
図18(a)は、絶対空間におけるコンテンツの特徴ベクトルを示した図である。この図18(a)では、Node1とNode4とが同じ事象(メニュー画面)に存在するコンテンツであり、Node2とNode3とが同じ事象に存在するコンテンツであことを前提としている。なお、円形のものが選択されたコンテンツの特徴ベクトル(満足クラス)、三角形のものが選択されなかったコンテンツの特徴ベクトル(不満足クラス)である。 FIG. 18A is a diagram illustrating feature vectors of content in an absolute space. In FIG. 18A, it is assumed that Node1 and Node4 are contents existing in the same event (menu screen), and Node2 and Node3 are contents existing in the same event. In addition, the feature vector (satisfaction class) of the content in which the circular one is selected, and the feature vector (unsatisfied class) of the content in which the triangular one is not selected.
図18(a)から明らかなように、絶対空間においては、このような位置関係をとる特徴ベクトルのコンテンツに対しては、分離平面を生成することができない。分離平面は、満足クラスと不満足クラスとを分離するための平面であるためであり、図18(a)の例では、可不足なく両者を分離することができないためである。よって、分離平面を生成することができるように相対的な位置関係を表す相対空間に変換することが必要である。 As is clear from FIG. 18A, in the absolute space, a separation plane cannot be generated for the content of feature vectors having such a positional relationship. This is because the separation plane is a plane for separating the satisfaction class and the dissatisfaction class, and in the example of FIG. Therefore, it is necessary to convert to a relative space representing a relative positional relationship so that a separation plane can be generated.
図18(b)では、相対空間内におけるコンテンツの特徴ベクトルを表した図であり、Node1およびNode2が同じ位置になるように、図18(b)の例では、Node2を平行移動させるためそのNode2に対応するNode3を平行移動させている。このように相対空間に変換することで、不満足なコンテンツであるNode1(Node2)と、満足なコンテンツであるNode3およびNode4とを分離することができる分離平面vを生成することができる。
FIG. 18B is a diagram showing the feature vector of the content in the relative space. In the example of FIG. 18B, Node 2 is moved in parallel so that
以上の通り絶対空間では、分離平面を生成することができない場合であっても、相対空間に変換することで分離平面を生成することができ、これによりユーザ特性ベクトルを計算することができる。 As described above, even in the case where the separation plane cannot be generated in the absolute space, the separation plane can be generated by converting to the relative space, and thus the user characteristic vector can be calculated.
<閲覧頻度を考慮した分離平面の生成方法>
つぎに、コンテンツの閲覧頻度を用いた重み付け処理を行い、この重み付け処理された特徴ベクトルを用いて分離平面を生成するときの履歴クラス分離部203の処理について説明する。なお、ここでは、NN法を用いた分離平面の生成について説明する。
<Method of generating separation plane considering browsing frequency>
Next, processing of the history
図19は、閲覧頻度を考慮して特徴ベクトルの重心を求める処理を示す概念図でありNodeA〜Cに対応したコンテンツc1〜c3の特徴ベクトルの位置を表す特徴空間を示す概念図である。コンテンツc1の閲覧頻度は3回、コンテンツc2の閲覧頻度は1回、コンテンツc3の閲覧頻度は10回とする。なお、閲覧履歴テーブル207cは、閲覧されたコンテンツの閲覧履歴、閲覧されていないコンテンツの不閲覧履歴を記憶しておくことが好ましく、それぞれの頻度を保持または計算可能に記憶しておくことが必要である。 FIG. 19 is a conceptual diagram illustrating a process for obtaining the center of gravity of a feature vector in consideration of the browsing frequency, and is a conceptual diagram illustrating a feature space representing the positions of the feature vectors of the contents c1 to c3 corresponding to the Nodes A to C. The browsing frequency of the content c1 is 3 times, the browsing frequency of the content c2 is 1 time, and the browsing frequency of the content c3 is 10 times. The browsing history table 207c preferably stores the browsing history of the browsed content and the non-viewing history of the content that has not been browsed, and it is necessary to store each frequency so that it can be held or calculated. It is.
この場合、これらコンテンツc1〜c3の重心は、以下の式(1)により計算される。
なお、ciは閲覧されたコンテンツの特徴ベクトル、niは閲覧頻度である。
In this case, the center of gravity of the contents c1 to c3 is calculated by the following equation (1).
Here, ci is the feature vector of the browsed content, and ni is the browsing frequency.
この計算を行うことにより重心が定まる。また、図示していないが閲覧されていないコンテンツについても同様に式(1)を用いて、閲覧さていないコンテンツの特徴ベクトルを用いてその重心を求める。そして、閲覧されていないコンテンツの重心から閲覧されたコンテンツの重心に対して結んだ直線をユーザ特性ベクトルとして求めることができる。なお、この直線は、分離平面に直交する直線と同じ向きを取るものであり、分離平面を算出し、この分離平面に直交する直交ベクトルを求めるようにしてもよいが、NN法においては必ずしも分離平面は必要とはならない。 By performing this calculation, the center of gravity is determined. Further, for the content that is not shown but is not browsed, the center of gravity is obtained using the feature vector of the content that has not been browsed using Equation (1). Then, a straight line connecting the centroid of the browsed content to the centroid of the browsed content can be obtained as the user characteristic vector. This straight line has the same direction as the straight line orthogonal to the separation plane, and the separation plane may be calculated to obtain an orthogonal vector orthogonal to the separation plane. However, in the NN method, the separation is not necessarily performed. A plane is not required.
これにより、コンテンツの閲覧頻度を利用してユーザ特性ベクトルを求めることができ、閲覧頻度を利用しない場合と比較して、ユーザの嗜好に近いユーザ特性ベクトルを求めることができる。よって、ユーザの嗜好にそったコンテンツの評価を行うことができる。 Thereby, the user characteristic vector can be obtained using the browsing frequency of the content, and the user characteristic vector close to the user's preference can be obtained as compared with the case where the browsing frequency is not used. Therefore, it is possible to evaluate the content according to the user's preference.
<選択順位を考慮した分離平面の生成方法>
つぎに、閲覧したコンテンツの順番を考慮して分離平面を生成するときの履歴クラス分離部203の処理について説明する。一般的に、直近にアクセスしたコンテンツの方が、その前にアクセスしたコンテンツより重要である、またはユーザの嗜好に近いものであると考えることができる。この時間差が大きくなればなるほど、ユーザの嗜好に変化が生じ、より直近にアクセスしたコンテンツを重要と考えることが顕著となる。ここでは、その時間差(時系列成分)を考慮して分離平面を生成するときの処理について説明する。
<Method for generating separation plane in consideration of selection order>
Next, processing of the history
図20は、履歴クラス分離部203が分離平面を生成する際において、そのアクセスされた時系列順にNN法によりユーザ特性ベクトルを生成するときの処理を示す説明図であって、図20(a)は、そのときのメニュー画面を示す説明図であり、図20(b)は、ユーザが選択したコンテンツの選択履歴を示す説明図であり、図20(c)は、特徴空間における各コンテンツの特徴ベクトルを表した概念図であり、図20(d)は、選択順を考慮した分離平面を生成することを説明するための概念図である。なお、選択履歴は、閲覧履歴テーブル207cに記憶される。
FIG. 20 is an explanatory diagram showing processing when the user class vector is generated by the NN method in the accessed time-series order when the history
図20(a)に示されるように、NodeAからNodeFからメニュー画面が構成されている。ここでは図20(b)に示すようにNodeA、NodeB、NodeCの順にコンテンツが選択されている。よって、NodeA、NodeB、NodeCが満足クラスに分類されるコンテンツとなり、NodeD、NodeE、NodeFが不満足クラスに分類されるコンテンツとなる。 As shown in FIG. 20A, a menu screen is configured from Node A to Node F. Here, as shown in FIG. 20B, contents are selected in the order of Node A, Node B, and Node C. Therefore, NodeA, NodeB, and NodeC are contents classified into the satisfaction class, and NodeD, NodeE, and NodeF are contents classified into the dissatisfaction class.
つぎに、図20(c)および図20(d)を用いて、分離平面を生成するときの処理を示す概念について説明する。図20(c)に示されるように、NodeAからNodeFは、その特徴ベクトルにしたがって特徴空間上に位置づけられている。そして、直近に選択したコンテンツの特徴ベクトルの影響が大きくなるように計算される。図20(d)に示されるように、満足クラスにおける重心を求めるため、まず、NodeAとNodeBとの中点w1が計算される。そして、この中点w1とNodeCとの中点w2が計算される。 Next, with reference to FIG. 20C and FIG. 20D, the concept indicating the process when generating the separation plane will be described. As shown in FIG. 20C, Node A to Node F are positioned on the feature space according to their feature vectors. Then, the calculation is performed so that the influence of the feature vector of the most recently selected content is increased. As shown in FIG. 20D, in order to obtain the center of gravity in the satisfaction class, first, the midpoint w1 between Node A and Node B is calculated. Then, a midpoint w2 between the midpoint w1 and NodeC is calculated.
一方、不満足クラスにおいては、NodeD、NodeE、NodeFに基づいて重心w3が計算される。不満足クラスにおいては選択順という概念がないため、通常の処理と同じく、その3つのNodeに基づいた重心w3が計算される。そして、中点w2と重心w3とを結んだ線が垂線となる分離平面vが生成される。なお、本実施形態においてはこの分離平面vに直交する直交ベクトルをユーザ特性ベクトルとするものであり、これは、重心w3から中点w2に向けて結んだ直線と同じである。実施形態での説明の便宜上、分離平面を求めているが、NN法を用いる場合においては分離平面を求めることは必須のものではない。 On the other hand, in the dissatisfied class, the center of gravity w3 is calculated based on NodeD, NodeE, and NodeF. Since there is no concept of selection order in the dissatisfied class, the centroid w3 based on the three nodes is calculated as in the normal processing. Then, a separation plane v in which a line connecting the middle point w2 and the center of gravity w3 is a perpendicular is generated. In the present embodiment, an orthogonal vector orthogonal to the separation plane v is used as a user characteristic vector, which is the same as a straight line connected from the center of gravity w3 toward the middle point w2. For the convenience of explanation in the embodiment, the separation plane is obtained. However, when the NN method is used, obtaining the separation plane is not essential.
このように、特徴ベクトルと特徴ベクトルとの中点を算出し、またその中点と特徴ベクトルとの中点を算出し、時系列的に順に中点を算出する(NN法を適用する)ことにより、前のアクセス履歴ほど重みが小さくなり、時系列順位を考慮した重心を算出することができる。 In this way, the midpoint between the feature vector and the feature vector is calculated, the midpoint between the midpoint and the feature vector is calculated, and the midpoint is calculated sequentially in time series (the NN method is applied). Thus, the weight becomes smaller as the previous access history, and the center of gravity can be calculated in consideration of the time series order.
<操作メニューへの適用>
ところで、上述の各方法では、メニュー画面として、ウエブサイトである情報配信サーバ200から送信されたメニュー画面を例に説明したが、これに限るものではなく、例えば、携帯電話機100の操作メニューに対して、レコメンド情報としてレコメンド操作情報を表示するようにしてもよい。
<Apply to operation menu>
By the way, in each of the above-described methods, the menu screen transmitted from the
例えば、操作メニューにおける各操作項目に対して、特徴ベクトルが割り振られており、ユーザの操作履歴に従って、ユーザ操作に関するユーザ特性ベクトルが生成され、ユーザがレコメンド操作情報の要求を発すると、そのユーザ特性ベクトルに基づいてレコメンド操作情報を生成するようにしてもよい。なお、操作履歴情報は、所定のタイミングで携帯電話機100から情報配信サーバ200に送信され、記憶されるように構成されている。
For example, a feature vector is assigned to each operation item in the operation menu, a user characteristic vector related to the user operation is generated according to the user operation history, and when the user issues a request for recommendation operation information, the user characteristic Recommendation operation information may be generated based on a vector. The operation history information is transmitted from the
図21は、操作に関する特徴空間における特徴ベクトルのパラメータを示す説明図である。図21に示すように、携帯電話機100の端末機能として、「着もじ」「テレビ電話」「ワンセグ」「画面メモ」「テキストメモ」が規定されている。また、特徴ベクトルを構成するパラメータとして「電話」「インターネット」「テキスト」「メモ」「テレビ」が規定されている。このように、携帯電話機100の機能に特徴ベクトルが規定されている。例えば、「着もじ」には、「電話」「テキスト」のパラメータに1がふられており、電話、テキストに関連のある機能であることが示されている。配信情報格納部205には、全ての端末機能情報が記憶され、ユーザが操作メニューを表示する操作をするときには、その旨が通知され、コンテンツ評価部206は、操作情報の評価を行って適切なレコメンド操作情報を生成し、コンテンツ送信部208は、レコメンド操作情報を送信し、携帯電話機100においてそれを表示させることができる。
FIG. 21 is an explanatory diagram illustrating feature vector parameters in a feature space related to an operation. As shown in FIG. 21, “Chaku-moji”, “Videophone”, “One Seg”, “Screen Memo”, and “Text Memo” are defined as the terminal functions of the
このように操作メニューに対しても本実施形態の評価方法を適用し、レコメンド操作情報をユーザに提供することで、ユーザがよく使う操作に類似または関連した操作をユーザに通知することができる。 As described above, by applying the evaluation method of the present embodiment to the operation menu and providing the recommended operation information to the user, it is possible to notify the user of an operation similar or related to the operation frequently used by the user.
また、情報配信サーバ200に接続することなく、携帯電話機内で処理を行うことも考えられる。図22は、レコメンド操作情報を表示することができる携帯電話機100aの機能を示すブロック図である。このハードウェア構成は図3と同じである。
It is also conceivable to perform processing within the mobile phone without connecting to the
この携帯電話機100aは、操作部101a、レコメンド操作表示部104a、履歴クラス分離部105、ユーザ特性ベクトル計算部106、操作情報評価部107、操作情報格納部108、および履歴格納部109を含んで構成されている。
The mobile phone 100a includes an
以下、各構成について説明する。操作部101aは、携帯電話機100aに搭載されている各機能を実行するための部分であり、テンキー、タッチパネルなどで構成されている。
Each configuration will be described below. The
レコメンド操作表示部104aは、レコメンド操作情報を表示する部分であり、後述するようにユーザの操作履歴に従って定められたユーザにとって未知の操作を示すレコメンド操作情報を表示する部分である。
The recommendation
履歴クラス分離部105、ユーザ特性ベクトル計算部106、操作情報評価部107、操作情報格納部108、および履歴格納部109は、それぞれ図2にて示されている情報配信サーバ200の履歴クラス分離部203、ユーザ特性ベクトル計算部204、配信情報格納部205、コンテンツ評価部206および履歴格納部207に相当するものであり、履歴クラス分離部105において、同一操作メニュー内において操作された機能、操作されていない機能をそれぞれ満足機能、不満足機能に分離する分離平面を生成し、ユーザ特性ベクトル計算部106は、生成された分離平面に直交する直交ベクトルをユーザ特性ベクトルとする。操作情報評価部107は、計算されたユーザ特性ベクトルにしたがって、各機能特徴ベクトルに基づいて評価をし、高評価の機能については、操作メニュー上に表示するようにそのメニュー画面を編集する。ユーザは、操作メニューを表示させるときには、その操作メニュー上でその高評価された機能を確認することができる。
The history
つぎに、本実施形態の携帯電話機100および情報配信サーバ200の作用効果について説明する。情報配信サーバ200において、所定のタイミングで、特徴ベクトル生成部209は、Webページなどのコンテンツを収集し、そのコンテンツの特徴を示すキーワードを抽出して、特徴ベクトルを生成する。生成した特徴ベクトルは、コンテンツ特徴ベクトル管理テーブル207bに記憶され、更新される。
Next, functions and effects of the
この収集のタイミングは、任意のタイミングや、Webページが更新されたタイミング(これは更新通知信号を受信するなどして)である。このように任意のタイミングで収集処理、特徴ベクトル生成処理が行われることで、選択対象項目、例えばテレビ番組やCDの紹介情報などのコンテンツの最新情報に追従して選択項目に基づくコンテンツ、例えばWebページを取得して、その特徴ベクトルを生成することができる。 The collection timing is an arbitrary timing or a timing at which the Web page is updated (for example, by receiving an update notification signal). In this way, collection processing and feature vector generation processing are performed at an arbitrary timing, so that content based on the selection item, for example, Web, follows the latest information on the selection target item, for example, TV program or CD introduction information. A page can be acquired and its feature vector can be generated.
一方、携帯電話機100において、ユーザがブラウザを操作することにより、メニュー画面が表示され、Node1〜Node5などのコンテンツを表す複数の選択対象項目が表示される。そして、ユーザ操作により、これらコンテンツから任意の一のコンテンツを選択すると、携帯電話機100は情報配信サーバ200に選択されたコンテンツおよび選択されなかったコンテンツを送信し、情報配信サーバ200(コンテンツ要求受信部201)はこれを受け付ける。コンテンツ要求受信部201は、選択されたコンテンツを、コンテンツプロバイダから取得し、コンテンツ送信部208はこれを携帯電話機100に送信する。
On the other hand, in the
また、閲覧履歴テーブル207cは、選択されたコンテンツの特徴ベクトルおよび選択されなかったコンテンツの特徴ベクトルを記憶する。履歴クラス分離部203は、閲覧履歴テーブル207cに記憶されている選択されたコンテンツの特徴ベクトルと選択されなかったコンテンツの特徴ベクトルとを、特徴空間内で分離するための分離平面を生成する。そして、ユーザ特性ベクトル計算部204は、生成された分離平面に直交する直交ベクトルに基づいてユーザ特性ベクトルを生成し、これをユーザ特性ベクトル管理テーブル207aに記憶させる。その後、レコメンド要求をレコメンド要求受信部202が受信すると、コンテンツ評価部206は、記憶されているユーザ特性ベクトルに基づいて、コンテンツの評価を行う。
Also, the browsing history table 207c stores the feature vector of the selected content and the feature vector of the content that has not been selected. The history
これにより、ユーザの特徴を示すベクトルにしたがってコンテンツの評価を行うことができ、ユーザの趣味・嗜好など、またアクセス履歴などの直接的な情報に基づいて推薦すべきコンテンツを評価することがなく、漏れのないコンテンツをユーザに提供することができる。また、ユーザが潜在的に望んでいるコンテンツなどのレコメンド情報を漏れなく配信することができるようになる。すなわち、選択対象項目、例えばテレビ番組やCDの紹介情報などのコンテンツの種類に応じて特徴ベクトルが更新されることにより、コンテンツの種類に特化されたレコメンド情報をユーザに提供することができる。 Thereby, it is possible to evaluate the content according to the vector indicating the user's characteristics, without evaluating the content to be recommended based on the user's hobbies / preferences, direct information such as the access history, Content without omission can be provided to the user. In addition, recommendation information such as contents that the user potentially desires can be distributed without omission. In other words, the feature vector is updated according to the type of content such as the selection target item, for example, TV program or CD introduction information, so that recommendation information specialized to the type of content can be provided to the user.
また、本実施形態の情報配信サーバ200は、履歴クラス分離部203は、選択されなかった全てのコンテンツの特徴ベクトルと選択されたコンテンツの特徴ベクトルとの相対的な位置関係を算出し、当該位置関係に基づいて分離平面を生成することが好ましい。すなわち、選択されなかったまたは選択されたコンテンツの特徴ベクトルに、他の特徴ベクトルを重ねるようその位置関係を計算し、相対空間を形成し、その相対空間において分離平面を生成することが好ましい。これにより、相対的な位置関係を表す相対空間内で分離平面を生成し、これ基づいてユーザ特性ベクトルを生成することができるため、より精度の高いコンテンツの評価を行うことができる。
Further, in the
また、本実施形態の情報配信サーバ200において、閲覧履歴テーブル207cは、コンテンツの閲覧頻度および閲覧されていない不閲覧頻度を記憶しておく。なお、このような閲覧頻度、不閲覧頻度を記憶することなく、閲覧履歴に基づいて閲覧頻度、不閲覧頻度を必要に応じて計算するようにしてもよい。そして、閲覧頻度の高いコンテンツの特徴ベクトルにその頻度に応じた重み付けを行うとともに、不閲覧頻度の高いコンテンツの特徴ベクトルにその頻度に応じた重み付けを行い、その重み付けされた特徴ベクトルに基づいて、満足クラスと不満足クラスとに分離するための分離平面を生成することができる。これにより、頻度に応じてユーザ特性ベクトルを算出することができ、より精度のよいユーザ特性ベクトルを算出し、よってコンテンツの評価をより正確に行うことができる。
In the
また、本実施形態の情報配信サーバ200において、コンテンツ管理テーブル205aは、メニュー画面における各コンテンツを選択した時期を、そのコンテンツの特徴ベクトルとともに記憶し、選択時期の新しさの度合いに応じて重み付けされたコンテンツの特徴ベクトルに基づいて分離平面を生成することができる。例えば、NN法においては、時間的に古いコンテンツの特徴ベクトルから順にその重心を求めていくことにより、結果的に選択時期の新しさの度合いに応じた重み付け処理がなされることになる。これにより時系列成分を考慮した重み付けを行うことができ、より精度のよいコンテンツの評価を行うことができる。
In the
また、本実施形態の情報配信サーバ200において、コンテンツ送信部208は、コンテンツ評価部206による評価結果に従って生成されたレコメンド情報を送信することにより、ユーザは役立つ情報を取得することができる。
In the
また、本実施形態の情報配信サーバ200において、特徴ベクトル生成部209は、更新するために必要な情報を選択項目対象であるWebページから取得する。よって、適切な特徴ベクトルを生成することができる。
Further, in the
また、本実施形態の情報配信サーバ200において、特徴ベクトル生成部209は、選択対象項目の属性毎に特徴的な単語を品詞毎に抽出する特徴キーワード抽出部209bを備え、特徴キーワード抽出部209bにより抽出されたキーワードに基づいて、特徴ベクトル計算部209cは、特徴ベクトルを計算することができる。
In the
この発明によれば、選択対象項目の属性毎に特徴的なキーワードを品詞に毎に抽出し、抽出されたキーワードに基づいて、特徴ベクトルを生成することで、適切な特徴ベクトルを生成することができる。 According to the present invention, a characteristic keyword is extracted for each part of speech for each attribute of the selection target item, and an appropriate feature vector can be generated by generating a feature vector based on the extracted keyword. it can.
この特徴キーワード抽出部209bは、TF/IDF法に基づいて、選択対象項目の属性毎に特徴的なキーワードを抽出してもよいし、また、PMM法に基づいて、選択対象項目の属性毎に特徴的なキーワードを抽出するようにしてもよい。
The feature
100…携帯電話機、100a…携帯電話機、101…ブラウザ、101a…操作部、102…履歴送信部、103…レコメンド要求送信部、104…配信情報表示部、104a…レコメンド操作表示部、105…履歴クラス分離部、106…ユーザ特性ベクトル計算部、107…操作情報評価部、108…操作情報格納部、109…履歴格納部、200…情報配信サーバ、201…コンテンツ要求受信部、202…レコメンド要求受信部、203…履歴クラス分離部、204…ユーザ特性ベクトル計算部、205…配信情報格納部、205a…コンテンツ管理テーブル、206…コンテンツ評価部、207…履歴格納部、207a…ユーザ特性ベクトル管理テーブル、207b…コンテンツ特徴ベクトル管理テーブル、207c…閲覧履歴テーブル、208…コンテンツ送信部、209…特徴ベクトル生成部。
DESCRIPTION OF
Claims (9)
前記特徴ベクトル生成手段により生成された特徴ベクトルを記憶する特徴ベクトル記憶手段と、
ユーザ操作により、複数の選択対象項目から一の選択対象項目を選択することを受け付ける受付手段と、
前記受付手段により受け付けられ、選択された選択対象項目、および選択されなかった選択対象項目を区別して記憶する履歴記憶手段と、
前記履歴記憶手段により記憶された、選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを特徴空間内で分離するための分離平面に直交する直交ベクトルをユーザ特性ベクトルとするユーザ特性ベクトル生成手段と、
前記ユーザ特性ベクトル生成手段により生成されたユーザ特性ベクトルに基づいて、未知の選択対象項目の評価を行う評価手段と、を備え、
前記特徴ベクトル生成手段は、生成した特徴ベクトルに基づいて、前記特徴ベクトル記憶手段に記憶されている特徴ベクトルを更新することを特徴とするレコメンド情報評価装置。 Feature vector generating means for generating a feature vector constituting the feature space of the selection target item;
Feature vector storage means for storing the feature vector generated by the feature vector generation means;
Accepting means for accepting selection of one selection target item from a plurality of selection target items by a user operation;
A history storage means for distinguishing and storing selected selection target items and unselected selection target items received by the reception means;
The orthogonal vector orthogonal to the separation plane for separating the satisfactory feature vector of the selected selection target item and the unsatisfactory feature vector of the unselected selection target item stored in the history storage means in the feature space. User characteristic vector generating means as a characteristic vector;
Evaluation means for evaluating an unknown selection target item based on the user characteristic vector generated by the user characteristic vector generation means,
The feature vector generation unit updates the feature vector stored in the feature vector storage unit based on the generated feature vector.
前記ユーザ特性ベクトル生成手段は、前記分離平面生成手段により生成された分離平面に従ってユーザ特性ベクトルを生成することを特徴とする
請求項1に記載のレコメンド情報評価装置。 Separation plane generating means for generating a separation plane for separating in the feature space the satisfaction feature vector of the selected selection target item stored in the history storage means and the unsatisfactory feature vector of the selection target item that has not been selected. Further comprising
The recommendation information evaluation apparatus according to claim 1, wherein the user characteristic vector generation unit generates a user characteristic vector according to the separation plane generated by the separation plane generation unit.
前記特徴抽出手段により抽出された単語に基づいて、特徴ベクトルを生成することを特徴とする請求項1から4のいずれか一項に記載のレコメンド情報評価装置。 The feature vector generation means further includes feature extraction means for extracting a characteristic word for each part of speech for each attribute of the selection target item,
The recommendation information evaluation apparatus according to claim 1, wherein a feature vector is generated based on the word extracted by the feature extraction unit.
前記特徴ベクトル生成ステップにおいて生成された特徴ベクトルを特徴ベクトル記憶手段に記憶する特徴ベクトル記憶ステップと、
ユーザ操作により、複数の選択対象項目から一の選択対象項目を選択することを受け付ける受付ステップと、
前記受付ステップにおいて受け付けられ、選択された選択対象項目および選択されなかった選択対象項目を履歴記憶手段に記憶する履歴記憶ステップと、
前記履歴記憶手段に記憶された、選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを、特徴空間内で分離するための分離平面に直交する直交ベクトルに基づいてユーザ特性ベクトルを生成するユーザ特性ベクトル生成ステップと、
前記ユーザ特性ベクトル生成ステップにより生成されたユーザ特性ベクトルに基づいて、レコメンド情報の評価を行う評価ステップと、を備え、
前記特徴ベクトル生成ステップは、生成した特徴ベクトルに基づいて、前記特徴ベクトル記憶手段に記憶された特徴ベクトルを更新することを特徴とするレコメンド情報評価方法。 A feature vector generation step for generating a feature vector constituting the feature space of the selection target item;
A feature vector storage step of storing the feature vector generated in the feature vector generation step in a feature vector storage means;
A reception step for accepting selection of one selection target item from a plurality of selection target items by a user operation;
A history storage step of storing in the history storage means the selected selection target item and the non-selected selection target item received in the reception step;
An orthogonal vector orthogonal to a separation plane for separating the satisfaction feature vector of the selected selection target item and the unsatisfactory feature vector of the selection target item not selected, stored in the history storage unit, in the feature space. Generating a user characteristic vector based on the user characteristic vector generating step;
An evaluation step for evaluating recommendation information based on the user characteristic vector generated by the user characteristic vector generation step, and
In the feature vector generation step, the feature vector stored in the feature vector storage unit is updated based on the generated feature vector.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009022880A JP2010181966A (en) | 2009-02-03 | 2009-02-03 | Device and method for evaluating recommendation information |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009022880A JP2010181966A (en) | 2009-02-03 | 2009-02-03 | Device and method for evaluating recommendation information |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010181966A true JP2010181966A (en) | 2010-08-19 |
Family
ID=42763529
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009022880A Pending JP2010181966A (en) | 2009-02-03 | 2009-02-03 | Device and method for evaluating recommendation information |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010181966A (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012064166A (en) * | 2010-09-17 | 2012-03-29 | Kddi Corp | Content creation device and content creation method |
JP2014203442A (en) * | 2013-04-10 | 2014-10-27 | 株式会社Nttドコモ | Recommendation information generation device and recommendation information generation method |
WO2015029809A1 (en) * | 2013-08-29 | 2015-03-05 | 日本電気株式会社 | Data analysis method, program, and apparatus |
CN111737582A (en) * | 2020-07-29 | 2020-10-02 | 腾讯科技(深圳)有限公司 | Content recommendation method and device |
JP2021033602A (en) * | 2019-08-23 | 2021-03-01 | Kddi株式会社 | Information processing device, vector generation method, and program |
WO2021153505A1 (en) * | 2020-01-28 | 2021-08-05 | 株式会社電通 | Prediction device, prediction method, and prediction program |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003036262A (en) * | 2001-07-23 | 2003-02-07 | Nippon Telegr & Teleph Corp <Ntt> | Important sentence extraction method, device, program, and recording medium recorded with the program |
JP2007018389A (en) * | 2005-07-08 | 2007-01-25 | Just Syst Corp | Data retrieval apparatus, data retrieving method, data retrieval program, and computer readable recording medium |
JP2009009184A (en) * | 2007-06-26 | 2009-01-15 | Sony Corp | Information processor and processing method, and program |
-
2009
- 2009-02-03 JP JP2009022880A patent/JP2010181966A/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003036262A (en) * | 2001-07-23 | 2003-02-07 | Nippon Telegr & Teleph Corp <Ntt> | Important sentence extraction method, device, program, and recording medium recorded with the program |
JP2007018389A (en) * | 2005-07-08 | 2007-01-25 | Just Syst Corp | Data retrieval apparatus, data retrieving method, data retrieval program, and computer readable recording medium |
JP2009009184A (en) * | 2007-06-26 | 2009-01-15 | Sony Corp | Information processor and processing method, and program |
Non-Patent Citations (2)
Title |
---|
CSNH200700185006; 大槻一博: '携帯向けオンラインニュース配信のための視聴/非視聴履歴に基づく嗜好クラスター管理手法' NHK技研R&D NO.106, 20071115, pp.74-81, 日本放送出版協会 * |
JPN6013002880; 大槻一博: '携帯向けオンラインニュース配信のための視聴/非視聴履歴に基づく嗜好クラスター管理手法' NHK技研R&D NO.106, 20071115, pp.74-81, 日本放送出版協会 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012064166A (en) * | 2010-09-17 | 2012-03-29 | Kddi Corp | Content creation device and content creation method |
US9015158B2 (en) | 2010-09-17 | 2015-04-21 | Kddi Corporation | Contents creating device and contents creating method |
JP2014203442A (en) * | 2013-04-10 | 2014-10-27 | 株式会社Nttドコモ | Recommendation information generation device and recommendation information generation method |
WO2015029809A1 (en) * | 2013-08-29 | 2015-03-05 | 日本電気株式会社 | Data analysis method, program, and apparatus |
JPWO2015029809A1 (en) * | 2013-08-29 | 2017-03-02 | 日本電気株式会社 | Data analysis method, program, and apparatus |
JP2021033602A (en) * | 2019-08-23 | 2021-03-01 | Kddi株式会社 | Information processing device, vector generation method, and program |
JP7200069B2 (en) | 2019-08-23 | 2023-01-06 | Kddi株式会社 | Information processing device, vector generation method and program |
WO2021153505A1 (en) * | 2020-01-28 | 2021-08-05 | 株式会社電通 | Prediction device, prediction method, and prediction program |
JP2021117818A (en) * | 2020-01-28 | 2021-08-10 | 株式会社電通 | Prediction device, prediction method, and prediction program |
CN111737582A (en) * | 2020-07-29 | 2020-10-02 | 腾讯科技(深圳)有限公司 | Content recommendation method and device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5328212B2 (en) | RECOMMENDATION INFORMATION EVALUATION DEVICE AND RECOMMENDATION INFORMATION EVALUATION METHOD | |
JP5166949B2 (en) | RECOMMENDATION INFORMATION GENERATION DEVICE AND RECOMMENDATION INFORMATION GENERATION METHOD | |
KR101506380B1 (en) | Infinite browse | |
US10607235B2 (en) | Systems and methods for curating content | |
US9396485B2 (en) | Systems and methods for presenting content | |
US20070143300A1 (en) | System and method for monitoring evolution over time of temporal content | |
CN103733159A (en) | Synchronizing digital content | |
US10482142B2 (en) | Information processing device, information processing method, and program | |
US10783192B1 (en) | System, method, and user interface for a search engine based on multi-document summarization | |
JP2010181966A (en) | Device and method for evaluating recommendation information | |
KR101873339B1 (en) | System and method for providing interest contents | |
JP2012242844A (en) | Recommendation information generation device and recommendation information generation method | |
JP5805134B2 (en) | Terminal device and device program | |
KR101866411B1 (en) | Method for providing document recommandation information, and device using the same | |
WO2009125622A1 (en) | Electronic bulletin board system | |
KR20140056635A (en) | System and method for providing contents recommendation service | |
JP5248376B2 (en) | Information distribution apparatus and information distribution method | |
JP5183282B2 (en) | RECOMMENDATION INFORMATION EVALUATION DEVICE AND RECOMMENDATION INFORMATION EVALUATION METHOD | |
JP2017073070A (en) | Content recommendation device, content recommendation system, content recommendation method, and program | |
JP5819336B2 (en) | Web site management device | |
JP5813026B2 (en) | Terminal device and device program | |
KR20140072243A (en) | Web site using the Query window advertising method and system | |
KR20160070964A (en) | Method of providing contents with removing the displayed contents and system thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110829 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130129 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130326 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130507 |