JP2010181966A - Device and method for evaluating recommendation information - Google Patents

Device and method for evaluating recommendation information Download PDF

Info

Publication number
JP2010181966A
JP2010181966A JP2009022880A JP2009022880A JP2010181966A JP 2010181966 A JP2010181966 A JP 2010181966A JP 2009022880 A JP2009022880 A JP 2009022880A JP 2009022880 A JP2009022880 A JP 2009022880A JP 2010181966 A JP2010181966 A JP 2010181966A
Authority
JP
Japan
Prior art keywords
feature vector
content
feature
vector
selection target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009022880A
Other languages
Japanese (ja)
Inventor
Satoshi Miyagawa
聡 宮川
Susumu Ogata
進 緒方
Yusuke Fukazawa
佑介 深澤
Keitoku Isoda
佳徳 礒田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2009022880A priority Critical patent/JP2010181966A/en
Publication of JP2010181966A publication Critical patent/JP2010181966A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a device for performing evaluation such that recommendation information such as a content potentially desired by a user can be distributed without exception. <P>SOLUTION: A characteristic vector generation part 209 collects a content of a Web page or the like in prescribed timing, extracts a keyword indicating a characteristic of the content, and generates a characteristic vector. The generated characteristic vector is stored in a content characteristic vector management table 207b, and is updated. The timing of the collection is optional timing or timing wherein the Web page is updated (this is caused by reception or the like of an update notification signal). The content is evaluated by use of such the updated content characteristic vector. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は、コンテンツの評価を行うレコメンド情報評価装置およびレコメンド情報評価方法に関する。   The present invention relates to a recommendation information evaluation apparatus and a recommendation information evaluation method for evaluating content.

ユーザの特徴に合致したレコメンド情報を配信するために、そのレコメンド情報を抽出するための情報フィルタリング方式として、Content−basedFiltering方式が考えられている。この方式は、ユーザがWebページの閲覧などの行動を取ることにより、閲覧された対象文書を解析し、文書に含まれている単語(キーワード)を抽出する。そして、これらの単語を、ユーザごとに区別して、ユーザプロファイルといわれる興味・嗜好情報として記録する。ユーザプロファイルには、1つの興味の概念が表現され、この概念を利用してユーザに情報を提供することが考えられている。例えば、広告商品等に割り当てられたキーワードとユーザプロファイル(キーワードで表現された)とをマッチングすることにより適切な広告の推薦を可能とするシステムが一般的に知られている。   In order to distribute recommended information that matches the user's characteristics, a Content-basedFiltering method is considered as an information filtering method for extracting the recommended information. In this method, when a user takes an action such as browsing a Web page, the browsed target document is analyzed, and words (keywords) included in the document are extracted. These words are distinguished for each user and recorded as interest / preference information called a user profile. One concept of interest is expressed in the user profile, and it is considered to provide information to the user using this concept. For example, a system is generally known that makes it possible to recommend an appropriate advertisement by matching a keyword assigned to an advertisement product or the like with a user profile (expressed by a keyword).

また、これに関連する技術として、特許文献1に記載されている技術が挙げられる。この特許文献1には、予め定められたレコメンド抽出ルールに従ってレコメンド情報を配信する配信先および配信すべきレコメンド情報を決定し、配信する技術が記載されている。   Moreover, the technique described in patent document 1 is mentioned as a technique relevant to this. This Patent Document 1 describes a technique for determining and distributing a distribution destination to which recommendation information is distributed and recommendation information to be distributed in accordance with a predetermined recommendation extraction rule.

特開2007−148878号公報JP 2007-148878 A

しかしながら、上述の背景技術においては、マッチング処理をすることによりレコメンド情報を抽出するものであったり、また、特許文献1に記載の技術では、予め定められたレコメンド抽出ルールに基づいてレコメンド情報が決定され、レコメンド対象によって特徴空間ベクトルは更新されないことから、レコメンド情報に漏れが生じるおそれがある。   However, in the background art described above, recommendation information is extracted by performing a matching process, or in the technique described in Patent Document 1, recommendation information is determined based on a predetermined recommendation extraction rule. Since the feature space vector is not updated depending on the recommendation target, there is a possibility that the recommendation information may be leaked.

すなわち、特許文献1の技術においては、レコメンド抽出ルールに、趣味・嗜好が登録されていれば、その趣味・嗜好にあったレコメンド情報が決定され配信されることになり、また、購買履歴等に基づいて、ある商品を購入するとその購入した商品に関連する情報が配信されることになるが、これら配信される情報は、趣味・嗜好、購買履歴、またはアクセス履歴などの直接的な情報に基づいて決定され、またレコメンド対象によって特徴空間ベクトルは更新されないため、ユーザが潜在的に望んでいるコンテンツに漏れが生じる場合がある。   That is, in the technique of Patent Document 1, if a hobby / preference is registered in the recommendation extraction rule, recommendation information suitable for the hobby / preference is determined and distributed, and the purchase history and the like are also included. Based on this, when purchasing a product, information related to the purchased product will be distributed, but this distributed information is based on direct information such as hobbies / preferences, purchase history, or access history. Since the feature space vector is not updated according to the recommendation target, the content that the user wants may be leaked.

特にアクセス履歴に基づいてレコメンド情報を配信使用とする場合には、特に漏れが大きくなるものと考えられる。すなわち、ユーザがサイトなどを閲覧する場合、閲覧しているサイト自体は、一つのキーワードによって表されるものではなく、複数のキーワードをもって表されているものが通常である。例えば、ユーザが映画aに関する情報を検索し、閲覧している場合において、その閲覧しているサイトは、映画aの紹介であったり、原作本を紹介していたり、興行映画館を紹介していたり、出演者を紹介していたり、いろいろな情報(ベクトル情報)を含んでいる。この場合、ユーザは原作本を探している場合には、その原作本に特化したフィルタリング処理を行い、そのためのだけのレコメンド情報を配信することがユーザにとって望まれるものである。   In particular, when recommendation information is distributed and used based on the access history, it is considered that the leakage is particularly large. That is, when a user browses a site or the like, the browsed site itself is not represented by a single keyword, but is usually represented by a plurality of keywords. For example, when a user searches and browses information related to the movie a, the browsing site introduces the movie a, introduces the original, or introduces the entertainment movie theater. Or introducing performers, and various information (vector information). In this case, when the user is searching for an original book, it is desirable for the user to perform a filtering process specialized for the original book and distribute recommendation information only for that purpose.

しかしながら、上述特許文献1に記載の技術では、閲覧しているサイトの全体を見てその全体に近い情報をレコメンド情報として配信することになり、上述のとおりユーザにとって潜在的に望んでいる情報を配信することができなかった。   However, with the technology described in Patent Document 1, the entire site being browsed is viewed and information close to the entire site is distributed as recommendation information. Could not deliver.

そこで、本発明は、ユーザが潜在的に望んでいるコンテンツなどのレコメンド情報を漏れなく配信することができるように、その評価を行うことができるレコメンド情報評価装置およびレコメンド情報評価方法を提供することを目的とする。   Therefore, the present invention provides a recommendation information evaluation apparatus and a recommendation information evaluation method that can perform evaluation so that recommendation information such as content that a user potentially desires can be delivered without omission. With the goal.

上述の課題を解決するために、本発明のレコメンド情報評価装置は、選択対象項目の特徴空間を構成する特徴ベクトルを生成する特徴ベクトル生成手段と、前記特徴ベクトル生成手段により生成された特徴ベクトルを記憶する特徴ベクトル記憶手段と、ユーザ操作により、複数の選択対象項目から一の選択対象項目を選択することを受け付ける受付手段と、前記受付手段により受け付けられ、選択された選択対象項目、および選択されなかった選択対象項目を区別して記憶する履歴記憶手段と、前記履歴記憶手段により記憶された、選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを特徴空間内で分離するための分離平面に直交する直交ベクトルをユーザ特性ベクトルとするユーザ特性ベクトル生成手段と、前記ユーザ特性ベクトル生成手段により生成されたユーザ特性ベクトルに基づいて、未知の選択対象項目の評価を行う評価手段と、を備え、前記特徴ベクトル生成手段は、生成した特徴ベクトルに基づいて、前記特徴ベクトル記憶手段に記憶されている特徴ベクトルを更新するように構成されている。   In order to solve the above-described problem, a recommendation information evaluation apparatus according to the present invention includes a feature vector generation unit that generates a feature vector constituting a feature space of a selection target item, and a feature vector generated by the feature vector generation unit. Feature vector storage means for storing, reception means for receiving selection of one selection target item from a plurality of selection target items by a user operation, selection target item selected and received by the reception means, and selected A history storage unit that distinguishes and stores the selection target item that has not been stored, and a satisfaction feature vector of the selected selection target item and an unsatisfied feature vector of the selection target item that has not been selected, which are stored by the history storage unit. The user characteristic vector with the orthogonal vector orthogonal to the separation plane for separation within the user characteristic vector And an evaluation unit that evaluates an unknown selection target item based on the user characteristic vector generated by the user characteristic vector generation unit, and the feature vector generation unit adds the generated feature vector to the generated feature vector. Based on the feature vector, the feature vector stored in the feature vector storage means is updated.

また、本発明のレコメンド情報評価方法は、選択対象項目の特徴空間を構成する特徴ベクトルを生成する特徴ベクトル生成ステップと、前記特徴ベクトル生成ステップにおいて生成された特徴ベクトルを特徴ベクトル記憶手段に記憶する特徴ベクトル記憶ステップと、ユーザ操作により、複数の選択対象項目から一の選択対象項目を選択することを受け付ける受付ステップと、前記受付ステップにおいて受け付けられ、選択された選択対象項目および選択されなかった選択対象項目を履歴記憶手段に記憶する履歴記憶ステップと、前記履歴記憶手段に記憶された、選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを、特徴空間内で分離するための分離平面に直交する直交ベクトルに基づいてユーザ特性ベクトルを生成するユーザ特性ベクトル生成ステップと、前記ユーザ特性ベクトル生成ステップにより生成されたユーザ特性ベクトルに基づいて、レコメンド情報の評価を行う評価ステップと、を備え、前記特徴ベクトル生成ステップは、生成した特徴ベクトルに基づいて、前記特徴ベクトル記憶手段に記憶された特徴ベクトルを更新するように構成されている。   In the recommendation information evaluation method of the present invention, a feature vector generation step for generating a feature vector constituting a feature space of a selection target item, and a feature vector generated in the feature vector generation step are stored in a feature vector storage unit. A feature vector storage step, a reception step for receiving selection of one selection target item from a plurality of selection target items by a user operation, and a selection target item selected and not selected in the reception step A history storage step of storing the target item in the history storage means, a satisfaction feature vector of the selected selection target item and an unsatisfied feature vector of the selection target item not selected stored in the history storage means, Based on orthogonal vector orthogonal to the separation plane for separation within A user characteristic vector generation step for generating a user characteristic vector; and an evaluation step for evaluating recommendation information based on the user characteristic vector generated by the user characteristic vector generation step, wherein the feature vector generation step comprises: Based on the generated feature vector, the feature vector stored in the feature vector storage means is updated.

この発明によれば、選択対象項目の特徴空間を構成する特徴ベクトルを生成し、生成された特徴ベクトルを記憶することで、生成した特徴ベクトルに基づいて、すでに記憶されている特徴ベクトルを更新する。一方、ユーザ操作により、複数の選択対象項目から一の選択対象項目を選択することを受け付けると、選択された選択対象項目、および選択されなかった選択対象項目を区別して記憶する。そして、選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを特徴空間内で分離するための分離平面に直交する直交ベクトルをユーザ特性ベクトルとし、このユーザ特性ベクトルに基づいて、未知の選択対象項目の評価を行うことができる。   According to the present invention, the feature vector constituting the feature space of the selection target item is generated, and the generated feature vector is stored, so that the already stored feature vector is updated based on the generated feature vector. . On the other hand, when receiving selection of one selection target item from a plurality of selection target items by a user operation, the selected selection target item and the selection target item that has not been selected are distinguished and stored. Then, an orthogonal vector orthogonal to the separation plane for separating the satisfaction feature vector of the selected selection target item and the unsatisfied feature vector of the selection target item not selected in the feature space is defined as a user characteristic vector, and this user characteristic Based on the vector, an unknown selection target item can be evaluated.

これにより、ユーザの特徴を示すベクトルにしたがって未知の選択対象項目、例えばコンテンツまたは操作メニュー項目などのレコメンド情報の評価を行うことができ、ユーザの趣味・嗜好など、またアクセス履歴などの直接的な情報に基づいて推薦すべきレコメンド情報を評価することがなく、漏れなくレコメンド情報をユーザに提供することができる。また、ユーザが潜在的に望んでいるコンテンツなどのレコメンド情報を漏れなく配信することができるようになる。すなわち、選択対象項目、例えばテレビ番組やCDの紹介情報などのコンテンツの種類に応じて特徴ベクトルが更新されることにより、コンテンツの種類に特化されたレコメンド情報をユーザに提供することができる。   As a result, it is possible to evaluate unknown selection target items, for example, recommendation information such as contents or operation menu items, according to a vector indicating the user's characteristics, and the user's hobbies / preferences, direct access history, etc. The recommendation information to be recommended based on the information is not evaluated, and the recommendation information can be provided to the user without omission. In addition, recommendation information such as contents that the user potentially desires can be distributed without omission. In other words, the feature vector is updated according to the type of content such as the selection target item, for example, TV program or CD introduction information, so that recommendation information specialized to the type of content can be provided to the user.

また、本発明のレコメンド情報評価装置は、前記履歴記憶手段により記憶されている選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを特徴空間内で分離するための分離平面を生成する分離平面生成手段をさらに備え、前記ユーザ特性ベクトル生成手段は、前記分離平面生成手段により生成された分離平面に従ってユーザ特性ベクトルを生成することが好ましい。   Also, the recommendation information evaluation apparatus of the present invention separates the satisfaction feature vector of the selected selection target item stored in the history storage unit and the unsatisfied feature vector of the selection target item that has not been selected in the feature space. It is preferable that the apparatus further includes a separation plane generation unit that generates a separation plane for generating the user characteristic vector according to the separation plane generated by the separation plane generation unit.

この発明によれば、選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを特徴空間内で分離するための分離平面を生成し、これに基づいてユーザ特性ベクトルを生成することにより、ユーザ特性ベクトルを精度良く生成することができる。   According to the present invention, the separation plane for separating the satisfactory feature vector of the selected selection target item and the unsatisfactory feature vector of the unselected selection target item in the feature space is generated, and based on this, the user characteristics By generating the vector, the user characteristic vector can be generated with high accuracy.

また、本発明のレコメンド情報評価装置において、前記特徴ベクトル生成手段は、更新するために必要な情報を選択項目対象である文書情報から取得することが好ましい。   In the recommendation information evaluation apparatus according to the present invention, it is preferable that the feature vector generation unit obtains information necessary for updating from document information that is a selection item target.

この発明によれば、更新するために必要な情報を選択項目対象である文書情報から取得することにより、特徴ベクトルを生成することができる。この文書情報は、Webページ、ワープロデータ(ワードプロセッサにより作成されたデータ)、表計算データ(表計算アプリケーションにより作成されたデータ)などの解析可能な文書が記述された情報である。   According to the present invention, a feature vector can be generated by acquiring information necessary for updating from document information that is a selection item target. This document information is information describing a document that can be analyzed such as a Web page, word processor data (data created by a word processor), spreadsheet data (data created by a spreadsheet application), and the like.

また、本発明のレコメンド情報評価装置において、前記特徴ベクトル生成手段は、選択対象項目の属性毎に特徴的な単語を品詞毎に抽出する特徴抽出手段をさらに備え、前記特徴抽出手段により抽出された単語に基づいて、特徴ベクトルを生成することが好ましい。   In the recommendation information evaluation apparatus according to the present invention, the feature vector generation unit further includes a feature extraction unit that extracts a characteristic word for each part of speech for each attribute of the selection target item, and is extracted by the feature extraction unit. It is preferable to generate a feature vector based on the word.

この発明によれば、選択対象項目の属性毎に特徴的な単語を品詞に毎に抽出し、抽出された単語に基づいて、特徴ベクトルを生成することで、適切な特徴ベクトルを生成することができる。   According to the present invention, it is possible to generate an appropriate feature vector by extracting a characteristic word for each attribute of the selection target item for each part of speech, and generating a feature vector based on the extracted word. it can.

また、本発明のレコメンド情報評価装置において、前記特徴抽出手段は、TF/IDF法に基づいて、選択対象項目の属性毎に特徴的な単語を抽出することが好ましい。   Moreover, in the recommendation information evaluation apparatus of this invention, it is preferable that the said feature extraction means extracts a characteristic word for every attribute of a selection object item based on TF / IDF method.

この発明によれば、TF/IDF法に基づいて、選択対象項目の属性毎に特徴的な単語を抽出することで、適切な特徴ベクトルを生成することができる。   According to the present invention, an appropriate feature vector can be generated by extracting a characteristic word for each attribute of a selection target item based on the TF / IDF method.

また、本発明のレコメンド情報評価装置において、前記特徴抽出手段は、PMM法に基づいて、選択対象項目の属性毎に特徴的な単語を抽出することが好ましい。   In the recommendation information evaluation apparatus according to the present invention, it is preferable that the feature extraction unit extracts a characteristic word for each attribute of the selection target item based on the PMM method.

この発明によれば、PMM法に基づいて、選択対象項目の属性毎に特徴的な単語を抽出することで、適切な特徴ベクトルを生成することができる。   According to this invention, an appropriate feature vector can be generated by extracting a characteristic word for each attribute of a selection target item based on the PMM method.

また、本発明のレコメンド情報評価装置において、前記特徴ベクトル生成手段は、特徴ベクトルを任意のタイミングで生成することが好ましい。   In the recommendation information evaluation apparatus according to the present invention, it is preferable that the feature vector generation unit generates a feature vector at an arbitrary timing.

この発明によれば、特徴ベクトルを任意のタイミングで生成することで、適切な特徴ベクトルを生成することができる。よって、選択対象項目、例えばテレビ番組やCDの紹介情報などのコンテンツの最新情報に追従して選択項目に基づくコンテンツ、例えばWebページを取得して、その特徴ベクトルを生成することができる。   According to the present invention, an appropriate feature vector can be generated by generating a feature vector at an arbitrary timing. Therefore, it is possible to acquire the content based on the selection item, for example, a Web page, following the latest information on the selection target item, for example, the introduction information of the TV program or CD, and generate the feature vector.

この発明によれば、ユーザの特徴を示すベクトルにしたがって未知の選択対象項目、例えばコンテンツまたは操作メニュー項目などのレコメンド情報の評価を行うことができ、ユーザの趣味・嗜好など、またアクセス履歴などの直接的な情報に基づいて推薦すべきレコメンド情報を評価することがなく、漏れなくレコメンド情報をユーザに提供することができる。   According to the present invention, it is possible to evaluate recommendation information such as an unknown selection target item, for example, content or an operation menu item, according to a vector indicating the user's characteristics, and the user's hobbies / preferences, access history, etc. The recommendation information to be recommended is not evaluated based on the direct information, and the recommendation information can be provided to the user without omission.

本実施形態の携帯電話機100および情報配信サーバ200を備えたレコメンド情報配信システムのシステム構成を示すシステム構成図である。1 is a system configuration diagram illustrating a system configuration of a recommended information distribution system including a mobile phone 100 and an information distribution server 200 according to the present embodiment. 情報配信サーバ200の機能構成を示すブロック図である。2 is a block diagram showing a functional configuration of an information distribution server 200. FIG. 情報配信サーバ200のハードウェア構成図である。2 is a hardware configuration diagram of an information distribution server 200. FIG. 携帯電話機100に表示されるメニュー画面の一例を示す説明図である。FIG. 10 is an explanatory diagram illustrating an example of a menu screen displayed on the mobile phone 100. 分離平面を生成するときの処理概念を示す概念図である。It is a conceptual diagram which shows the processing concept when producing | generating a separation plane. 分離平面に基づいてユーザ特性ベクトルを算出し、さらにユーザ特性ベクトルに基づいて評価を行うときの概念を示す概念図である。It is a conceptual diagram which shows the concept when calculating a user characteristic vector based on a separation plane, and also evaluating based on a user characteristic vector. コンテンツ管理テーブル205aの記憶内容を示す説明図である。It is explanatory drawing which shows the memory content of the content management table 205a. コンテンツ特徴ベクトル管理テーブル207bの記憶内容を示す説明図である。It is explanatory drawing which shows the memory content of the content feature vector management table 207b. 携帯電話機100の機能構成を示すブロック図である。2 is a block diagram showing a functional configuration of a mobile phone 100. FIG. 携帯電話機100の要求に応じてコンテンツを配信するときの処理を示すシーケンス図である。FIG. 11 is a sequence diagram showing processing when content is distributed in response to a request from mobile phone 100. ユーザ特性ベクトルの計算処理を示すフローチャートである。It is a flowchart which shows the calculation process of a user characteristic vector. レコメンド情報を配信するときのシーケンス図である。It is a sequence diagram when distributing recommendation information. コンテンツの評価処理を示すフローチャートである。It is a flowchart which shows the content evaluation process. 履歴事象aと履歴事象bとにおけるメニュー画面を示す説明図である。It is explanatory drawing which shows the menu screen in the log | history event a and the log | history event b. メニュー画面おいて選択されたコンテンツの特徴ベクトルの特徴空間における位置関係を示す図である。It is a figure which shows the positional relationship in the feature space of the feature vector of the content selected in the menu screen. 履歴事象aおよびbを相対空間内において、コンテンツの特徴ベクトルを表した図である。It is a figure showing the feature vector of content in history space a and b in relative space. 絶対空間における各コンテンツの特徴ベクトルに基づいて評価を行うときの概念を示した図である。It is the figure which showed the concept when evaluating based on the feature vector of each content in absolute space. 分離平面を生成することができない場合において相対空間を用いて処理を行うときの説明図である。It is explanatory drawing when performing a process using relative space when a separation plane cannot be generated. 閲覧頻度を考慮して特徴ベクトルの重心を求める処理を示す概念図である。It is a conceptual diagram which shows the process which calculates | requires the gravity center of a feature vector in consideration of browsing frequency. アクセスされた時系列順にNN法によりユーザ特性ベクトルを求める過程を示す概念図である。It is a conceptual diagram which shows the process in which a user characteristic vector is calculated | required by the NN method in the time series accessed. 操作に関する特徴空間における特徴ベクトルのパラメータを示す説明図である。It is explanatory drawing which shows the parameter of the feature vector in the feature space regarding operation. レコメンド操作情報を表示することができる携帯電話機100aの機能を示すブロック図である。It is a block diagram which shows the function of the mobile telephone 100a which can display recommendation operation information. 特徴ベクトルを生成する処理を示すフローチャートである。It is a flowchart which shows the process which produces | generates a feature vector.

添付図面を参照しながら本発明の実施形態を説明する。可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。   Embodiments of the present invention will be described with reference to the accompanying drawings. Where possible, the same parts are denoted by the same reference numerals, and redundant description is omitted.

図1は、本実施形態の携帯電話機100および情報配信サーバ200を備えたレコメンド情報配信システムのシステム構成を示すシステム構成図である。携帯電話機100からの要求に応じて情報配信サーバ200は、予め記憶されているレコメンド情報となるコンテンツを、携帯電話機100に配信する。配信されるレコメンド情報は、携帯電話機100のユーザのアクセス履歴に基づいて編集されたものであり、ユーザにとって必要と思われる情報である。なお、この情報配信サーバ200は、携帯電話機100からのアクセス要求に応じて、他のコンテンツプロバイダからコンテンツを取得し、取得したコンテンツを配信するものであり、アクセス履歴はこのときに収集される。また、携帯電話機100がアクセス履歴を送信し、それを取得するように構成されてもよい。   FIG. 1 is a system configuration diagram illustrating a system configuration of a recommended information distribution system including a mobile phone 100 and an information distribution server 200 according to the present embodiment. In response to a request from the mobile phone 100, the information distribution server 200 distributes content that serves as recommendation information stored in advance to the mobile phone 100. The recommended information to be distributed has been edited based on the access history of the user of the mobile phone 100 and is information that seems necessary for the user. The information distribution server 200 acquires content from other content providers and distributes the acquired content in response to an access request from the mobile phone 100, and the access history is collected at this time. Further, the mobile phone 100 may be configured to transmit and acquire the access history.

このような情報配信サーバ200の構成について、図2を用いて説明する。図2は、情報配信サーバ200の機能構成を示すブロック図である。この情報配信サーバ200は、コンテンツ要求受信部201(受付手段)、レコメンド要求受信部202、履歴クラス分離部203(分離平面生成手段)、ユーザ特性ベクトル計算部204(ユーザ特性ベクトル生成手段)、配信情報格納部205、コンテンツ評価部206(評価手段)、履歴格納部207(特徴ベクトル記憶手段、履歴記憶手段)、コンテンツ送信部208、および特徴ベクトル生成部209(特徴ベクトル生成手段)を含んで構成されている。   The configuration of such an information distribution server 200 will be described with reference to FIG. FIG. 2 is a block diagram showing a functional configuration of the information distribution server 200. This information distribution server 200 includes a content request receiving unit 201 (reception unit), a recommendation request receiving unit 202, a history class separation unit 203 (separation plane generation unit), a user characteristic vector calculation unit 204 (user characteristic vector generation unit), a distribution An information storage unit 205, a content evaluation unit 206 (evaluation unit), a history storage unit 207 (feature vector storage unit, history storage unit), a content transmission unit 208, and a feature vector generation unit 209 (feature vector generation unit) are configured. Has been.

図3は、情報配信サーバ200のハードウェア構成図である。図2に示される情報配信サーバ200は、物理的には、図3に示すように、CPU11、主記憶装置であるRAM12及びROM13、入力デバイスであるキーボード及びマウス等の入力装置14、ディスプレイ等の出力装置15、ネットワークカード等のデータ送受信デバイスである通信モジュール16、ハードディスク等の補助記憶装置17などを含むコンピュータシステムとして構成されている。図2において説明した各機能は、図3に示すCPU11、RAM12等のハードウェア上に所定のコンピュータソフトウェアを読み込ませることにより、CPU11の制御のもとで入力装置14、出力装置15、通信モジュール16を動作させるとともに、RAM12や補助記憶装置17におけるデータの読み出し及び書き込みを行うことで実現される。以下、図2に示す機能ブロックに基づいて、各機能ブロックを説明する。   FIG. 3 is a hardware configuration diagram of the information distribution server 200. As shown in FIG. 3, the information distribution server 200 shown in FIG. 2 physically includes a CPU 11, a RAM 12 and a ROM 13 that are main storage devices, an input device 14 such as a keyboard and a mouse that are input devices, a display, and the like. The computer system includes an output device 15, a communication module 16 that is a data transmission / reception device such as a network card, and an auxiliary storage device 17 such as a hard disk. Each function described in FIG. 2 has the input device 14, the output device 15, and the communication module 16 under the control of the CPU 11 by reading predetermined computer software on the hardware such as the CPU 11 and the RAM 12 shown in FIG. 3. This is realized by reading and writing data in the RAM 12 and the auxiliary storage device 17. Hereinafter, each functional block will be described based on the functional blocks shown in FIG.

コンテンツ要求受信部201は、携帯電話機100からのコンテンツの要求に応じて、ネットワーク上のコンテンツプロバイダからコンテンツを取得する部分であり、携帯電話機100からコンテンツの要求とそのURLを受信することでアクセス履歴を収集することができる。収集したアクセス履歴(URLなど)は、履歴格納部207に出力される。なお、このコンテンツ要求受信部201は、アクセス履歴として、あるメニュー画面(事象)内において実際にアクセスされたコンテンツ(URL)と、メニュー画面には表示されているものの、実際にアクセスされなかったコンテンツとを区別して収集する。   The content request receiving unit 201 is a part that acquires content from a content provider on the network in response to a content request from the mobile phone 100, and receives an access history by receiving the content request and its URL from the mobile phone 100. Can be collected. The collected access history (such as URL) is output to the history storage unit 207. The content request receiving unit 201 includes, as an access history, content (URL) that is actually accessed in a certain menu screen (event) and content that is displayed on the menu screen but not actually accessed. Collect separately.

また、コンテンツ要求受信部201は、アクセス要求だけでなく、携帯電話機100において収集されたアクセス履歴情報を受信し、これを履歴格納部207に出力するようにしてもよい。この場合も同様に、携帯電話機100は、あるメニュー画面において選択されたコンテンツ、選択されなかったコンテンツを区別してアクセス履歴情報として情報配信サーバ200に送信するように構成される。   Further, the content request receiving unit 201 may receive not only the access request but also access history information collected by the mobile phone 100 and output this to the history storage unit 207. Similarly, in this case, the mobile phone 100 is configured to distinguish the content selected on a certain menu screen from the content not selected and transmit it to the information distribution server 200 as access history information.

レコメンド要求受信部202は、携帯電話機100からレコメンド情報の配信要求を、携帯電話機100のユーザのユーザIDとともに受信する部分である。レコメンド要求受信部202は、その配信要求を受信すると、コンテンツ評価部206にその旨を通知し、予め計算されていたユーザ特性ベクトルに基づいて、配信情報格納部205に記憶されているコンテンツの評価を行うよう指示する。なお、変形例として、レコメンド要求のあった旨をユーザ特性ベクトル計算部204に出力し、現時点におけるユーザ特性ベクトルを計算させ、その結果をコンテンツ評価部206に通知し、コンテンツ送信部208にレコメンド情報の配信を行わせるようにしてもよい。   The recommendation request receiving unit 202 is a part that receives a distribution request for recommendation information from the mobile phone 100 together with the user ID of the user of the mobile phone 100. When receiving the distribution request, the recommendation request receiving unit 202 notifies the content evaluation unit 206 to that effect, and evaluates the content stored in the distribution information storage unit 205 based on the user characteristic vector calculated in advance. To instruct As a modification, the fact that there is a recommendation request is output to the user characteristic vector calculation unit 204, the current user characteristic vector is calculated, the result is notified to the content evaluation unit 206, and the recommendation information is transmitted to the content transmission unit 208 You may make it deliver.

履歴クラス分離部203は、履歴格納部207(閲覧履歴テーブル207c:履歴記憶手段)に記憶されている閲覧履歴情報に含まれているコンテンツの特徴ベクトルに基づいて、あるユーザが閲覧したコンテンツをコンテンツ特徴ベクトル管理テーブル207bに記憶されている特徴ベクトルより構成される特徴空間で満足クラスと不満足クラスとに分離するための分離平面を生成する部分である。ここで、満足クラスとは、あるコンテンツにアクセスするためのメニュー画面において選択可能に表示された複数のコンテンツのうち、実際に選択されたコンテンツのみを含んだクラスをいい、不満足クラスとは、そのメニュー画面において選択されなかったコンテンツのみを含んだクラスをいう。この履歴クラス分離部203は、SVM法またはNN法を用いて、各コンテンツの特徴ベクトルを満足クラスと不満足クラスとに分離することができる分離平面を生成することで、これらクラスを分離することができる。ここでSVM(Support Vector Machine)法とは、それぞれのクラスのノード間(特徴ベクトル間)の最小距離を最大化する平面を分離平面とする方法であり、NN法とは、それぞれのクラスの重心間、すなわち各コンテンツの特徴ベクトルに基づいて算出された、満足クラスの重心と不満足クラスの重心とを結んだ直線を垂線とする平面を分離平面とする方法である。なお、NN法においては、必ずしも分離平面を求める必要はなく、不満足クラスの重心から満足クラスへの重心へ結んだ直線をユーザ特性ベクトルとするようにしてもよい。   The history class separation unit 203 stores content browsed by a certain user based on the feature vector of the content included in the browsing history information stored in the history storage unit 207 (browsing history table 207c: history storage unit). This is a part for generating a separation plane for separating the satisfaction class and the dissatisfaction class in the feature space constituted by the feature vectors stored in the feature vector management table 207b. Here, the satisfaction class refers to a class including only the actually selected content among a plurality of contents displayed in a selectable manner on a menu screen for accessing certain content. A class that contains only content that was not selected on the menu screen. The history class separation unit 203 uses the SVM method or the NN method to generate a separation plane that can separate feature vectors of each content into a satisfaction class and a dissatisfaction class, thereby separating these classes. it can. Here, the SVM (Support Vector Machine) method is a method in which a plane that maximizes the minimum distance between nodes of each class (between feature vectors) is a separation plane, and the NN method is the center of gravity of each class. In other words, a plane that is perpendicular to the straight line connecting the centroid of the satisfaction class and the centroid of the dissatisfaction class calculated based on the feature vector of each content is used as the separation plane. In the NN method, it is not always necessary to obtain a separation plane, and a straight line connecting the centroid of the unsatisfactory class to the centroid of the satisfactory class may be used as the user characteristic vector.

ここで分離平面を生成する具体的な方法について説明する。図4は、携帯電話機100に表示されるメニュー画面の一例を示す説明図である。図4に示すようにNode1〜Node5が表示されている。このNodeは、選択対象項目を示すものであり、例えばウェブ上のメニュー画面におけるカテゴリごとに区別された項目であったり、Webページなどの文書情報のタイトルである。例えば、Node1が、自動車に関するコンテンツ、Node2が、金融に関するコンテンツなどである。ユーザは、Node1〜Node5のいずれかを選択することにより、対応するコンテンツを閲覧することができる。   Here, a specific method for generating the separation plane will be described. FIG. 4 is an explanatory diagram illustrating an example of a menu screen displayed on the mobile phone 100. As shown in FIG. 4, Node1 to Node5 are displayed. This Node indicates an item to be selected, and is, for example, an item distinguished for each category on a menu screen on the web, or a title of document information such as a web page. For example, Node 1 is content related to automobiles, and Node 2 is content related to finance. The user can browse the corresponding content by selecting any one of Node1 to Node5.

図5は、分離平面を生成するときの処理概念を示す概念図である。図5は、上述図4におけるメニュー画面のうちユーザが選択したコンテンツおよび選択されなかったコンテンツにおける、特徴空間内における各コンテンツの特徴ベクトルの位置関係を示す。図5に示されている通り、円形で示されている部分が満足なコンテンツ(Node3、Node4)であり、三角形で示されている部分が不満足なコンテンツ(Node1、Node2、Node5)であり、四角形で示されている部分が未知の未評価コンテンツ(Node8、Node7)である。これら満足コンテンツと不満足コンテンツとを分離するように生成されたものが分離平面である。ここでは、未評価コンテンツは分離処理する際には考慮されない。なお、図においては、特徴空間を便宜上二次元平面で表現しているが、ベクトルを構成するパラメータ分だけベクトル軸が存在することになり、通常は20次元以上のベクトルで特徴空間は構成されている。   FIG. 5 is a conceptual diagram showing a processing concept when generating a separation plane. FIG. 5 shows the positional relationship between the feature vectors of each content in the feature space for the content selected by the user and the content not selected on the menu screen in FIG. As shown in FIG. 5, the parts indicated by circles are satisfactory contents (Node3, Node4), and the parts indicated by triangles are unsatisfactory contents (Node1, Node2, Node5), and are rectangular. The parts indicated by are unknown unevaluated contents (Node8, Node7). A separation plane is generated so as to separate the satisfactory content and the unsatisfied content. Here, the unevaluated content is not taken into consideration when the separation process is performed. In the figure, the feature space is represented by a two-dimensional plane for convenience. However, there are vector axes corresponding to the parameters constituting the vector, and the feature space is usually composed of vectors of 20 dimensions or more. Yes.

ユーザ特性ベクトル計算部204は、特徴ベクトル生成部209により生成された特徴ベクトルで構成された特徴ベクトル空間における、履歴クラス分離部203により生成された分離平面に対して直交する直交ベクトルを算出し、これをユーザ特性ベクトルとする部分である。図6にその具体例を示す。図6は、分離平面に基づいてユーザ特性ベクトルを算出し、さらにユーザ特性ベクトルに基づいて評価を行うときの概念を示す概念図である。図6に示すように、分離平面に直交する直交ベクトルであるユーザ特性ベクトルwが、ユーザ特性ベクトル計算部204により算出される。ユーザ特性ベクトル計算部204は、閲覧履歴が収集されるたびに計算され、ユーザ特性ベクトル管理テーブル207aに記憶されているユーザ特性ベクトルを更新させる。   The user characteristic vector calculation unit 204 calculates an orthogonal vector orthogonal to the separation plane generated by the history class separation unit 203 in the feature vector space configured by the feature vector generated by the feature vector generation unit 209, This is the part that uses the user characteristic vector. A specific example is shown in FIG. FIG. 6 is a conceptual diagram illustrating a concept when a user characteristic vector is calculated based on the separation plane and evaluation is performed based on the user characteristic vector. As shown in FIG. 6, a user characteristic vector w that is an orthogonal vector orthogonal to the separation plane is calculated by the user characteristic vector calculation unit 204. The user characteristic vector calculation unit 204 is updated every time browsing history is collected, and updates the user characteristic vector stored in the user characteristic vector management table 207a.

配信情報格納部205は、配信対象であるコンテンツ(レコメンド情報)およびその管理情報を記憶する部分であり、コンテンツ管理テーブル205aを記憶している。図7は、コンテンツ管理テーブル205aの記憶内容を示す説明図である。図7に示すように、このコンテンツ管理テーブル205aは、コンテンツID、カテゴリ、タイトル、およびレコメンド本文を対応付けて記憶している。コンテンツIDは、コンテンツを一意に特定するための識別情報であり、カテゴリは情報種別を示し、例えばCDに関連するもの、DVDに関連するもの、書籍に関連するもの、テレビ番組に関連するものなどを示すための情報である。タイトルは、レコメンド情報として表示するための見出し情報である。レコメンド情報を配信する際には、このタイトル部分が表示されることになる。レコメンド文は、レコメンド情報の本体部分であり、ユーザに有用な情報である。このコンテンツ管理テーブル205aに記憶される情報は、予めオペレータにより入力されたものでもよいし、自動的にコンテンツプロバイダから検索・抽出され所定のフィルターにより絞り込まれたものであってもよい。   The distribution information storage unit 205 is a part that stores content to be distributed (recommendation information) and management information thereof, and stores a content management table 205a. FIG. 7 is an explanatory diagram showing the stored contents of the content management table 205a. As shown in FIG. 7, the content management table 205a stores a content ID, a category, a title, and a recommended text in association with each other. The content ID is identification information for uniquely identifying the content, and the category indicates the information type. For example, information related to CD, information related to DVD, information related to books, information related to TV programs, etc. It is information for indicating. The title is heading information to be displayed as recommendation information. When the recommendation information is distributed, this title portion is displayed. The recommendation sentence is a main part of the recommendation information and is useful information for the user. Information stored in the content management table 205a may be input in advance by an operator, or may be information that is automatically retrieved and extracted from a content provider and narrowed down by a predetermined filter.

コンテンツ評価部206は、レコメンド要求受信部202によりレコメンドの要求が受信されると、配信情報格納部205に記憶されているコンテンツに対して、ユーザ特性ベクトル計算部204により計算されたユーザ特性ベクトルに基づいて評価し、そして評価の高い順にコンテンツのタイトルを並べたレコメンド情報を生成する部分である。具体的には、このコンテンツ評価部206は、ユーザ特性ベクトルと各コンテンツの特徴ベクトルとの内積を計算することにより評価値を算出し、その評価値の高い順にコンテンツのタイトルを並べたレコメンド情報を生成する。   When the recommendation request is received by the recommendation request receiving unit 202, the content evaluation unit 206 applies the user characteristic vector calculated by the user characteristic vector calculation unit 204 to the content stored in the distribution information storage unit 205. This is a part for generating recommendation information in which the titles of the contents are arranged in the descending order of evaluation. Specifically, the content evaluation unit 206 calculates an evaluation value by calculating the inner product of the user characteristic vector and the feature vector of each content, and recommends information in which the content titles are arranged in descending order of the evaluation value. Generate.

概念的には、つぎの通りとなる。例えば、図6では、Node7およびNode8がコンテンツ管理テーブル205aに記憶された情報であるとして、未知のコンテンツとして扱われている。ここで、Node7およびNode8からユーザ特性ベクトルwに対して垂線をおろした点がユーザ特性ベクトルwに対する評価点となる。この垂線とユーザ特性ベクトルとの交点の位置が上位にある順にコンテンツ(タイトル部分)を表示するようにレコメンド情報を生成する。なお、分離平面を基準に、表示または非表示とするようにしてもよい。例えば、Node8からの垂線との交点は、分離平面を基準にした場合、それよりも上位に位置しているため、ユーザにとって評価は高いと判断されレコメンド情報として選択される。一方、Node7は基準より下にあるため、評価は低く、レコメンド情報として選択されない、というようなレコメンド情報としてもよい。   Conceptually, it is as follows. For example, in FIG. 6, Node 7 and Node 8 are treated as unknown content, assuming that the information is stored in the content management table 205a. Here, the point perpendicular to the user characteristic vector w from Node 7 and Node 8 is the evaluation point for the user characteristic vector w. The recommendation information is generated so that the content (title portion) is displayed in the order in which the position of the intersection of the perpendicular and the user characteristic vector is higher. Note that display or non-display may be performed with reference to the separation plane. For example, since the intersection with the perpendicular from Node 8 is positioned higher than the separation plane as a reference, it is determined that the evaluation is high for the user and is selected as recommendation information. On the other hand, since Node 7 is below the standard, the evaluation is low, and it may be recommended information that is not selected as recommended information.

履歴格納部207は、各履歴情報を記憶する部分であり、ユーザ特性ベクトル管理テーブル207a、コンテンツ特徴ベクトル管理テーブル207b、および閲覧履歴テーブル207cを記憶している。   The history storage unit 207 stores each piece of history information, and stores a user characteristic vector management table 207a, a content feature vector management table 207b, and a browsing history table 207c.

ユーザ特性ベクトル管理テーブル207aは、ユーザ特性ベクトル計算部204により計算されたユーザ特性ベクトルを、ユーザを特定するためのユーザIDと対応付けて記憶する部分である。   The user characteristic vector management table 207a is a part that stores the user characteristic vector calculated by the user characteristic vector calculation unit 204 in association with the user ID for specifying the user.

コンテンツ特徴ベクトル管理テーブル207bは、コンテンツ管理テーブル205aに記憶されているコンテンツの特徴ベクトルを、そのコンテンツを特定するための情報(例えばコンテンツID、URLなど)と対応付けて記憶する部分である。このコンテンツ特徴ベクトルは、ユーザがアクセスしたときにそのコンテンツとともに、コンテンツ要求受信部201により取得されるもの、レコメンド情報を登録するときにそのオペレータにより設定されたものである。例えば、コンテンツ特徴ベクトル管理テーブル207bは、図8に示される情報が記憶されている。図8に示すように、コンテンツIDと対応付けて、特徴ベクトルを構成するパラメータが複数記憶されている。図8では、8個のパラメータを記載しているが、通常はさらに多くのパラメータから特徴ベクトルは構成されている。なお、規定のパラメータ以外に、コンテンツごとに形態素解析にしたがって抽出されたキーワードをパラメータとして追加するようにしてもよい。特徴ベクトルを構成するパラメータごとに、0から1の間で数値が記述されており、どの特徴ベクトルに特徴を持たせているかを表している。   The content feature vector management table 207b is a part that stores the feature vectors of content stored in the content management table 205a in association with information (for example, content ID, URL, etc.) for specifying the content. The content feature vector is acquired by the content request receiving unit 201 together with the content when the user accesses it, and is set by the operator when registering the recommendation information. For example, the content feature vector management table 207b stores information shown in FIG. As shown in FIG. 8, a plurality of parameters constituting the feature vector are stored in association with the content ID. In FIG. 8, although eight parameters are described, the feature vector is usually composed of more parameters. In addition to the defined parameters, keywords extracted according to morphological analysis for each content may be added as parameters. For each parameter constituting the feature vector, a numerical value is described between 0 and 1, indicating which feature vector has the feature.

閲覧履歴テーブル207cは、コンテンツ要求受信部201により受信されたあて先または収集されたアクセス履歴情報を記憶する部分であり、例えば、コンテンツID(またはコンテンツのURL)およびそのコンテンツ(閲覧されたもの、閲覧されていないものそれぞれ)の特徴ベクトルを対応付けて記憶する部分である。このコンテンツの特徴ベクトルは、コンテンツ要求受信部201により取得されるコンテンツとともに取得されるものである。   The browsing history table 207c is a part for storing the destination or collected access history information received by the content request receiving unit 201. For example, the content ID (or the URL of the content) and its content (viewed, viewed This is a part for storing the feature vectors of each of them that have not been assigned. This feature vector of content is acquired together with the content acquired by the content request receiving unit 201.

コンテンツ送信部208は、コンテンツ要求受信部201により受信されたコンテンツ要求またはレコメンド要求受信部202により受信されたレコメンド要求に応じて取得されたコンテンツを送信する部分である。例えば、コンテンツ送信部208は、コンテンツ要求受信部201により受信されたコンテンツ要求に応じて取得されたコンテンツを送信し、またレコメンド要求受信部202に応じて配信情報格納部205に記憶されているコンテンツに基づいてコンテンツ評価部206による評価結果にしたがって生成されたレコメンド情報を送信する。   The content transmitting unit 208 is a part that transmits content acquired in response to a content request received by the content request receiving unit 201 or a recommendation request received by the recommendation request receiving unit 202. For example, the content transmission unit 208 transmits the content acquired in response to the content request received by the content request reception unit 201, and the content stored in the distribution information storage unit 205 according to the recommendation request reception unit 202 The recommendation information generated in accordance with the evaluation result by the content evaluation unit 206 is transmitted.

特徴ベクトル生成部209は、Webページ等の文書情報からコンテンツ情報を収集し、収集したコンテンツ情報に対してキーワード解析を行って、その特徴ベクトルを計算することで、コンテンツの特徴ベクトルを生成する部分である。なお、文書情報には、Webページのほか、ワープロデータ(ワードプロセッサにより作成されたデータ)、表計算データ(表計算アプリケーションにより作成されたデータ)、PDFデータなどの解析可能な文書が記述された情報が含まれる。詳細な処理は以下の通りとおりである。そして、特徴ベクトル生成部209は、生成した特徴ベクトルを用いて、コンテンツ特徴ベクトル管理テーブル207bまたは必要に応じて閲覧履歴テーブル207cに記憶されている特徴ベクトルを更新する。   A feature vector generation unit 209 generates content feature vectors by collecting content information from document information such as Web pages, performing keyword analysis on the collected content information, and calculating the feature vectors. It is. In addition to the Web page, the document information includes information describing a document that can be analyzed such as word processing data (data created by a word processor), spreadsheet data (data created by a spreadsheet application), PDF data, and the like. Is included. Detailed processing is as follows. Then, the feature vector generation unit 209 updates the feature vector stored in the content feature vector management table 207b or the browsing history table 207c as necessary using the generated feature vector.

ここで特徴ベクトルを生成する具体的な方法について説明する。図23は、特徴ベクトルの計算処理を示すフローチャートである。図23に示すように、まずコンテンツ情報収集部209aによりWebページからコンテンツ情報(例えばWebページ)が収集される(S501)。   Here, a specific method for generating a feature vector will be described. FIG. 23 is a flowchart showing a feature vector calculation process. As shown in FIG. 23, first, content information (for example, a web page) is collected from a web page by the content information collection unit 209a (S501).

そして、収集されたコンテンツ情報は、特徴キーワード抽出部209bにより形態素解析のアルゴリズムにより品詞毎(名詞、固有名詞、動詞、助詞など)に分類される(S502)。そして、このコンテンツ情報から、当該コンテンツ情報の属性に従った特徴的なキーワードが特徴抽出アルゴリズムにより抽出される(S503)。この特徴キーワード抽出部209bの特徴抽出アルゴリズムは、TF/IDF法またはPMM法を用いて、コンテンツ情報の属性毎に特徴的なキーワードを品詞毎に抽出することができる。   The collected content information is classified into parts of speech (nouns, proper nouns, verbs, particles, etc.) by the feature keyword extraction unit 209b by a morphological analysis algorithm (S502). Then, a characteristic keyword according to the attribute of the content information is extracted from the content information by the feature extraction algorithm (S503). The feature extraction algorithm of the feature keyword extraction unit 209b can extract a keyword that is characteristic for each attribute of content information for each part of speech using the TF / IDF method or the PMM method.

ここで、TF/IDF法とは、ある文書での出現頻度が高い単語のうち他の文書にはあまり出現し無いものをその文書に特徴的な単語とする方法であり、PMM(Parametric Mixture Model)法とは、多重トピックを有する文書の確率モデルを構成することにより、ある文書から多重トピックを同時に抽出する方法である。なお、特徴抽出アルゴリズムにおいては、必ずしもTF/IDF法またはPMM法を用いて抽出する必要はない。   Here, the TF / IDF method is a method in which words that do not frequently appear in other documents among words that appear frequently in a document are used as a characteristic word in the document. PMM (Parametric Mixture Model) ) Method is a method of simultaneously extracting multiple topics from a document by constructing a probabilistic model of documents having multiple topics. In the feature extraction algorithm, it is not always necessary to extract using the TF / IDF method or the PMM method.

抽出されたキーワードに基づいて、特徴ベクトル計算部209cにより特徴ベクトルが生成される(S504)。この生成された特徴ベクトルはコンテンツ特徴ベクトル管理テーブル207bに記憶される。   A feature vector is generated by the feature vector calculation unit 209c based on the extracted keyword (S504). The generated feature vector is stored in the content feature vector management table 207b.

特徴ベクトル生成部209は、Webページの情報が更新されるたび、または任意のタイミングで特徴ベクトル管理テーブル207bまたは必要に応じて閲覧履歴テーブル207cに記憶されている特徴ベクトルを更新させる。   The feature vector generation unit 209 updates the feature vector stored in the feature vector management table 207b or the browsing history table 207c as necessary whenever the information on the Web page is updated or at an arbitrary timing.

このように構成された情報配信サーバ200は、携帯電話機100からの要求に応じて、ユーザ特性ベクトルに基づいて評価されたレコメンド情報を配信することができる。よって、嗜好・趣味などの情報を登録する必要はなく、またアクセスしたコンテンツに直接的に関連するコンテンツのみを抽出することがなく、漏れのないレコメンド情報を配信することを可能とする。   The information distribution server 200 configured as described above can distribute the recommendation information evaluated based on the user characteristic vector in response to a request from the mobile phone 100. Therefore, it is not necessary to register information such as tastes and hobbies, and it is possible to distribute recommended information without omission, without extracting only content directly related to accessed content.

つぎに、携帯電話機100について説明する。図9は、携帯電話機100の機能構成を示すブロック図である。図9に示すとおり、携帯電話機100は、ブラウザ101、履歴送信部102、レコメンド要求送信部103、および配信情報表示部104を含んで構成されている。この携帯電話機100は、CPU、RAM、ROMなどのハードウェアにより構成されており、記憶されているプログラムにしたがってCPUは動作するよう構成されている。具体的には、情報配信サーバ200と同様の構成をとるものであって、図3に示されるハードウェア構成により実現される。以下、各構成について説明する。   Next, the mobile phone 100 will be described. FIG. 9 is a block diagram showing a functional configuration of the mobile phone 100. As shown in FIG. 9, the mobile phone 100 includes a browser 101, a history transmission unit 102, a recommendation request transmission unit 103, and a distribution information display unit 104. The cellular phone 100 is configured by hardware such as a CPU, RAM, and ROM, and the CPU is configured to operate according to a stored program. Specifically, it has the same configuration as that of the information distribution server 200 and is realized by the hardware configuration shown in FIG. Each configuration will be described below.

ブラウザ101は、インターネットに接続するためのアプリケーション部分であり、インターネット上に配置されているサイトに対してアクセスし、サイトに保持されているコンテンツをユーザに閲覧可能にさせるものである。このブラウザ101は、アクセス履歴を保持するように構成される。   The browser 101 is an application part for connecting to the Internet, and accesses a site arranged on the Internet and allows a user to view content held on the site. The browser 101 is configured to hold an access history.

履歴送信部102は、ブラウザ101を用いてアクセスしたコンテンツのアクセス履歴(同一メニュー画面上において選択されたコンテンツおよび選択されなかったコンテンツを示す情報)を送信する部分である。なお、この履歴送信部102は、情報配信サーバ200側でアクセスのたびに履歴情報を収集する機能を有している場合には、必須の構成ではない。   The history transmission unit 102 is a part that transmits an access history (information indicating selected content and unselected content on the same menu screen) of content accessed using the browser 101. The history transmitting unit 102 is not an essential configuration when it has a function of collecting history information every time it is accessed on the information distribution server 200 side.

レコメンド要求送信部103は、図示しない操作部をユーザが操作することによりユーザIDとともにレコメンド情報の要求を情報配信サーバ200に送信する部分である。   The recommendation request transmission unit 103 is a part that transmits a request for recommendation information to the information distribution server 200 together with a user ID when a user operates an operation unit (not shown).

配信情報表示部104は、ブラウザ101により取得されたメニュー画面およびコンテンツ(Webページ)を表示する部分である。   The distribution information display unit 104 is a part that displays the menu screen and content (Web page) acquired by the browser 101.

このように構成された携帯電話機100は、ブラウザ101を用いてインターネットにアクセス可能にするとともに、そのアクセス履歴を保持し、履歴送信部102は、情報配信サーバ200からの要求または所定のタイミングでアクセス履歴を送信することができる。   The mobile phone 100 configured as described above enables access to the Internet using the browser 101 and holds the access history. The history transmission unit 102 accesses the request from the information distribution server 200 or at a predetermined timing. History can be sent.

つぎに、これら携帯電話機100および情報配信サーバ200の動作について説明する。図10は、携帯電話機100の要求に応じてコンテンツを配信するときの携帯電話機100と情報配信サーバ200との処理を示すシーケンス図である。   Next, operations of the mobile phone 100 and the information distribution server 200 will be described. FIG. 10 is a sequence diagram illustrating processing performed by the mobile phone 100 and the information distribution server 200 when content is distributed in response to a request from the mobile phone 100.

図10に示すとおり、携帯電話機100におけるブラウザ101からの要求に応じて、コンテンツ送信部208により情報配信サーバ200からメニュー画面が配信される(S101)。携帯電話機100のユーザは、そのメニュー画面から任意の一のコンテンツ(上述Nodeに相当)を選択し、携帯電話機100におけるブラウザ101がこれを受け付けると(S102)、コンテンツの接続要求およびそのあて先でURLが情報配信サーバ200に送信される(S103)。   As shown in FIG. 10, in response to a request from the browser 101 in the mobile phone 100, a menu screen is distributed from the information distribution server 200 by the content transmission unit 208 (S101). The user of the mobile phone 100 selects any one content (corresponding to the above-mentioned Node) from the menu screen, and when the browser 101 in the mobile phone 100 accepts this (S102), a URL for the content connection request and destination Is transmitted to the information distribution server 200 (S103).

情報配信サーバ200では、URLはコンテンツ要求受信部201により受信され、閲覧履歴テーブル207cにアクセス履歴として記憶される。そして、このアクセス履歴に基づいて、ユーザ特性ベクトルの計算がなされ、記憶される(S104)。そして、コンテンツ送信部208によりS103において要求のあったあて先に基づいたコンテンツがコンテンツプロバイダ(図示せず)から取得され、配信される(S105)。なお、ユーザ特性ベクトルの計算処理と、コンテンツの配信処理の順番は逆でもよい。   In the information distribution server 200, the URL is received by the content request receiving unit 201 and stored as an access history in the browsing history table 207c. Based on the access history, the user characteristic vector is calculated and stored (S104). Then, content based on the destination requested in S103 is acquired by the content transmission unit 208 from a content provider (not shown) and distributed (S105). Note that the order of the user characteristic vector calculation process and the content distribution process may be reversed.

ここでS104におけるユーザ特性ベクトル計算の詳細に処理について説明する。図11は、ユーザ特性ベクトルの計算処理を示すフローチャートである。図11に示すように、まずコンテンツ要求受信部201により受信されたアクセス要求またはアクセス履歴により示されたアクセス履歴情報が、新たに追加されたアクセス履歴として閲覧履歴テーブル207cに記憶される(S201)。   Here, the process will be described in detail for the user characteristic vector calculation in S104. FIG. 11 is a flowchart showing the calculation process of the user characteristic vector. As shown in FIG. 11, first, access history information indicated by an access request or access history received by the content request receiving unit 201 is stored in the browsing history table 207c as a newly added access history (S201). .

そして、履歴クラス分離部203により、この閲覧履歴テーブル207cに記憶されているアクセス履歴情報に基づいて、各満足クラスまたは不満足クラスに属するコンテンツの特徴ベクトルが抽出される(S202)。そして、履歴クラス分離部203により、これら特徴ベクトルに基づいて満足クラスと不満足クラスとを分離するための分離平面が生成される(S202)。つぎに、ユーザ特性ベクトル計算部204により、生成された分離平面に直交する直交ベクトルが計算され、ユーザ特性ベクトルが求められる(S204)。ここで求められたユーザ特性ベクトルは、ユーザ特性ベクトル管理テーブル207aに保持され、レコメンド情報の配信時において配信情報格納部205に記憶されているコンテンツを評価する際に利用される。   Then, based on the access history information stored in the browsing history table 207c, the history class separation unit 203 extracts feature vectors of contents belonging to each satisfaction class or dissatisfaction class (S202). Then, the history class separation unit 203 generates a separation plane for separating the satisfaction class and the dissatisfaction class based on these feature vectors (S202). Next, an orthogonal vector orthogonal to the generated separation plane is calculated by the user characteristic vector calculation unit 204 to obtain a user characteristic vector (S204). The user characteristic vector obtained here is held in the user characteristic vector management table 207a and is used when evaluating the content stored in the distribution information storage unit 205 at the time of distribution of recommendation information.

つぎに、本実施形態におけるレコメンド情報を配信するときのそのコンテンツの評価処理について説明する。図12は、レコメンド情報を配信するときのシーケンス図である。図12に示すように、携帯電話機100におけるレコメンド要求送信部103によりユーザIDを含んだレコメンド要求が送信され、このレコメンド要求は情報配信サーバ200におけるレコメンド要求受信部202により受信される(S301)。そして、情報配信サーバ200では、配信情報格納部205に記憶されているコンテンツに対して、コンテンツの評価が行われる(S302)。ここでは、コンテンツ評価部206により、ユーザ特性ベクトルにしたがって評価され、高評価順にコンテンツのタイトルを並べたレコメンド情報が生成される。そして、コンテンツ送信部208により、このように生成されたレコメンド情報が配信される(S303)。   Next, content evaluation processing when distributing recommendation information in the present embodiment will be described. FIG. 12 is a sequence diagram when distributing recommendation information. As shown in FIG. 12, a recommendation request including a user ID is transmitted by the recommendation request transmitting unit 103 in the mobile phone 100, and the recommendation request is received by the recommendation request receiving unit 202 in the information distribution server 200 (S301). Then, the information distribution server 200 evaluates the content stored in the distribution information storage unit 205 (S302). Here, the content evaluation unit 206 evaluates according to the user characteristic vector, and generates recommendation information in which the titles of the content are arranged in the order of high evaluation. And the recommendation information produced | generated in this way is delivered by the content transmission part 208 (S303).

ここで、S302のコンテンツ評価についてさらに詳細な処理について説明する。図13は、コンテンツの評価処理を示すフローチャートである。図13に示すように、コンテンツ評価部206により、レコメンド要求とともに送信されたユーザIDに基づいて、ユーザ特性ベクトル管理テーブル207aから、対応するユーザ特性ベクトルが取得される(S401)。つぎに、コンテンツ評価部206により、コンテンツ特徴ベクトル管理テーブル207bから、各コンテンツの特徴ベクトルが取得される(S402)。   Here, further detailed processing for content evaluation in S302 will be described. FIG. 13 is a flowchart showing content evaluation processing. As shown in FIG. 13, the content evaluation unit 206 acquires a corresponding user characteristic vector from the user characteristic vector management table 207a based on the user ID transmitted together with the recommendation request (S401). Next, the content evaluation unit 206 acquires the feature vector of each content from the content feature vector management table 207b (S402).

そして、コンテンツ評価部206により、ユーザ特性ベクトルとコンテンツの特徴ベクトルとの内積が計算される(S403)。コンテンツ評価部206により計算された内積の大きい順に、コンテンツ管理テーブル205aに記憶されているコンテンツIDに対応するタイトルが抽出され、そのタイトルが評価の高い順に並べられることでレコメンド情報が生成される。そして、コンテンツ送信部208により、生成されたレコメンド情報が携帯電話機100に送信される(S404)。   Then, the content evaluation unit 206 calculates the inner product of the user characteristic vector and the content feature vector (S403). The titles corresponding to the content IDs stored in the content management table 205a are extracted in descending order of the inner product calculated by the content evaluation unit 206, and recommendation information is generated by arranging the titles in descending order of evaluation. Then, the recommended information generated is transmitted to the mobile phone 100 by the content transmitting unit 208 (S404).

このように、ユーザ特性ベクトルにしたがって、レコメンド情報を提供することができ、漏れなくレコメンド情報をユーザに提供することができる。   Thus, according to the user characteristic vector, recommendation information can be provided, and recommendation information can be provided to the user without omission.

<相対空間における分離平面の生成>
以上の分離平面の生成方法は、絶対空間におけるコンテンツの特徴ベクトルにしたがって行われたものであるが、より精度高める方法として、相対的な位置関係を求めた相対空間を利用したものも考えられる。以下、相対空間を用いて分離平面を生成する方法について説明する。なお、このときの処理構成は上述と同様であり、履歴クラス分離部203における処理内容が異なるだけである。
<Generation of separation plane in relative space>
The above generation method of the separation plane is performed in accordance with the feature vector of the content in the absolute space. However, as a method for improving the accuracy, a method using a relative space for which a relative positional relationship is obtained can be considered. Hereinafter, a method for generating the separation plane using the relative space will be described. Note that the processing configuration at this time is the same as that described above, and only the processing content in the history class separation unit 203 is different.

図14は、履歴事象aと履歴事象bとにおけるメニュー画面の構成例を示し、図14(a)が履歴事象aにおけるメニュー画面を示す図であり、このメニュー画面はNode1からNode3で構成されている。また、図14(b)が履歴事象bにおけるメニュー画面を示す図であり、このメニュー画面はNode6からNode9で構成されている。図14(a)では、Node3が選択されており、図14(b)では、Node9が選択されていることが示されている。   FIG. 14 shows a configuration example of the menu screen in the history event a and the history event b, and FIG. 14A is a diagram showing the menu screen in the history event a. This menu screen is composed of Node1 to Node3. Yes. FIG. 14B is a diagram showing a menu screen in the history event b, and this menu screen is composed of Node 6 to Node 9. FIG. 14A shows that Node 3 has been selected, and FIG. 14B shows that Node 9 has been selected.

図15は、図14で示されたそれぞれのメニュー画面おいて選択されたコンテンツの特徴ベクトルの特徴空間における位置関係を示す図である。図15(a)は、履歴事象aにおいて選択されたコンテンツの特徴空間(絶対空間)、図15(b)は、履歴事象bにおいて選択されたコンテンツの特徴空間(絶対空間)を示す図である。上述と同様に、選択されたコンテンツは満足なコンテンツ、選択されなかったコンテンツは不満足なコンテンツと定義され、それぞれ満足クラス、不満足クラスに分類することができる。   FIG. 15 is a diagram showing the positional relationship in the feature space of the feature vector of the content selected on each menu screen shown in FIG. FIG. 15A shows the feature space (absolute space) of the content selected in the history event a, and FIG. 15B shows the feature space (absolute space) of the content selected in the history event b. . As described above, the selected content is defined as satisfactory content, and the content not selected is defined as unsatisfactory content, and can be classified into a satisfaction class and a dissatisfaction class, respectively.

図16は、それぞれの履歴事象aおよびbを同一特徴空間上に、コンテンツの特徴ベクトルを表した図であって、不満足なコンテンツの特徴ベクトルを原点に取った場合における満足なコンテンツの特徴ベクトルの位置を示す相対空間を表した図である。例えば、Node2とNode3との相対比較、Node1とNode3との相対比較のため、それぞれNode1、Node2を原点とした場合のNode3の位置を表した特徴空間を相対空間としている。より具体的には、Node3の特徴ベクトルからNode1の特徴ベクトルを減算することにより、相対空間を形成することができる。他のNodeについても同様に、対象となるコンテンツの特徴ベクトルを減算する処理を行うことで相対空間を形成することができる。   FIG. 16 is a diagram showing the feature vectors of the contents in the same feature space for the respective history events a and b. When the feature vector of the unsatisfactory content is taken as the origin, the feature vector of the satisfactory content is shown. It is a figure showing the relative space which shows a position. For example, for relative comparison between Node 2 and Node 3 and relative comparison between Node 1 and Node 3, a feature space representing the position of Node 3 when Node 1 and Node 2 are set as the origin is used as a relative space. More specifically, the relative space can be formed by subtracting the node 1 feature vector from the node 3 feature vector. Similarly, for other Nodes, a relative space can be formed by performing a process of subtracting the feature vector of the target content.

この相対空間において、図16に示すようにこのように満足なコンテンツの特徴ベクトル、不満足なコンテンツの特徴ベクトルに基づいて、満足クラスと不満足クラスとに分離するための分離平面が、履歴クラス分離部203により生成される。そして、ユーザ特性ベクトル計算部204により、この分離平面に直交する直交ベクトルであるユーザ特性ベクトルwが計算される。   In this relative space, as shown in FIG. 16, the separation plane for separating the satisfaction class and the unsatisfied class based on the feature vector of the satisfactory content and the feature vector of the unsatisfactory content as shown in FIG. 203. Then, the user characteristic vector calculation unit 204 calculates a user characteristic vector w that is an orthogonal vector orthogonal to the separation plane.

このように、履歴事象が異なる場合においても、相対空間を利用してユーザ特性ベクトルを生成することができ、より識別性の高いユーザ特性ベクトルを生成することができる。   As described above, even when the historical events are different, the user characteristic vector can be generated using the relative space, and the user characteristic vector with higher discriminability can be generated.

図17は、絶対空間における各コンテンツの特徴ベクトルに基づいて評価を行うときの概念を示した図であり、例えば、配信情報格納部205に記憶されている未知のコンテンツであるNode6〜Node8は、生成されたユーザ特性ベクトルに基づいて評価される。ここでは上述と同様に、コンテンツ評価部206はユーザ特性ベクトルと各コンテンツの特徴ベクトルとの内積を計算することにより、その評価値を算出することができる。概念的には、上述と同様に、ユーザ特性ベクトルに射影した点、すなわち垂線を下ろした点が、そのベクトル方向における上位の順にコンテンツの優先順が決定される。   FIG. 17 is a diagram illustrating a concept when the evaluation is performed based on the feature vector of each content in the absolute space. For example, Node 6 to Node 8 which are unknown contents stored in the distribution information storage unit 205 are as follows. Evaluation is performed based on the generated user characteristic vector. Here, as described above, the content evaluation unit 206 can calculate the evaluation value by calculating the inner product of the user characteristic vector and the feature vector of each content. Conceptually, in the same way as described above, the priority order of the contents is determined in the order of higher rank in the vector direction at the point projected onto the user characteristic vector, that is, the point where the perpendicular is dropped.

このように相対空間を用いて分離平面を生成し、それによってユーザ特性ベクトルを生成することができる。ところで、図15から図17については、絶対空間として扱っても分離平面を生成することができるが、分離平面を生成することができない特徴ベクトルから構成される特徴空間も考えられる。その場合に、上述した相対空間を利用することにより分離平面を生成することができる。以下、その方法について説明する。   In this way, a separation plane can be generated using the relative space, and thereby a user characteristic vector can be generated. 15 to 17, a separation plane can be generated even if handled as an absolute space, but a feature space composed of feature vectors that cannot generate a separation plane is also conceivable. In that case, the separation plane can be generated by using the relative space described above. The method will be described below.

図18(a)は、絶対空間におけるコンテンツの特徴ベクトルを示した図である。この図18(a)では、Node1とNode4とが同じ事象(メニュー画面)に存在するコンテンツであり、Node2とNode3とが同じ事象に存在するコンテンツであことを前提としている。なお、円形のものが選択されたコンテンツの特徴ベクトル(満足クラス)、三角形のものが選択されなかったコンテンツの特徴ベクトル(不満足クラス)である。   FIG. 18A is a diagram illustrating feature vectors of content in an absolute space. In FIG. 18A, it is assumed that Node1 and Node4 are contents existing in the same event (menu screen), and Node2 and Node3 are contents existing in the same event. In addition, the feature vector (satisfaction class) of the content in which the circular one is selected, and the feature vector (unsatisfied class) of the content in which the triangular one is not selected.

図18(a)から明らかなように、絶対空間においては、このような位置関係をとる特徴ベクトルのコンテンツに対しては、分離平面を生成することができない。分離平面は、満足クラスと不満足クラスとを分離するための平面であるためであり、図18(a)の例では、可不足なく両者を分離することができないためである。よって、分離平面を生成することができるように相対的な位置関係を表す相対空間に変換することが必要である。   As is clear from FIG. 18A, in the absolute space, a separation plane cannot be generated for the content of feature vectors having such a positional relationship. This is because the separation plane is a plane for separating the satisfaction class and the dissatisfaction class, and in the example of FIG. Therefore, it is necessary to convert to a relative space representing a relative positional relationship so that a separation plane can be generated.

図18(b)では、相対空間内におけるコンテンツの特徴ベクトルを表した図であり、Node1およびNode2が同じ位置になるように、図18(b)の例では、Node2を平行移動させるためそのNode2に対応するNode3を平行移動させている。このように相対空間に変換することで、不満足なコンテンツであるNode1(Node2)と、満足なコンテンツであるNode3およびNode4とを分離することができる分離平面vを生成することができる。   FIG. 18B is a diagram showing the feature vector of the content in the relative space. In the example of FIG. 18B, Node 2 is moved in parallel so that Node 1 and Node 2 are at the same position. Node3 corresponding to is translated. By converting to relative space in this way, it is possible to generate a separation plane v that can separate Node 1 (Node 2) that is unsatisfactory content from Node 3 and Node 4 that are satisfactory content.

以上の通り絶対空間では、分離平面を生成することができない場合であっても、相対空間に変換することで分離平面を生成することができ、これによりユーザ特性ベクトルを計算することができる。   As described above, even in the case where the separation plane cannot be generated in the absolute space, the separation plane can be generated by converting to the relative space, and thus the user characteristic vector can be calculated.

<閲覧頻度を考慮した分離平面の生成方法>
つぎに、コンテンツの閲覧頻度を用いた重み付け処理を行い、この重み付け処理された特徴ベクトルを用いて分離平面を生成するときの履歴クラス分離部203の処理について説明する。なお、ここでは、NN法を用いた分離平面の生成について説明する。
<Method of generating separation plane considering browsing frequency>
Next, processing of the history class separation unit 203 when performing weighting processing using content browsing frequency and generating a separation plane using the weighted feature vector will be described. Here, generation of a separation plane using the NN method will be described.

図19は、閲覧頻度を考慮して特徴ベクトルの重心を求める処理を示す概念図でありNodeA〜Cに対応したコンテンツc1〜c3の特徴ベクトルの位置を表す特徴空間を示す概念図である。コンテンツc1の閲覧頻度は3回、コンテンツc2の閲覧頻度は1回、コンテンツc3の閲覧頻度は10回とする。なお、閲覧履歴テーブル207cは、閲覧されたコンテンツの閲覧履歴、閲覧されていないコンテンツの不閲覧履歴を記憶しておくことが好ましく、それぞれの頻度を保持または計算可能に記憶しておくことが必要である。   FIG. 19 is a conceptual diagram illustrating a process for obtaining the center of gravity of a feature vector in consideration of the browsing frequency, and is a conceptual diagram illustrating a feature space representing the positions of the feature vectors of the contents c1 to c3 corresponding to the Nodes A to C. The browsing frequency of the content c1 is 3 times, the browsing frequency of the content c2 is 1 time, and the browsing frequency of the content c3 is 10 times. The browsing history table 207c preferably stores the browsing history of the browsed content and the non-viewing history of the content that has not been browsed, and it is necessary to store each frequency so that it can be held or calculated. It is.

この場合、これらコンテンツc1〜c3の重心は、以下の式(1)により計算される。

Figure 2010181966


なお、ciは閲覧されたコンテンツの特徴ベクトル、niは閲覧頻度である。 In this case, the center of gravity of the contents c1 to c3 is calculated by the following equation (1).
Figure 2010181966


Here, ci is the feature vector of the browsed content, and ni is the browsing frequency.

この計算を行うことにより重心が定まる。また、図示していないが閲覧されていないコンテンツについても同様に式(1)を用いて、閲覧さていないコンテンツの特徴ベクトルを用いてその重心を求める。そして、閲覧されていないコンテンツの重心から閲覧されたコンテンツの重心に対して結んだ直線をユーザ特性ベクトルとして求めることができる。なお、この直線は、分離平面に直交する直線と同じ向きを取るものであり、分離平面を算出し、この分離平面に直交する直交ベクトルを求めるようにしてもよいが、NN法においては必ずしも分離平面は必要とはならない。   By performing this calculation, the center of gravity is determined. Further, for the content that is not shown but is not browsed, the center of gravity is obtained using the feature vector of the content that has not been browsed using Equation (1). Then, a straight line connecting the centroid of the browsed content to the centroid of the browsed content can be obtained as the user characteristic vector. This straight line has the same direction as the straight line orthogonal to the separation plane, and the separation plane may be calculated to obtain an orthogonal vector orthogonal to the separation plane. However, in the NN method, the separation is not necessarily performed. A plane is not required.

これにより、コンテンツの閲覧頻度を利用してユーザ特性ベクトルを求めることができ、閲覧頻度を利用しない場合と比較して、ユーザの嗜好に近いユーザ特性ベクトルを求めることができる。よって、ユーザの嗜好にそったコンテンツの評価を行うことができる。   Thereby, the user characteristic vector can be obtained using the browsing frequency of the content, and the user characteristic vector close to the user's preference can be obtained as compared with the case where the browsing frequency is not used. Therefore, it is possible to evaluate the content according to the user's preference.

<選択順位を考慮した分離平面の生成方法>
つぎに、閲覧したコンテンツの順番を考慮して分離平面を生成するときの履歴クラス分離部203の処理について説明する。一般的に、直近にアクセスしたコンテンツの方が、その前にアクセスしたコンテンツより重要である、またはユーザの嗜好に近いものであると考えることができる。この時間差が大きくなればなるほど、ユーザの嗜好に変化が生じ、より直近にアクセスしたコンテンツを重要と考えることが顕著となる。ここでは、その時間差(時系列成分)を考慮して分離平面を生成するときの処理について説明する。
<Method for generating separation plane in consideration of selection order>
Next, processing of the history class separation unit 203 when generating a separation plane in consideration of the order of the browsed contents will be described. In general, it can be considered that the most recently accessed content is more important than the previously accessed content or closer to the user's preference. As this time difference becomes larger, the user's preference changes, and it becomes more prominent that content accessed more recently is important. Here, processing when generating a separation plane in consideration of the time difference (time-series component) will be described.

図20は、履歴クラス分離部203が分離平面を生成する際において、そのアクセスされた時系列順にNN法によりユーザ特性ベクトルを生成するときの処理を示す説明図であって、図20(a)は、そのときのメニュー画面を示す説明図であり、図20(b)は、ユーザが選択したコンテンツの選択履歴を示す説明図であり、図20(c)は、特徴空間における各コンテンツの特徴ベクトルを表した概念図であり、図20(d)は、選択順を考慮した分離平面を生成することを説明するための概念図である。なお、選択履歴は、閲覧履歴テーブル207cに記憶される。   FIG. 20 is an explanatory diagram showing processing when the user class vector is generated by the NN method in the accessed time-series order when the history class separation unit 203 generates the separation plane, and FIG. FIG. 20 is an explanatory diagram showing a menu screen at that time, FIG. 20B is an explanatory diagram showing a selection history of content selected by the user, and FIG. 20C is a feature of each content in the feature space. FIG. 20D is a conceptual diagram for explaining the generation of a separation plane in consideration of the selection order. The selection history is stored in the browsing history table 207c.

図20(a)に示されるように、NodeAからNodeFからメニュー画面が構成されている。ここでは図20(b)に示すようにNodeA、NodeB、NodeCの順にコンテンツが選択されている。よって、NodeA、NodeB、NodeCが満足クラスに分類されるコンテンツとなり、NodeD、NodeE、NodeFが不満足クラスに分類されるコンテンツとなる。   As shown in FIG. 20A, a menu screen is configured from Node A to Node F. Here, as shown in FIG. 20B, contents are selected in the order of Node A, Node B, and Node C. Therefore, NodeA, NodeB, and NodeC are contents classified into the satisfaction class, and NodeD, NodeE, and NodeF are contents classified into the dissatisfaction class.

つぎに、図20(c)および図20(d)を用いて、分離平面を生成するときの処理を示す概念について説明する。図20(c)に示されるように、NodeAからNodeFは、その特徴ベクトルにしたがって特徴空間上に位置づけられている。そして、直近に選択したコンテンツの特徴ベクトルの影響が大きくなるように計算される。図20(d)に示されるように、満足クラスにおける重心を求めるため、まず、NodeAとNodeBとの中点w1が計算される。そして、この中点w1とNodeCとの中点w2が計算される。   Next, with reference to FIG. 20C and FIG. 20D, the concept indicating the process when generating the separation plane will be described. As shown in FIG. 20C, Node A to Node F are positioned on the feature space according to their feature vectors. Then, the calculation is performed so that the influence of the feature vector of the most recently selected content is increased. As shown in FIG. 20D, in order to obtain the center of gravity in the satisfaction class, first, the midpoint w1 between Node A and Node B is calculated. Then, a midpoint w2 between the midpoint w1 and NodeC is calculated.

一方、不満足クラスにおいては、NodeD、NodeE、NodeFに基づいて重心w3が計算される。不満足クラスにおいては選択順という概念がないため、通常の処理と同じく、その3つのNodeに基づいた重心w3が計算される。そして、中点w2と重心w3とを結んだ線が垂線となる分離平面vが生成される。なお、本実施形態においてはこの分離平面vに直交する直交ベクトルをユーザ特性ベクトルとするものであり、これは、重心w3から中点w2に向けて結んだ直線と同じである。実施形態での説明の便宜上、分離平面を求めているが、NN法を用いる場合においては分離平面を求めることは必須のものではない。   On the other hand, in the dissatisfied class, the center of gravity w3 is calculated based on NodeD, NodeE, and NodeF. Since there is no concept of selection order in the dissatisfied class, the centroid w3 based on the three nodes is calculated as in the normal processing. Then, a separation plane v in which a line connecting the middle point w2 and the center of gravity w3 is a perpendicular is generated. In the present embodiment, an orthogonal vector orthogonal to the separation plane v is used as a user characteristic vector, which is the same as a straight line connected from the center of gravity w3 toward the middle point w2. For the convenience of explanation in the embodiment, the separation plane is obtained. However, when the NN method is used, obtaining the separation plane is not essential.

このように、特徴ベクトルと特徴ベクトルとの中点を算出し、またその中点と特徴ベクトルとの中点を算出し、時系列的に順に中点を算出する(NN法を適用する)ことにより、前のアクセス履歴ほど重みが小さくなり、時系列順位を考慮した重心を算出することができる。   In this way, the midpoint between the feature vector and the feature vector is calculated, the midpoint between the midpoint and the feature vector is calculated, and the midpoint is calculated sequentially in time series (the NN method is applied). Thus, the weight becomes smaller as the previous access history, and the center of gravity can be calculated in consideration of the time series order.

<操作メニューへの適用>
ところで、上述の各方法では、メニュー画面として、ウエブサイトである情報配信サーバ200から送信されたメニュー画面を例に説明したが、これに限るものではなく、例えば、携帯電話機100の操作メニューに対して、レコメンド情報としてレコメンド操作情報を表示するようにしてもよい。
<Apply to operation menu>
By the way, in each of the above-described methods, the menu screen transmitted from the information distribution server 200 which is a website has been described as an example of the menu screen. However, the present invention is not limited to this, and for example, for the operation menu of the mobile phone 100 Then, the recommendation operation information may be displayed as the recommendation information.

例えば、操作メニューにおける各操作項目に対して、特徴ベクトルが割り振られており、ユーザの操作履歴に従って、ユーザ操作に関するユーザ特性ベクトルが生成され、ユーザがレコメンド操作情報の要求を発すると、そのユーザ特性ベクトルに基づいてレコメンド操作情報を生成するようにしてもよい。なお、操作履歴情報は、所定のタイミングで携帯電話機100から情報配信サーバ200に送信され、記憶されるように構成されている。   For example, a feature vector is assigned to each operation item in the operation menu, a user characteristic vector related to the user operation is generated according to the user operation history, and when the user issues a request for recommendation operation information, the user characteristic Recommendation operation information may be generated based on a vector. The operation history information is transmitted from the mobile phone 100 to the information distribution server 200 at a predetermined timing and stored.

図21は、操作に関する特徴空間における特徴ベクトルのパラメータを示す説明図である。図21に示すように、携帯電話機100の端末機能として、「着もじ」「テレビ電話」「ワンセグ」「画面メモ」「テキストメモ」が規定されている。また、特徴ベクトルを構成するパラメータとして「電話」「インターネット」「テキスト」「メモ」「テレビ」が規定されている。このように、携帯電話機100の機能に特徴ベクトルが規定されている。例えば、「着もじ」には、「電話」「テキスト」のパラメータに1がふられており、電話、テキストに関連のある機能であることが示されている。配信情報格納部205には、全ての端末機能情報が記憶され、ユーザが操作メニューを表示する操作をするときには、その旨が通知され、コンテンツ評価部206は、操作情報の評価を行って適切なレコメンド操作情報を生成し、コンテンツ送信部208は、レコメンド操作情報を送信し、携帯電話機100においてそれを表示させることができる。   FIG. 21 is an explanatory diagram illustrating feature vector parameters in a feature space related to an operation. As shown in FIG. 21, “Chaku-moji”, “Videophone”, “One Seg”, “Screen Memo”, and “Text Memo” are defined as the terminal functions of the mobile phone 100. Also, “telephone”, “Internet”, “text”, “memo”, and “television” are defined as parameters constituting the feature vector. Thus, feature vectors are defined for the functions of the mobile phone 100. For example, in “Chaku-moji”, 1 is assigned to the parameters of “telephone” and “text”, indicating that the function is related to telephone and text. All the terminal function information is stored in the distribution information storage unit 205, and when the user performs an operation to display the operation menu, the fact is notified, and the content evaluation unit 206 evaluates the operation information and selects an appropriate one. The recommendation operation information is generated, and the content transmission unit 208 can transmit the recommendation operation information and display it on the mobile phone 100.

このように操作メニューに対しても本実施形態の評価方法を適用し、レコメンド操作情報をユーザに提供することで、ユーザがよく使う操作に類似または関連した操作をユーザに通知することができる。   As described above, by applying the evaluation method of the present embodiment to the operation menu and providing the recommended operation information to the user, it is possible to notify the user of an operation similar or related to the operation frequently used by the user.

また、情報配信サーバ200に接続することなく、携帯電話機内で処理を行うことも考えられる。図22は、レコメンド操作情報を表示することができる携帯電話機100aの機能を示すブロック図である。このハードウェア構成は図3と同じである。   It is also conceivable to perform processing within the mobile phone without connecting to the information distribution server 200. FIG. 22 is a block diagram showing functions of the mobile phone 100a capable of displaying recommendation operation information. This hardware configuration is the same as in FIG.

この携帯電話機100aは、操作部101a、レコメンド操作表示部104a、履歴クラス分離部105、ユーザ特性ベクトル計算部106、操作情報評価部107、操作情報格納部108、および履歴格納部109を含んで構成されている。   The mobile phone 100a includes an operation unit 101a, a recommendation operation display unit 104a, a history class separation unit 105, a user characteristic vector calculation unit 106, an operation information evaluation unit 107, an operation information storage unit 108, and a history storage unit 109. Has been.

以下、各構成について説明する。操作部101aは、携帯電話機100aに搭載されている各機能を実行するための部分であり、テンキー、タッチパネルなどで構成されている。   Each configuration will be described below. The operation unit 101a is a part for executing each function mounted on the mobile phone 100a, and includes a numeric keypad, a touch panel, and the like.

レコメンド操作表示部104aは、レコメンド操作情報を表示する部分であり、後述するようにユーザの操作履歴に従って定められたユーザにとって未知の操作を示すレコメンド操作情報を表示する部分である。   The recommendation operation display unit 104a is a part for displaying recommendation operation information, and is a part for displaying recommendation operation information indicating an operation unknown to the user determined according to the user operation history as will be described later.

履歴クラス分離部105、ユーザ特性ベクトル計算部106、操作情報評価部107、操作情報格納部108、および履歴格納部109は、それぞれ図2にて示されている情報配信サーバ200の履歴クラス分離部203、ユーザ特性ベクトル計算部204、配信情報格納部205、コンテンツ評価部206および履歴格納部207に相当するものであり、履歴クラス分離部105において、同一操作メニュー内において操作された機能、操作されていない機能をそれぞれ満足機能、不満足機能に分離する分離平面を生成し、ユーザ特性ベクトル計算部106は、生成された分離平面に直交する直交ベクトルをユーザ特性ベクトルとする。操作情報評価部107は、計算されたユーザ特性ベクトルにしたがって、各機能特徴ベクトルに基づいて評価をし、高評価の機能については、操作メニュー上に表示するようにそのメニュー画面を編集する。ユーザは、操作メニューを表示させるときには、その操作メニュー上でその高評価された機能を確認することができる。   The history class separation unit 105, the user characteristic vector calculation unit 106, the operation information evaluation unit 107, the operation information storage unit 108, and the history storage unit 109 are each a history class separation unit of the information distribution server 200 shown in FIG. 203, a user characteristic vector calculation unit 204, a distribution information storage unit 205, a content evaluation unit 206, and a history storage unit 207. In the history class separation unit 105, the functions and operations operated in the same operation menu are performed. A separation plane that separates the unsatisfied functions into satisfactory functions and unsatisfactory functions is generated, and the user characteristic vector calculation unit 106 sets an orthogonal vector orthogonal to the generated separation plane as a user characteristic vector. The operation information evaluation unit 107 performs evaluation based on each function feature vector in accordance with the calculated user characteristic vector, and edits the menu screen so that a highly evaluated function is displayed on the operation menu. When displaying the operation menu, the user can confirm the highly evaluated function on the operation menu.

つぎに、本実施形態の携帯電話機100および情報配信サーバ200の作用効果について説明する。情報配信サーバ200において、所定のタイミングで、特徴ベクトル生成部209は、Webページなどのコンテンツを収集し、そのコンテンツの特徴を示すキーワードを抽出して、特徴ベクトルを生成する。生成した特徴ベクトルは、コンテンツ特徴ベクトル管理テーブル207bに記憶され、更新される。   Next, functions and effects of the mobile phone 100 and the information distribution server 200 of this embodiment will be described. In the information distribution server 200, at a predetermined timing, the feature vector generation unit 209 collects content such as a Web page, extracts a keyword indicating the feature of the content, and generates a feature vector. The generated feature vector is stored and updated in the content feature vector management table 207b.

この収集のタイミングは、任意のタイミングや、Webページが更新されたタイミング(これは更新通知信号を受信するなどして)である。このように任意のタイミングで収集処理、特徴ベクトル生成処理が行われることで、選択対象項目、例えばテレビ番組やCDの紹介情報などのコンテンツの最新情報に追従して選択項目に基づくコンテンツ、例えばWebページを取得して、その特徴ベクトルを生成することができる。   The collection timing is an arbitrary timing or a timing at which the Web page is updated (for example, by receiving an update notification signal). In this way, collection processing and feature vector generation processing are performed at an arbitrary timing, so that content based on the selection item, for example, Web, follows the latest information on the selection target item, for example, TV program or CD introduction information. A page can be acquired and its feature vector can be generated.

一方、携帯電話機100において、ユーザがブラウザを操作することにより、メニュー画面が表示され、Node1〜Node5などのコンテンツを表す複数の選択対象項目が表示される。そして、ユーザ操作により、これらコンテンツから任意の一のコンテンツを選択すると、携帯電話機100は情報配信サーバ200に選択されたコンテンツおよび選択されなかったコンテンツを送信し、情報配信サーバ200(コンテンツ要求受信部201)はこれを受け付ける。コンテンツ要求受信部201は、選択されたコンテンツを、コンテンツプロバイダから取得し、コンテンツ送信部208はこれを携帯電話機100に送信する。   On the other hand, in the mobile phone 100, when the user operates the browser, a menu screen is displayed, and a plurality of selection target items representing contents such as Node1 to Node5 are displayed. When any one of these contents is selected by the user operation, the mobile phone 100 transmits the selected content and the unselected content to the information distribution server 200, and the information distribution server 200 (content request receiving unit) 201) accepts this. The content request receiving unit 201 acquires the selected content from the content provider, and the content transmitting unit 208 transmits this to the mobile phone 100.

また、閲覧履歴テーブル207cは、選択されたコンテンツの特徴ベクトルおよび選択されなかったコンテンツの特徴ベクトルを記憶する。履歴クラス分離部203は、閲覧履歴テーブル207cに記憶されている選択されたコンテンツの特徴ベクトルと選択されなかったコンテンツの特徴ベクトルとを、特徴空間内で分離するための分離平面を生成する。そして、ユーザ特性ベクトル計算部204は、生成された分離平面に直交する直交ベクトルに基づいてユーザ特性ベクトルを生成し、これをユーザ特性ベクトル管理テーブル207aに記憶させる。その後、レコメンド要求をレコメンド要求受信部202が受信すると、コンテンツ評価部206は、記憶されているユーザ特性ベクトルに基づいて、コンテンツの評価を行う。   Also, the browsing history table 207c stores the feature vector of the selected content and the feature vector of the content that has not been selected. The history class separation unit 203 generates a separation plane for separating the feature vector of the selected content stored in the browsing history table 207c and the feature vector of the unselected content in the feature space. Then, the user characteristic vector calculation unit 204 generates a user characteristic vector based on the orthogonal vector orthogonal to the generated separation plane, and stores this in the user characteristic vector management table 207a. Thereafter, when the recommendation request receiving unit 202 receives the recommendation request, the content evaluation unit 206 evaluates the content based on the stored user characteristic vector.

これにより、ユーザの特徴を示すベクトルにしたがってコンテンツの評価を行うことができ、ユーザの趣味・嗜好など、またアクセス履歴などの直接的な情報に基づいて推薦すべきコンテンツを評価することがなく、漏れのないコンテンツをユーザに提供することができる。また、ユーザが潜在的に望んでいるコンテンツなどのレコメンド情報を漏れなく配信することができるようになる。すなわち、選択対象項目、例えばテレビ番組やCDの紹介情報などのコンテンツの種類に応じて特徴ベクトルが更新されることにより、コンテンツの種類に特化されたレコメンド情報をユーザに提供することができる。   Thereby, it is possible to evaluate the content according to the vector indicating the user's characteristics, without evaluating the content to be recommended based on the user's hobbies / preferences, direct information such as the access history, Content without omission can be provided to the user. In addition, recommendation information such as contents that the user potentially desires can be distributed without omission. In other words, the feature vector is updated according to the type of content such as the selection target item, for example, TV program or CD introduction information, so that recommendation information specialized to the type of content can be provided to the user.

また、本実施形態の情報配信サーバ200は、履歴クラス分離部203は、選択されなかった全てのコンテンツの特徴ベクトルと選択されたコンテンツの特徴ベクトルとの相対的な位置関係を算出し、当該位置関係に基づいて分離平面を生成することが好ましい。すなわち、選択されなかったまたは選択されたコンテンツの特徴ベクトルに、他の特徴ベクトルを重ねるようその位置関係を計算し、相対空間を形成し、その相対空間において分離平面を生成することが好ましい。これにより、相対的な位置関係を表す相対空間内で分離平面を生成し、これ基づいてユーザ特性ベクトルを生成することができるため、より精度の高いコンテンツの評価を行うことができる。   Further, in the information distribution server 200 according to the present embodiment, the history class separation unit 203 calculates the relative positional relationship between the feature vectors of all the contents not selected and the feature vectors of the selected contents, It is preferable to generate a separation plane based on the relationship. That is, it is preferable to calculate the positional relationship so that another feature vector is superimposed on the feature vector of the content that has not been selected or selected, to form a relative space, and to generate a separation plane in the relative space. Thereby, since the separation plane can be generated in the relative space representing the relative positional relationship and the user characteristic vector can be generated based on the separation plane, it is possible to evaluate the content with higher accuracy.

また、本実施形態の情報配信サーバ200において、閲覧履歴テーブル207cは、コンテンツの閲覧頻度および閲覧されていない不閲覧頻度を記憶しておく。なお、このような閲覧頻度、不閲覧頻度を記憶することなく、閲覧履歴に基づいて閲覧頻度、不閲覧頻度を必要に応じて計算するようにしてもよい。そして、閲覧頻度の高いコンテンツの特徴ベクトルにその頻度に応じた重み付けを行うとともに、不閲覧頻度の高いコンテンツの特徴ベクトルにその頻度に応じた重み付けを行い、その重み付けされた特徴ベクトルに基づいて、満足クラスと不満足クラスとに分離するための分離平面を生成することができる。これにより、頻度に応じてユーザ特性ベクトルを算出することができ、より精度のよいユーザ特性ベクトルを算出し、よってコンテンツの評価をより正確に行うことができる。   In the information distribution server 200 of the present embodiment, the browsing history table 207c stores the browsing frequency of content and the non-browsing frequency that is not browsed. In addition, you may make it calculate a browsing frequency and a non-browsing frequency as needed based on a browsing history, without memorize | storing such a browsing frequency and a non-browsing frequency. Then, the feature vector of the content with high browsing frequency is weighted according to the frequency, the feature vector of the content with high non-viewing frequency is weighted according to the frequency, and based on the weighted feature vector, A separation plane can be generated for separating the satisfaction class and the dissatisfaction class. As a result, the user characteristic vector can be calculated according to the frequency, the user characteristic vector with higher accuracy can be calculated, and the content can be evaluated more accurately.

また、本実施形態の情報配信サーバ200において、コンテンツ管理テーブル205aは、メニュー画面における各コンテンツを選択した時期を、そのコンテンツの特徴ベクトルとともに記憶し、選択時期の新しさの度合いに応じて重み付けされたコンテンツの特徴ベクトルに基づいて分離平面を生成することができる。例えば、NN法においては、時間的に古いコンテンツの特徴ベクトルから順にその重心を求めていくことにより、結果的に選択時期の新しさの度合いに応じた重み付け処理がなされることになる。これにより時系列成分を考慮した重み付けを行うことができ、より精度のよいコンテンツの評価を行うことができる。   In the information distribution server 200 of this embodiment, the content management table 205a stores the time when each content is selected on the menu screen together with the feature vector of the content, and is weighted according to the degree of newness of the selection time. The separation plane can be generated based on the feature vector of the content. For example, in the NN method, the centroid is obtained in order from the feature vector of the content that is older in time, and as a result, a weighting process according to the degree of newness of the selection time is performed. As a result, it is possible to perform weighting in consideration of time-series components, and it is possible to evaluate content with higher accuracy.

また、本実施形態の情報配信サーバ200において、コンテンツ送信部208は、コンテンツ評価部206による評価結果に従って生成されたレコメンド情報を送信することにより、ユーザは役立つ情報を取得することができる。   In the information distribution server 200 of the present embodiment, the content transmission unit 208 transmits recommended information generated according to the evaluation result by the content evaluation unit 206, so that the user can acquire useful information.

また、本実施形態の情報配信サーバ200において、特徴ベクトル生成部209は、更新するために必要な情報を選択項目対象であるWebページから取得する。よって、適切な特徴ベクトルを生成することができる。   Further, in the information distribution server 200 of the present embodiment, the feature vector generation unit 209 acquires information necessary for updating from a Web page that is a selection item target. Therefore, an appropriate feature vector can be generated.

また、本実施形態の情報配信サーバ200において、特徴ベクトル生成部209は、選択対象項目の属性毎に特徴的な単語を品詞毎に抽出する特徴キーワード抽出部209bを備え、特徴キーワード抽出部209bにより抽出されたキーワードに基づいて、特徴ベクトル計算部209cは、特徴ベクトルを計算することができる。   In the information distribution server 200 of the present embodiment, the feature vector generation unit 209 includes a feature keyword extraction unit 209b that extracts a characteristic word for each part of speech for each attribute of the selection target item, and the feature keyword extraction unit 209b Based on the extracted keyword, the feature vector calculation unit 209c can calculate a feature vector.

この発明によれば、選択対象項目の属性毎に特徴的なキーワードを品詞に毎に抽出し、抽出されたキーワードに基づいて、特徴ベクトルを生成することで、適切な特徴ベクトルを生成することができる。   According to the present invention, a characteristic keyword is extracted for each part of speech for each attribute of the selection target item, and an appropriate feature vector can be generated by generating a feature vector based on the extracted keyword. it can.

この特徴キーワード抽出部209bは、TF/IDF法に基づいて、選択対象項目の属性毎に特徴的なキーワードを抽出してもよいし、また、PMM法に基づいて、選択対象項目の属性毎に特徴的なキーワードを抽出するようにしてもよい。   The feature keyword extraction unit 209b may extract a characteristic keyword for each attribute of the selection target item based on the TF / IDF method, or for each attribute of the selection target item based on the PMM method. A characteristic keyword may be extracted.

100…携帯電話機、100a…携帯電話機、101…ブラウザ、101a…操作部、102…履歴送信部、103…レコメンド要求送信部、104…配信情報表示部、104a…レコメンド操作表示部、105…履歴クラス分離部、106…ユーザ特性ベクトル計算部、107…操作情報評価部、108…操作情報格納部、109…履歴格納部、200…情報配信サーバ、201…コンテンツ要求受信部、202…レコメンド要求受信部、203…履歴クラス分離部、204…ユーザ特性ベクトル計算部、205…配信情報格納部、205a…コンテンツ管理テーブル、206…コンテンツ評価部、207…履歴格納部、207a…ユーザ特性ベクトル管理テーブル、207b…コンテンツ特徴ベクトル管理テーブル、207c…閲覧履歴テーブル、208…コンテンツ送信部、209…特徴ベクトル生成部。 DESCRIPTION OF SYMBOLS 100 ... Mobile phone, 100a ... Mobile phone, 101 ... Browser, 101a ... Operation part, 102 ... History transmission part, 103 ... Recommendation request transmission part, 104 ... Delivery information display part, 104a ... Recommendation operation display part, 105 ... History class Separation unit 106 ... User characteristic vector calculation unit 107 ... Operation information evaluation unit 108 ... Operation information storage unit 109 ... History storage unit 200 ... Information distribution server 201 ... Content request reception unit 202 ... Recommendation request reception unit , 203 ... history class separation unit, 204 ... user characteristic vector calculation unit, 205 ... distribution information storage unit, 205a ... content management table, 206 ... content evaluation unit, 207 ... history storage unit, 207a ... user characteristic vector management table, 207b ... Content feature vector management table, 207c ... Browsing history Buru, 208 ... content transmission unit, 209 ... feature vector generation unit.

Claims (9)

選択対象項目の特徴空間を構成する特徴ベクトルを生成する特徴ベクトル生成手段と、
前記特徴ベクトル生成手段により生成された特徴ベクトルを記憶する特徴ベクトル記憶手段と、
ユーザ操作により、複数の選択対象項目から一の選択対象項目を選択することを受け付ける受付手段と、
前記受付手段により受け付けられ、選択された選択対象項目、および選択されなかった選択対象項目を区別して記憶する履歴記憶手段と、
前記履歴記憶手段により記憶された、選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを特徴空間内で分離するための分離平面に直交する直交ベクトルをユーザ特性ベクトルとするユーザ特性ベクトル生成手段と、
前記ユーザ特性ベクトル生成手段により生成されたユーザ特性ベクトルに基づいて、未知の選択対象項目の評価を行う評価手段と、を備え、
前記特徴ベクトル生成手段は、生成した特徴ベクトルに基づいて、前記特徴ベクトル記憶手段に記憶されている特徴ベクトルを更新することを特徴とするレコメンド情報評価装置。
Feature vector generating means for generating a feature vector constituting the feature space of the selection target item;
Feature vector storage means for storing the feature vector generated by the feature vector generation means;
Accepting means for accepting selection of one selection target item from a plurality of selection target items by a user operation;
A history storage means for distinguishing and storing selected selection target items and unselected selection target items received by the reception means;
The orthogonal vector orthogonal to the separation plane for separating the satisfactory feature vector of the selected selection target item and the unsatisfactory feature vector of the unselected selection target item stored in the history storage means in the feature space. User characteristic vector generating means as a characteristic vector;
Evaluation means for evaluating an unknown selection target item based on the user characteristic vector generated by the user characteristic vector generation means,
The feature vector generation unit updates the feature vector stored in the feature vector storage unit based on the generated feature vector.
前記履歴記憶手段により記憶されている選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを特徴空間内で分離するための分離平面を生成する分離平面生成手段をさらに備え、
前記ユーザ特性ベクトル生成手段は、前記分離平面生成手段により生成された分離平面に従ってユーザ特性ベクトルを生成することを特徴とする
請求項1に記載のレコメンド情報評価装置。
Separation plane generating means for generating a separation plane for separating in the feature space the satisfaction feature vector of the selected selection target item stored in the history storage means and the unsatisfactory feature vector of the selection target item that has not been selected. Further comprising
The recommendation information evaluation apparatus according to claim 1, wherein the user characteristic vector generation unit generates a user characteristic vector according to the separation plane generated by the separation plane generation unit.
前記特徴ベクトル生成手段は、更新するために必要な情報を選択項目対象である文書情報から取得することを特徴とする請求項1または2に記載のレコメンド情報評価装置。   The recommendation information evaluation apparatus according to claim 1, wherein the feature vector generation unit acquires information necessary for updating from document information that is a selection item target. 前記文書情報は、Webページであることを特徴とする請求項3に記載のレコメンド情報評価装置。   The recommendation information evaluation apparatus according to claim 3, wherein the document information is a Web page. 前記特徴ベクトル生成手段は、選択対象項目の属性毎に特徴的な単語を品詞毎に抽出する特徴抽出手段をさらに備え、
前記特徴抽出手段により抽出された単語に基づいて、特徴ベクトルを生成することを特徴とする請求項1から4のいずれか一項に記載のレコメンド情報評価装置。
The feature vector generation means further includes feature extraction means for extracting a characteristic word for each part of speech for each attribute of the selection target item,
The recommendation information evaluation apparatus according to claim 1, wherein a feature vector is generated based on the word extracted by the feature extraction unit.
前記特徴抽出手段は、TF/IDF法に基づいて、選択対象項目の属性毎に特徴的な単語を抽出することを特徴とする請求項5に記載のレコメンド情報評価装置。   The recommendation information evaluation apparatus according to claim 5, wherein the feature extraction unit extracts a characteristic word for each attribute of the selection target item based on a TF / IDF method. 前記特徴抽出手段は、PMM法に基づいて、選択対象項目の属性毎に特徴的な単語を抽出することを特徴とする請求項5に記載のレコメンド情報評価装置。   The recommendation information evaluation apparatus according to claim 5, wherein the feature extraction unit extracts a characteristic word for each attribute of the selection target item based on a PMM method. 前記特徴ベクトル生成手段は、特徴ベクトルを任意のタイミングで生成することを特徴とする請求項1から7のいずれか一項に記載のレコメンド情報評価装置。   The recommendation information evaluation apparatus according to claim 1, wherein the feature vector generation unit generates a feature vector at an arbitrary timing. 選択対象項目の特徴空間を構成する特徴ベクトルを生成する特徴ベクトル生成ステップと、
前記特徴ベクトル生成ステップにおいて生成された特徴ベクトルを特徴ベクトル記憶手段に記憶する特徴ベクトル記憶ステップと、
ユーザ操作により、複数の選択対象項目から一の選択対象項目を選択することを受け付ける受付ステップと、
前記受付ステップにおいて受け付けられ、選択された選択対象項目および選択されなかった選択対象項目を履歴記憶手段に記憶する履歴記憶ステップと、
前記履歴記憶手段に記憶された、選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを、特徴空間内で分離するための分離平面に直交する直交ベクトルに基づいてユーザ特性ベクトルを生成するユーザ特性ベクトル生成ステップと、
前記ユーザ特性ベクトル生成ステップにより生成されたユーザ特性ベクトルに基づいて、レコメンド情報の評価を行う評価ステップと、を備え、
前記特徴ベクトル生成ステップは、生成した特徴ベクトルに基づいて、前記特徴ベクトル記憶手段に記憶された特徴ベクトルを更新することを特徴とするレコメンド情報評価方法。
A feature vector generation step for generating a feature vector constituting the feature space of the selection target item;
A feature vector storage step of storing the feature vector generated in the feature vector generation step in a feature vector storage means;
A reception step for accepting selection of one selection target item from a plurality of selection target items by a user operation;
A history storage step of storing in the history storage means the selected selection target item and the non-selected selection target item received in the reception step;
An orthogonal vector orthogonal to a separation plane for separating the satisfaction feature vector of the selected selection target item and the unsatisfactory feature vector of the selection target item not selected, stored in the history storage unit, in the feature space. Generating a user characteristic vector based on the user characteristic vector generating step;
An evaluation step for evaluating recommendation information based on the user characteristic vector generated by the user characteristic vector generation step, and
In the feature vector generation step, the feature vector stored in the feature vector storage unit is updated based on the generated feature vector.
JP2009022880A 2009-02-03 2009-02-03 Device and method for evaluating recommendation information Pending JP2010181966A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009022880A JP2010181966A (en) 2009-02-03 2009-02-03 Device and method for evaluating recommendation information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009022880A JP2010181966A (en) 2009-02-03 2009-02-03 Device and method for evaluating recommendation information

Publications (1)

Publication Number Publication Date
JP2010181966A true JP2010181966A (en) 2010-08-19

Family

ID=42763529

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009022880A Pending JP2010181966A (en) 2009-02-03 2009-02-03 Device and method for evaluating recommendation information

Country Status (1)

Country Link
JP (1) JP2010181966A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012064166A (en) * 2010-09-17 2012-03-29 Kddi Corp Content creation device and content creation method
JP2014203442A (en) * 2013-04-10 2014-10-27 株式会社Nttドコモ Recommendation information generation device and recommendation information generation method
WO2015029809A1 (en) * 2013-08-29 2015-03-05 日本電気株式会社 Data analysis method, program, and apparatus
CN111737582A (en) * 2020-07-29 2020-10-02 腾讯科技(深圳)有限公司 Content recommendation method and device
JP2021033602A (en) * 2019-08-23 2021-03-01 Kddi株式会社 Information processing device, vector generation method, and program
WO2021153505A1 (en) * 2020-01-28 2021-08-05 株式会社電通 Prediction device, prediction method, and prediction program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003036262A (en) * 2001-07-23 2003-02-07 Nippon Telegr & Teleph Corp <Ntt> Important sentence extraction method, device, program, and recording medium recorded with the program
JP2007018389A (en) * 2005-07-08 2007-01-25 Just Syst Corp Data retrieval apparatus, data retrieving method, data retrieval program, and computer readable recording medium
JP2009009184A (en) * 2007-06-26 2009-01-15 Sony Corp Information processor and processing method, and program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003036262A (en) * 2001-07-23 2003-02-07 Nippon Telegr & Teleph Corp <Ntt> Important sentence extraction method, device, program, and recording medium recorded with the program
JP2007018389A (en) * 2005-07-08 2007-01-25 Just Syst Corp Data retrieval apparatus, data retrieving method, data retrieval program, and computer readable recording medium
JP2009009184A (en) * 2007-06-26 2009-01-15 Sony Corp Information processor and processing method, and program

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNH200700185006; 大槻一博: '携帯向けオンラインニュース配信のための視聴/非視聴履歴に基づく嗜好クラスター管理手法' NHK技研R&D NO.106, 20071115, pp.74-81, 日本放送出版協会 *
JPN6013002880; 大槻一博: '携帯向けオンラインニュース配信のための視聴/非視聴履歴に基づく嗜好クラスター管理手法' NHK技研R&D NO.106, 20071115, pp.74-81, 日本放送出版協会 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012064166A (en) * 2010-09-17 2012-03-29 Kddi Corp Content creation device and content creation method
US9015158B2 (en) 2010-09-17 2015-04-21 Kddi Corporation Contents creating device and contents creating method
JP2014203442A (en) * 2013-04-10 2014-10-27 株式会社Nttドコモ Recommendation information generation device and recommendation information generation method
WO2015029809A1 (en) * 2013-08-29 2015-03-05 日本電気株式会社 Data analysis method, program, and apparatus
JPWO2015029809A1 (en) * 2013-08-29 2017-03-02 日本電気株式会社 Data analysis method, program, and apparatus
JP2021033602A (en) * 2019-08-23 2021-03-01 Kddi株式会社 Information processing device, vector generation method, and program
JP7200069B2 (en) 2019-08-23 2023-01-06 Kddi株式会社 Information processing device, vector generation method and program
WO2021153505A1 (en) * 2020-01-28 2021-08-05 株式会社電通 Prediction device, prediction method, and prediction program
JP2021117818A (en) * 2020-01-28 2021-08-10 株式会社電通 Prediction device, prediction method, and prediction program
CN111737582A (en) * 2020-07-29 2020-10-02 腾讯科技(深圳)有限公司 Content recommendation method and device

Similar Documents

Publication Publication Date Title
JP5328212B2 (en) RECOMMENDATION INFORMATION EVALUATION DEVICE AND RECOMMENDATION INFORMATION EVALUATION METHOD
JP5166949B2 (en) RECOMMENDATION INFORMATION GENERATION DEVICE AND RECOMMENDATION INFORMATION GENERATION METHOD
KR101506380B1 (en) Infinite browse
US10607235B2 (en) Systems and methods for curating content
US9396485B2 (en) Systems and methods for presenting content
US20070143300A1 (en) System and method for monitoring evolution over time of temporal content
CN103733159A (en) Synchronizing digital content
US10482142B2 (en) Information processing device, information processing method, and program
US10783192B1 (en) System, method, and user interface for a search engine based on multi-document summarization
JP2010181966A (en) Device and method for evaluating recommendation information
KR101873339B1 (en) System and method for providing interest contents
JP2012242844A (en) Recommendation information generation device and recommendation information generation method
JP5805134B2 (en) Terminal device and device program
KR101866411B1 (en) Method for providing document recommandation information, and device using the same
WO2009125622A1 (en) Electronic bulletin board system
KR20140056635A (en) System and method for providing contents recommendation service
JP5248376B2 (en) Information distribution apparatus and information distribution method
JP5183282B2 (en) RECOMMENDATION INFORMATION EVALUATION DEVICE AND RECOMMENDATION INFORMATION EVALUATION METHOD
JP2017073070A (en) Content recommendation device, content recommendation system, content recommendation method, and program
JP5819336B2 (en) Web site management device
JP5813026B2 (en) Terminal device and device program
KR20140072243A (en) Web site using the Query window advertising method and system
KR20160070964A (en) Method of providing contents with removing the displayed contents and system thereof

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110829

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130129

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130326

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130507