JP2014110004A - Information processor and information processing method and data structure - Google Patents
Information processor and information processing method and data structure Download PDFInfo
- Publication number
- JP2014110004A JP2014110004A JP2012265491A JP2012265491A JP2014110004A JP 2014110004 A JP2014110004 A JP 2014110004A JP 2012265491 A JP2012265491 A JP 2012265491A JP 2012265491 A JP2012265491 A JP 2012265491A JP 2014110004 A JP2014110004 A JP 2014110004A
- Authority
- JP
- Japan
- Prior art keywords
- determination
- information
- node
- nodes
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、ユーザの嗜好にあったコンテンツを推薦する際に用いて好適な情報処理装置及び情報処理方法並びにデータ構造に関する。 The present invention relates to an information processing apparatus, an information processing method, and a data structure that are suitable for use when recommending content that meets a user's preference.
動画等のコンテンツの視聴や録画を行う際に、コンテンツの内容を表す文字、コード等からなるメタ情報を用いて、ユーザの嗜好にあったコンテンツを自動的に抽出して推薦する技術がある。例えば、特許文献1には、ネットワークを介して他のユーザの嗜好度を表すデータ利用することで、本人の嗜好にあったコンテンツを自動的に選択可能とする技術が示されている。
There is a technique for automatically extracting and recommending content that suits the user's preference using meta-information including characters, codes, and the like representing the content when viewing or recording content such as a moving image. For example,
また、特許文献2には、ベイジアンネットワーク(Bayesian Network)を用いて生成した嗜好モデルを利用してコンテンツの推薦するための技術が示されている。特許文献2に記載されている嗜好モデルは、複数のノードと、複数のノードの親子関係を示す接続情報とから表されている。ここで、複数のノードは、番組情報に含まれている各項目等に対応した確率変数を表す。また、親ノードと子ノードとの間の接続は、因果関係、すなわち原因と結果との関係を表す。これらの各ノード間の関係は、有向グラフで表される。さらに、親ノードと子ノードとの間の因果関係は、条件付き確率で表される。すなわち、親ノードの確率変数で求めた結果を条件として子ノードの確率変数が求められる。この各ノードが表す条件付き確率の値は、ユーザの各項目に対する視聴確率に対応している。なお、特許文献2のシステムでは、嗜好モデル学習部が、過去の一定期間の視聴履歴に基づいて嗜好モデル内の条件付き確率の値を計算する。
特許文献1に記載されている技術では、他のユーザの嗜好の度合いを示すデータを利用することで、本人の嗜好を推定する際に利用可能な情報量を多くしている。しかし、ネットワーク接続を前提としているため、トラフィック量の増加や、オフライン環境での使用について一定の課題がある。
In the technique described in
一方、特許文献2に記載されている技術では、例えば新しい項目を嗜好モデルに追加する処理に、次のような制約があるという課題がある。すなわち、特許文献2に記載されている嗜好モデルには、複数のノード間に親子関係が存在する。そのため、例えば、新たにノードを追加したり、削除したりすると、その追加したり削除したりしたノードを親ノードとする子ノードの内容も変更しなければならない。したがって、ノードの追加や削除の処理が過大になってしまうという課題がある。
On the other hand, in the technique described in
本発明は、上記の事情を考慮してなされたものであり、上記の課題を解決することができる情報処理装置及び情報処理方法並びにデータ構造を提供することを目的とする。 The present invention has been made in view of the above circumstances, and an object thereof is to provide an information processing apparatus, an information processing method, and a data structure that can solve the above-described problems.
上記課題を解決するため、本発明の情報処理装置は、複数のノードと、前記複数のノード間を方向性を有して接続する複数のエッジとで構成された有向グラフで表され、前記複数のノードが開始ノード又は判定ノードであり、前記判定ノードには、複数の属性情報を用いてコンテンツの属性を表すコンテンツ情報に含まれている前記複数の属性情報うちの1つの属性情報と、当該判定ノードに係るユーザの嗜好度合いを判定するための判定式を表す情報と、が対応づけられていて、前記開始ノードは、該開始ノードに後続する1又は複数の前記判定ノードに対応づけられている1又は複数の前記判定式による1又は複数の判定結果に基づいてユーザの嗜好に関する所定の判定を行うための1又は複数のルールを生成するプログラムの開始点であって、1又は複数の前記判定ノードへの接続情報が対応づけられている、データ構造を有する嗜好モデル、を記憶した記憶部と、前記コンテンツ情報を入力し、前記嗜好モデルに基づいて生成された1又は複数の前記ルールを該コンテンツ情報に対してあてはめることで、ユーザの嗜好を推定する推定部とを備える。 In order to solve the above-described problem, an information processing apparatus according to the present invention is represented by a directed graph including a plurality of nodes and a plurality of edges that connect the plurality of nodes with directionality, and the plurality of nodes The node is a start node or a determination node, and the determination node includes one attribute information among the plurality of attribute information included in the content information representing the attribute of the content using the plurality of attribute information, and the determination Information indicating a determination formula for determining a user's preference degree related to a node is associated with the start node, and the start node is associated with one or more determination nodes subsequent to the start node. At the starting point of a program that generates one or a plurality of rules for making a predetermined determination regarding the user's preference based on one or a plurality of determination results based on one or a plurality of the determination formulas A storage unit storing a preference model having a data structure associated with connection information to one or a plurality of the determination nodes, and the content information is input and generated based on the preference model And an estimation unit that estimates the user's preference by applying one or more of the rules to the content information.
また、本発明の他の情報処理装置は、前記判定ノードには、さらに、当該判定ノードに対応づけられている前記判定式の信頼性を表すための所定のパラメータが対応づけられていて、前記嗜好モデルに基づいて生成された前記ルールには、該ルールを生成する際に基準とした前記1又は複数の判定結果を求めた前記1又は複数の判定式の信頼性を表す前記1又は複数の所定のパラメータを用いて求めた値であって、該ルールの信頼度を表す値が設定されていて、前記推定部が、前記1又は複数のルールを前記コンテンツ情報に対してあてはめる際に、前記各ルールに設定されている前記各信頼度を表す値を利用することを特徴とする。 Further, in another information processing apparatus of the present invention, the determination node is further associated with a predetermined parameter for representing the reliability of the determination expression associated with the determination node. In the rule generated based on the preference model, the one or more representing the reliability of the one or more determination formulas obtained from the one or more determination results used as a reference when generating the rule A value obtained by using a predetermined parameter, and a value representing the reliability of the rule is set, and when the estimation unit applies the one or more rules to the content information, A value representing each reliability set in each rule is used.
また、本発明の他の情報処理装置は、前記嗜好モデルが、複数の前記コンテンツ情報に基づいて生成又は更新されたものであり、前記判定ノードに対応づけられている前記所定のパラメータが、前記嗜好モデルを生成又は更新する際に基準とされた前記複数のコンテンツ情報に当該判定ノードに対応づけられている前記属性情報が出現した頻度に応じたものであることを特徴とする。 In another information processing apparatus of the present invention, the preference model is generated or updated based on a plurality of pieces of the content information, and the predetermined parameter associated with the determination node is It is characterized in that it corresponds to the frequency of appearance of the attribute information associated with the determination node in the plurality of pieces of content information used as a reference when generating or updating a preference model.
また、本発明の他の情報処理装置は、前記推定部が、遺伝的アルゴリズムを用いて、前記嗜好モデルに対して進化処理を行いつつ、前記ユーザの嗜好を推定することを特徴とする。 Further, another information processing apparatus according to the present invention is characterized in that the estimation unit estimates the user's preference while performing an evolution process on the preference model using a genetic algorithm.
また、本発明の情報処理方法は、複数のノードと、前記複数のノード間を方向性を有して接続する複数のエッジとで構成された有向グラフで表され、前記複数のノードが開始ノード又は判定ノードであり、前記判定ノードには、複数の属性情報を用いてコンテンツの属性を表すコンテンツ情報に含まれている前記複数の属性情報うちの1つの属性情報と、当該判定ノードに係るユーザの嗜好度合いを判定するための判定式を表す情報と、が対応づけられていて、前記開始ノードは、該開始ノードに後続する1又は複数の前記判定ノードに対応づけられている1又は複数の前記判定式による1又は複数の判定結果に基づいてユーザの嗜好に関する所定の判定を行うための1又は複数のルールを生成するプログラムの開始点であって、1又は複数の前記判定ノードへの接続情報が対応づけられている、データ構造を有する嗜好モデル、を所定の記憶部に記憶し、推定部によって、前記コンテンツ情報を入力し、前記嗜好モデルに基づいて生成された1又は複数の前記ルールを該コンテンツ情報に対してあてはめることで、ユーザの嗜好を推定することを特徴とする。 The information processing method of the present invention is represented by a directed graph including a plurality of nodes and a plurality of edges that connect the plurality of nodes with directionality, and the plurality of nodes are start nodes or A determination node, wherein the determination node includes one attribute information of the plurality of attribute information included in the content information representing the attribute of the content using the plurality of attribute information, and the user of the determination node Information indicating a determination formula for determining the degree of preference, and the start node is associated with one or a plurality of the determination nodes subsequent to the start node. A starting point of a program for generating one or more rules for making a predetermined determination related to a user's preference based on one or more determination results based on a determination formula. A preference model having a data structure associated with connection information to the determination node is stored in a predetermined storage unit, the content information is input by the estimation unit, and generated based on the preference model The user's preference is estimated by applying one or a plurality of the rules to the content information.
また、本発明のデータ構造は、 ユーザの嗜好モデルを表すためのデータ構造であって、複数のノードと、前記複数のノード間を方向性を有して接続する複数のエッジとで構成された有向グラフで表され、前記複数のノードが開始ノード又は判定ノードであり、前記判定ノードには、複数の属性情報を用いてコンテンツの属性を表すコンテンツ情報に含まれている前記複数の属性情報うちの1つの属性情報と、当該判定ノードに係るユーザの嗜好度合いを判定するための判定式を表す情報と、が対応づけられていて、前記開始ノードは、該開始ノードに後続する1又は複数の前記判定ノードに対応づけられている1又は複数の前記判定式による1又は複数の判定結果に基づいてユーザの嗜好に関する所定の判定を行うための1又は複数のルールを生成するプログラムの開始点であって、1又は複数の前記判定ノードへの接続情報が対応づけられている、ことを特徴とする。 The data structure of the present invention is a data structure for representing a user's preference model, and includes a plurality of nodes and a plurality of edges that connect the plurality of nodes with directionality. Represented by a directed graph, wherein the plurality of nodes are start nodes or determination nodes, and the determination node includes a plurality of pieces of attribute information included in the content information representing content attributes using the plurality of attribute information. One attribute information is associated with information representing a determination formula for determining the degree of preference of the user related to the determination node, and the start node is one or more of the one or more of the above-described start nodes One or more routes for making a predetermined determination regarding the user's preference based on one or more determination results based on one or more of the determination formulas associated with the determination node A starting point of the program that generates the connection information to one or more of the determining node is associated, characterized in that.
また、本発明の他のデータ構造は、さらに、当該判定ノードに対応づけられている前記判定式の信頼性を表すための所定のパラメータが対応づけられていることを特徴とする。 In addition, another data structure of the present invention is further characterized in that a predetermined parameter for representing the reliability of the determination formula associated with the determination node is associated.
本発明によれば、各判定ノードに対応づけられた情報と、他の判定ノードに対応づけられた情報とに親子関係は必要としない。よって、嗜好モデルに対する判定ノードの追加や削除の処理を容易に行うことができる。また、本発明の嗜好モデルを生成したり、更新したりするための情報は、番組情報等のコンテンツ情報から取得することができるので、上述したようなトラフィック量の増加や、オフライン環境での使用上の制約といった課題も生じない。 According to the present invention, there is no need for a parent-child relationship between information associated with each determination node and information associated with other determination nodes. Therefore, it is possible to easily add or delete determination nodes from the preference model. In addition, since the information for generating or updating the preference model of the present invention can be obtained from content information such as program information, the traffic volume is increased as described above, or used in an offline environment. There is no problem of the above restrictions.
以下、図面を参照して本発明の一実施の形態について説明する。図1は、本発明の一実施形態としての情報処理システム(情報処理装置)10の構成例を示したブロック図である。情報処理システム10は、コンテンツ表示機器100とコンテンツ制御機器200とを備えている。また、図1に示した情報処理システム10内の各構成は、例えば、1又は複数のCPU(中央処理装置)と、その周辺装置と、そのCPUで実行されるプログラムとの組み合わせによって実現することができる。コンテンツ表示機器100は、コンテンツ受信部110、コンテンツ出力部115、コンテンツ評価部120、推薦結果表示選択部130、コンテンツ閲覧ログ生成部140、嗜好モデル生成部150、及びトレーニング情報設定部160を備えている。
Hereinafter, an embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing a configuration example of an information processing system (information processing apparatus) 10 as an embodiment of the present invention. The
コンテンツ表示機器100は、例えば、TV(テレビジョン)、スマートフォン、携帯電話機やPC(パーソナルコンピュータ)のような情報端末である。あるいは、コンテンツ表示機器100は、TV等の情報端末と、セットトップボックスやビデオ録画機器等のコンテンツ受信・録画機器とを組み合わせたものであってもよい。
The
コンテンツ表示機器100は、コンテンツ受信部110とコンテンツ出力部115とによって、コンテンツを受信して表示することが可能な機器である。コンテンツ受信部110は、推薦結果表示選択部130からの指示に従って受信するコンテンツを選択し、放送波やネットワーク等の所定の媒体を介してコンテンツを受信する。そして、コンテンツ受信部110は、受信したコンテンツを表す信号を、所定形式の映像信号や音声信号に変換する等してコンテンツ出力部115に対して出力する。コンテンツ出力部115は、ディスプレイやスピーカを有して構成されていて、入力された映像信号や音声信号に基づいて映像表示や音声出力を行う。また、コンテンツ受信部110は、電子番組情報等の、複数の属性情報を用いてコンテンツの属性を表すコンテンツ情報(以下、番組情報と呼ぶ)を受信して、コンテンツ評価部120へ出力する。
The
コンテンツ評価部120(推定部)は、受信したコンテンツに対するユーザの嗜好(すなわちユーザの好み)を評価して、ユーザに推薦する番組情報の一覧情報を作成する。一方、嗜好モデル生成部150は、ユーザのコンテンツに関しての嗜好(好き嫌い)を表すモデルである、嗜好モデル151を生成・更新する。コンテンツ評価部120は、嗜好モデル生成部150が生成した嗜好モデル151を用いてコンテンツを評価し、ユーザの嗜好に合いそうだと推定した1又は複数の番組情報を、コンテンツの推薦結果として、推薦結果表示選択部130へ出力する。
The content evaluation unit 120 (estimation unit) evaluates the user's preference (that is, the user's preference) with respect to the received content, and creates program information list information recommended to the user. On the other hand, the preference
推薦結果表示選択部130は、コンテンツ評価部120の評価結果に基づいて、コンテンツの推薦結果を表示する。また、推薦結果表示選択部130は、トレーニング情報設定部160の指示に従って、嗜好モデル151のトレーニング用の番組情報を表示する。その際、推薦結果表示選択部130は、コンテンツ評価部120から受信したコンテンツの推薦結果を表す文字や画像、又はトレーニング情報設定部160から受信した番組情報を、コンテンツ受信部110を介してコンテンツ出力部115から出力する。また、推薦結果表示選択部130は、コンテンツ制御機器200から受信した所定の制御信号に基づいて選択するコンテンツを決定し、決定した結果をコンテンツ受信部110へ出力する。ここで、コンテンツ受信部110は、上述したように、選択されたコンテンツを所定の媒体を介して受信し、所定の映像信号や音声信号に変換する等してコンテンツ出力部115から出力する。
The recommendation result
コンテンツ閲覧ログ生成部140は、推薦結果表示選択部130が表示したコンテンツ推薦結果に対するコンテンツ制御部210による選択等の制御内容に基づいて、ユーザの嗜好に関するログを生成する。すなわち、コンテンツ閲覧ログ生成部140は、ユーザが表示や録画を指示したコンテンツの番組情報を複数、記録する。このコンテンツ閲覧ログ生成部140によって記録された番組情報は、嗜好モデル生成部150が嗜好モデル151を更新する際に、例えばユーザの好みにあったコンテンツを表すトレーニング用の番組情報として使用される。
The content browsing
トレーニング情報設定部160は、トレーニング用の番組情報を、推薦結果表示選択部130等を介してコンテンツ出力部115から表示する。トレーニング情報設定部160は、さらに、そのトレーニング番組情報の表示に対するユーザの操作に応じてコンテンツ制御機器200から受信した所定の制御信号に基づき、当該番組情報に対してユーザの嗜好(“好き”、“嫌い”等)を設定し、設定した結果を番組情報とともに、嗜好モデル生成部150へ出力する。
The training
嗜好モデル生成部150は、予め用意されているトレーニング用の番組情報(すなわち好き嫌いを表す正解の評価結果を表す情報が予め対応づけられている番組情報)を用いて、あるいは、コンテンツ閲覧ログ生成部140が生成したログやトレーニング情報設定部160が設定したトレーニング用の番組情報を用いて、ユーザの嗜好モデル151を生成したり、更新したりする。この嗜好モデル151は、嗜好モデル生成部150内の所定の記憶部に記憶される。また、嗜好モデル生成部150は、嗜好モデル151を生成したり、更新したりする際に使用したトレーニング用の番組情報を、その好き嫌いの評価結果とともに、所定の記憶部に記憶する。
The preference
一方、コンテンツ制御機器200は、TVのリモコンや携帯電話機のタッチパネルやPCのマウスとして構成されている。コンテンツ制御機器200は、操作部や信号送信部を有するコンテンツ制御部210を備えている。コンテンツ制御機器200では、このコンテンツ制御部210が、ユーザの所定の操作を入力し、その入力結果を示す所定の制御信号を推薦結果表示部130やトレーニング情報設定部160に対して出力する。具体的には、コンテンツ制御部210は、ユーザのコンテンツに対する選択、表示指示等の操作や、トレーニング用の番組情報に対する“好き”、“嫌い”等のユーザの選択、設定指示等の操作情報を入力し、それらの操作の内容に応じた制御信号を出力する。なお、コンテンツ制御機器200は、図1に示したようにコンテンツ表示機器100とは別の装置として構成されていてもよいし、あるいは、コンテンツ表示機器100と一体として構成されていてもよい。
On the other hand, the
ここで、図2〜図8を参照して、図1に示した嗜好モデル151の構成例等について説明する。図2は、図1に示した嗜好モデル151の構成例を示した模式図である。嗜好モデル151は、ユーザのコンテンツに対する嗜好(好き、好き嫌い等)を典型的に表す型である。嗜好モデル151に基づいて、未知の番組情報に対するユーザの嗜好を推定する際に所定の判定処理を行うための複数のルールが生成される。この嗜好モデル151は、学習によって内容を更新することができるモデルであるが、初期のモデルは例えば次のようにして生成することができる。すなわち、予め用意された複数の番組情報に対して、予め“好き”、“嫌い”等の嗜好が設定されているもの、あるいは、ユーザによって新たに“好き”、“嫌い”等の嗜好を設定してもらったものを、トレーニング用の番組情報として用いることで生成することができる。ここで、予め用意する嗜好の設定がなされたトレーニング用の番組情報は、例えば、年代別、性別等に応じて複数用意しておくこともできる。また、嗜好モデル151自体も、ゼロから生成するのではなく、一定のトレーニングが行われた状態を初期状態として用意しておくこともできる。この初期モデルを作成する際に使用した番組情報は、嗜好モデル生成部150内の所定の記憶部に記憶しておく。
Here, with reference to FIGS. 2 to 8, a configuration example of the
図2に示したように、嗜好モデル151は、嗜好モデル151内の複数のノード151a1又は151a2間の接続関係を示す有向グラフ151aを表す情報と、複数の判定ノード151a2に対応づけられている情報の内容をノード毎に示すデータである複数の判定ノード内容情報151bとで表現される。すなわち、嗜好モデル151は、複数のノード151a1又は151a2と、複数のノード151a1又は151a2間を方向性を有して接続する複数のエッジ151a3とで構成された有向グラフ151aと、複数の判定ノード内容情報151bとから表されるデータ構造を有している。また、複数のノード151a1又は151a2は、開始ノード151a1と、判定ノード151a2とに分類される。これらの有向グラフ151aの構造と、判定ノード151a2に対応づけられている情報とに基づいて、ユーザの嗜好に関する所定の判定を行うため複数のルールが生成される。
As illustrated in FIG. 2, the
開始ノード151a1は、ルールを作成するプログラム(あるいは計算手順)の開始地点を示し、判定ノード151a2につながるノードである。判定ノード151a2は、番組を表すための「属性情報」を一つ対応づけられたノードであり、このノード単体での「判定式」とその判定式の「信頼度に対応する所定のパラメータ」とが対応づけられている。このとき、番組を表すための属性情報とは、例えば“ドラマ”や“放送時刻”、“チャンネル”など、番組の特徴を表す情報、性質を表す情報等、番組に関する情報のことを指す。この場合において判定ノード151a2に対応づけられた判定式とは、当該判定ノードに対応づけられた属性情報を番組情報が含む場合に、すなわち“好き嫌い”の程度を表す値を出力する数式(あるいはプログラム)である、嗜好の度合いについて判定を下す(あるいは数値化する)ための数式や条件のことを指す。各判定ノードでは、この判定式によって、当該ノード単体で“好き”か“嫌い”かの度合いを算出することができる。信頼度に対応する所定のパラメータとは、判定式の信頼性を表現するためのパラメータであり、例えば、当該判定ノードに対応づけられた属性情報がトレーニング用の番組情報においてどのくらい出現しているかという頻度にもとづき算出される。この「信頼度に対応する所定のパラメータ」を用いることで、例えば頻度が多い場合に信頼度が高く、少ない場合に信頼度が低いというように仮定し、当該判定式から得た結果に相対的な重み付けをする等を行うことできる。嗜好モデル151は、この2種類のノードと有向グラフを使用して、番組の好き嫌いを判定するためのルールを表す論理式を生成する遺伝子構造を構築する。
The start node 151a1 indicates a start point of a program (or calculation procedure) for creating a rule, and is a node connected to the determination node 151a2. The determination node 151a2 is a node associated with one piece of “attribute information” for representing a program. The “determination formula” of this node alone and the “predetermined parameter corresponding to the reliability” of the determination formula are Are associated. At this time, the attribute information for representing the program refers to information related to the program, such as information representing the characteristics of the program, information representing the nature, such as “drama”, “broadcast time”, and “channel”. In this case, the determination expression associated with the determination node 151a2 is a mathematical expression (or a program that outputs a value indicating the degree of “like and dislike” when the program information includes attribute information associated with the determination node. ), Which is a mathematical expression or condition for determining (or digitizing) the degree of preference. Each determination node can calculate the degree of “like” or “dislike” for the node alone by using this determination formula. The predetermined parameter corresponding to the reliability is a parameter for expressing the reliability of the determination formula. For example, how much attribute information associated with the determination node appears in the training program information. Calculated based on frequency. By using this “predetermined parameter corresponding to the reliability”, for example, it is assumed that the reliability is high when the frequency is high and the reliability is low when the frequency is low, and relative to the result obtained from the determination formula. Weighting can be performed. The
なお、図2において、開始ノード151a1は、六角形の記号で示されていて、その記号内の数字“1”〜“3”は、各開始ノード151a1に設定されたID(識別符号)を表している。また、判定ノード151a2は、丸形の記号で示されていて、その記号内の数字“1”〜“8”は、各判定ノード151a2に設定されたIDを表している。 In FIG. 2, the start node 151a1 is indicated by a hexagonal symbol, and the numbers “1” to “3” in the symbol represent IDs (identification codes) set to the start nodes 151a1. ing. Further, the decision node 151a2 is indicated by a round symbol, and the numbers “1” to “8” in the symbol represent the ID set for each decision node 151a2.
図2に示した有向グラフ151aにおける各開始ノード151a1、各判定ノード151a2及び各有向エッジ151a3との接続関係は、例えば、図3に示した2種類のテーブルで表すことができる。すなわち、図3(a)に示したように、各開始ノード151a1と、その各開始ノード151a1に直接接続されている1又は複数の判定ノード151a2との接続関係は、開始ノード毎に、開始ノードのIDと、その開始ノードに直接接続された1又は複数の接続先の判定ノードのIDとの対応付けを示すテーブルで表すことができる。図3(a)のテーブルは、例えば開始ノードIDが“1”の開始ノード151a1(以下、“開始ノード1”とも表記する)が、IDが“4”の判定ノード151a2(以下、“判定ノード4”とも表記する)に、開始ノード1から判定ノード4への方向で直接接続されていることを示している。また、開始ノードIDが“2”の開始ノード151a1(以下、“開始ノード2”とも表記する(以下、同様))が、IDが“2”、“5”及び“7”の3個の判定ノード151a2に、開始ノードから各判定ノードへの方向で直接接続されていることを示している。
The connection relationship between each start node 151a1, each determination node 151a2, and each directed edge 151a3 in the directed
一方、各判定ノード151a2間の接続関係は、図3(b)に示したように、判定ノード毎に、判定ノードのIDと、その判定ノードに直接接続されている1又は複数の接続先の判定ノードのIDとの対応関係を示すテーブルで表すことができる。図3(b)のテーブルは、例えば判定ノード1に、IDが“3”の判定ノード151a2(以下、“判定ノード3”とも表記する(以下、同様))が判定ノード1から判定ノード3への方向に直接接続されていることを示している。また判定ノード2には、判定ノード2から他の判定ノードへと向かう方向では、他の判定ノードが接続されていないことを示している。また、判定ノード4には、判定ノード1と判定ノード8との2個の判定ノードが、判定ノード1から判定ノード1又は判定ノード8への方向に直接接続されていることを示している。
On the other hand, as shown in FIG. 3B, the connection relationship between each determination node 151a2 is the ID of the determination node and one or a plurality of connection destinations directly connected to the determination node. It can be represented by a table showing the correspondence with the ID of the determination node. In the table of FIG. 3B, for example, the
なお、有向グラフ151の構成は、図3に示した2種類のテーブルで表すことができるほか、1種類のテーブルで表すこともできる。すなわち、IDだけではなく、ノードの種類を表す情報を追加して用いることで、開始ノード毎又は判定ノード毎の区別ではなく開始ノードと判定ノードに共通のノード毎の区別として、各ノード間の接続関係を表すことができる。また、有向グラフ151内のノードは、上述したように開始ノードと判定ノードとの2種類を設けるのではなく、例えばノードをすべて1種類の判定ノードとして、判定ノードの一部にプログラム(あるいはルール)の開始点を表す情報を付加することで、判定ノードの一部に開始ノードの機能を持たせるようにすることもできる。
The configuration of the directed
一方、図2に示した判定ノード内容情報151bは、例えば図4に示したようなデータ形式で構成することができる。図4に示した例では、判定ノード内容情報151bが、判定ノードIDを表すフィールド151b1、属性情報を表すフィールド151b2、判定式を表すフィールド151b3、及び頻度情報を表すフィールド151b4を有して構成されている。この例では、“頻度情報”が上述した“判定式の信頼度に対応する所定のパラメータ”に対応している。この“頻度情報”は、嗜好モデル151を生成又は更新する際に使用されたトレーニング用の複数の番組情報に、当該判定ノードに対応づけられている属性情報が出現した頻度を表す情報である。ただし、この頻度情報に代えて、頻度情報に対して所定の計算処理を行うことで判定式の信頼度を表す値を算出した結果を、判定ノード内容情報151bに含ませることもできる。例えば、各頻度の値を、全判定ノードの中で最も多い頻度の値で除した値(あるいはその値にさらに非線形に重み付けをした値)等を、“判定式の信頼度に対応する所定のパラメータ”とすることができる。“判定式の信頼度に対応する所定のパラメータ”は、例えば“0”〜“1”の実数として、“0”が信頼度が最も低く、“1”が信頼度が最も高いというような値に設定することができる。
On the other hand, the determination
なお、属性情報は、図4に示したように、属性情報の種類と内容との組み合わせによって表してもよいし、種類に関わらないキーワードによって表してもよいし、あるいは、両方の構成を混在させてもよい。また、頻度情報は、例えば図4に示したように、嗜好モデル151を生成、更新等する際のトレーニングにおいて、“好き”と設定された番組情報に含まれていた頻度と、“嫌い”と設定された番組情報に含まれていた頻度とに分けて含むものとすることができる。あるいは、頻度情報は、“好き嫌い”の設定とは無関係に、トレーニングで使用された番組情報に当該属性情報が出現した頻度を表すものとしてもよい。
As shown in FIG. 4, the attribute information may be represented by a combination of the type and content of the attribute information, may be represented by a keyword that is not related to the type, or both configurations are mixed. May be. Further, for example, as shown in FIG. 4, the frequency information includes the frequency included in the program information set as “like” and the “dislike” in training when the
また、判定式は、例えば次のような形式とすることができる。すなわち、判定式は、判定式の値(すなわち計算結果)が、例えば“−1”〜“1”の実数の範囲で、“−1”が“嫌い”の確率が最も高く、“1”が“好き”の確率が最も高いという値を出力するものとすることができる。判定式で用いる変数(すなわちパラメータ)としては、例えば、頻度情報を用いてもよいし、あるいは属性情報の種類や内容に応じて予め設定された値(すなわち定数)を用いてもよい。例えば、頻度情報をパラメータとして用いる場合、“好き”と“嫌い”の合計の頻度がゼロではなく、“好き”と設定された場合の頻度がゼロのときは(すなわち、すべて“嫌い”と設定されている場合)、判定式の値を“−1”とする。また、“嫌い”と設定された場合の頻度がゼロのときは(すなわち、すべて“好き”と設定されている場合)、判定式の値は“1”とする。そして、“好き”の頻度と“嫌い”の頻度がどちらもゼロでない場合は、中間の値となるように、判定式を内容を構成する。この場合、判定式は、1又は複数の計算式を用いて構成したり、プログラムにおける条件文(例えば「if」文)等を用いて構成したりすることができる。 Further, the determination formula can be in the following format, for example. That is, the judgment formula has the highest probability that the value of the judgment formula (that is, the calculation result) is “-1” to “1”, for example, “−1” is “dislike”, and “1” is “1”. A value indicating that the probability of “like” is the highest can be output. As a variable (that is, parameter) used in the determination formula, for example, frequency information may be used, or a value (that is, a constant) set in advance according to the type and content of attribute information may be used. For example, when frequency information is used as a parameter, the total frequency of “like” and “dislike” is not zero, but when the frequency is set to “like” is zero (that is, all are set to “dislike”) The value of the judgment formula is “−1”. Further, when the frequency when “dislike” is set is zero (that is, when all “like” is set), the value of the determination formula is “1”. Then, when both the “like” frequency and the “dislike” frequency are not zero, the contents of the determination formula are configured so as to be an intermediate value. In this case, the determination formula may be configured using one or a plurality of calculation formulas, or may be configured using a conditional statement (for example, “if” statement) in the program.
次に、図2に示した有向グラフ151aから、番組の好き嫌いを判定するためのルールを表す論理式を生成する手順について説明する。以下では、8個の判定ノードに対して図5に示した属性情報が対応づけられていることとして説明を行う。すなわち、判定ノード1には“ドラマ”が、判定ノード2には“サッカー”が、判定ノード3には“13時”が、判定ノード4には“放送局A”が、判定ノード5には“映画”が、判定ノード6には“俳優B”が、判定ノード7には“特番”が、そして、判定ノード8には“ニュース”が、それぞれ対応づけられている。また、各判定ノードの内容は図6に示した形式を有している。すなわち、各判定ノード1〜8には、当該ノード単体で“好き”か“嫌い”かの度合いを出力する判定式f1〜f8が対応づけられている。また、各判定ノード1〜8には信頼性を表すパラメータとして、この判定ノードに対応付けられている属性情報がトレーニング用の番組情報に出現した頻度に対応した値n1a〜n8a(“好き”の場合)とn1b〜n8b(“嫌い”の場合)が設定されている。
Next, a description will be given of a procedure for generating a logical expression representing a rule for determining whether or not to like a program from the directed
有向グラフ151aからルールを抽出する際には、図7に示したように、開始ノード1〜3から、それぞれ、有向エッジ(すなわち矢印)で接続されている判定ノードをたどって各判定ノードにおける判定式による判定結果を組み合わせていく。各ルールは、開始ノードを開始点とするとともに、矢印の向きでたどることができる0、1又は複数の判定ノードのうちの任意の判定ノードを終了点とすることができる。吹き出し151c内に、有向グラフ151aから抽出される可能性のあるルールを示した。なお、ルールの抽出の際には、同じ判定ノードを2回以上含まないようにして、ルールの循環を避けている。例えば、図7で鎖線で囲って示した、開始ノード1を開始点として、判定ノード4、判定ノード1、判定ノード3、判定ノード7、及び判定ノード1をたどるルールは、同じ判定ノード1を2回含むので、抽出することができない。
When a rule is extracted from the directed
次に図8を用いて、抽出されたルールの概念図から、実際の論理式をどのように表現するかについて説明する。抽出されるルールの論理式は、“if X1 and X2 and X3 then Y”といった表現形式となる。このとき、Xiがある判定ノードiに対応づけられた番組の属性情報が、入力された番組情報に含まれていることを指す。Yは、判定ノードiのすべての判定式fiから得られる命令であり、“好き”か“嫌い”かの命令となる。ただし、このルールには、判定ノードiが持つ“判定式の信頼度に対応する所定のパラメータ”から算出されるパラメータである、ルールの信頼度パラメータが設定される。 Next, how an actual logical expression is expressed from the conceptual diagram of the extracted rule will be described with reference to FIG. The logical expression of the extracted rule has an expression form such as “if X1 and X2 and X3 then Y”. At this time, this indicates that the attribute information of the program associated with a certain determination node i is included in the input program information. Y is an instruction obtained from all the determination expressions fi of the determination node i, and is an instruction of “like” or “dislike”. However, the rule reliability parameter, which is a parameter calculated from the “predetermined parameter corresponding to the reliability of the determination formula” of the determination node i, is set in this rule.
一例として、“放送局A”と“ドラマ”と“13時”が一つのルールとして接続されており、それぞれの判定ノード4、1及び3の判定式f4、f1及びf3を総合した結果が“好き”の確率が高かったルールを考える。例えば、判定式の総合判定を「(f4+f1+f3)の値が大きいほど“好き”の確率が高い」とする。この場合に、判定式f4、f1、f3がそれぞれ“−1”から“1”までの値を出力するものであって(ここでは“1”に近いほど“好き”の確率が高いとする)、例えば判定式f4、f1、f3がすべて“1”に近い値であったとする。このとき、「(f4+f1+f3)の値」が大きくなる(例えば所定の閾値より大きくなる)ので、ルールの命令は「“好き”」となる。この場合、開始ノード1と判定ノード4、1及び3から生成されるルールは、ある番組が“放送局A”で“ドラマ”で“13時”なら、“好き”であるという判定結果を返す論理式となる。また、ルールの信頼度パラメータは、各判定ノード4、1及び3の頻度情報n4a、n4b、n1a、n1b、n3a及びn3bから設定することができる。例えば、頻度(あるいはそれを全判定ノードの最大頻度で除した値)の積算値や最大値、最小値あるいは平均値が大きいほど、信頼度が大きくなるようにして、ルールの信頼度パラメータを算出する。
As an example, “broadcasting station A”, “drama”, and “13:00” are connected as one rule, and the result obtained by combining the determination formulas f4, f1, and f3 of the
また、他の例として、“映画”と“俳優B”が一つのルールとして接続されており、それぞれの判定ノード5及び6の判定式f5及びf6を総合した結果が“好き”の確率が高かったルールを考える。上記と同様に、判定式の総合判定を「(f5+f6)
の値が大きいほど“好き”の確率が高い」として、判定式f5、f6がそれぞれ“−1”から“1”までの値を出力するものであって(ここでは“1”に近いほど“好き”の確率が高い)、例えば判定式f5、f6がすべて“1”に近い値であったとすると、(f5+f6)が大きくなる(例えば所定の閾値より大きくなる)ので、ルールの命令は「“好き”」となる。この場合、開始ノード2と判定ノード5及び6から生成されるルールは、ある番組が“映画”で“俳優B”なら、“好き”であるという判定結果を返す論理式となる。また、このルールの信頼度パラメータは、各判定ノード5及び6の頻度情報n5a、n5b、n6a及びn6bから設定することができる。
As another example, “movie” and “actor B” are connected as one rule, and the result of combining the determination expressions f5 and f6 of the
The determination formulas f5 and f6 each output a value from “−1” to “1” as the value of “I like” increases as the value of “is larger”. If the determination formulas f5 and f6 are all close to “1”, for example, (f5 + f6) becomes large (eg, becomes larger than a predetermined threshold value). I like "". In this case, the rule generated from the
さらに、他の例として、“映画”と“特番”が一つのルールとして接続されており、それぞれの判定ノード5及び7の判定式f5及びf7を総合した結果が“嫌い”の確率が高かったルールを考える。上記と同様に、判定式の総合判定を「(f5+f7)の値が大きいほど“好き”の確率が高い」として、判定式f5、f7がそれぞれ“−1”から“1”までの値を出力するものである(ここでは“1”に近いほど“好き”の確率が高く、“−1”に近いほど“嫌い”の確率が高い)とする。この場合には、例えば判定式f5が“1”に近い値であったとしても、判定式f7が“−1”に近い値であった場合、(f5+f7)はあまり大きくならず(例えば所定の閾値より大きくならず)、ルールの命令は、“好き”の確率が低いとなる。ここでは“好き”の確率が低い場合を“嫌い”とすると、開始ノード3と判定ノード5及び7から生成されるルールは、ある番組が“映画”で“特番”なら、“嫌い”であるという判定結果を返す論理式となる。また、このルールの信頼度パラメータは、各判定ノード5及び7の頻度情報n5a、n5b、n7a及びn7bから設定することができる。
Furthermore, as another example, “movie” and “special number” are connected as one rule, and the result of combining the judgment expressions f5 and f7 of the
次に、図9から図14を参照して、図1に示した情報処理システム10の動作例について説明する。図9は、情報処理システム10がユーザに対してユーザの嗜好にあった番組を推薦する際の処理の流れの一例を示したフローチャートである。また、図10は、図9に示したコンテンツ評価(ステップS103)における処理の流れの一例を説明するためのフローチャートである。
Next, an exemplary operation of the
情報処理システム10では、まず、嗜好モデル生成部150がトレーニング用の番組情報を用いて嗜好モデル151を生成する(ステップS101)。嗜好モデル生成部150は、例えば、トレーニング用の番組情報に含まれるすべての属性情報が、嗜好モデル151に含まれるように、開始ノードや判定ノードを有向グラフに適宜に追加する。また、追加した判定ノードに対応する判定ノード内容情報を作成する。有向グラフの生成の仕方については特に限定はない。本実施形態では、後述する遺伝的アルゴリズム、すなわち、淘汰処理や進化処理によって、ルールの取捨選択等が自動的に行われる。したがって有向グラフへのノードの追加は任意に行うことができる。
In the
次に、コンテンツ受信部110が、番組情報を受信する(ステップS102)。次に、コンテンツ評価部120と嗜好モデル生成部150とが協調して、コンテンツ受信部110が受信した1又は複数の番組情報を、評価対象の未知の番組情報として、ユーザの嗜好を推定するための処理である、コンテンツ評価処理を行う(ステップS103)。このコンテンツ評価処理の内容については後述する。
Next, the
次に、推薦結果表示選択部130が、コンテンツ評価部120が“好き”と評価した番組情報を、推薦結果として表示する(ステップS104)。ここで、ユーザが所定の操作を行った場合(ステップS105で「yes」の場合)、トレーニング情報設定部160が、ユーザの操作に応じて、推薦結果として表示された番組情報のうち、指定された番組情報に対して“好き”又は“嫌い”の設定を行って、その設定結果を指定された番組情報とともに所定の記憶部に一時的に記憶する(ステップS106)。
Next, the recommendation result
次に、ユーザが、推薦結果として示されたいずれかのコンテンツを選択すると(ステップS107で「yes」の場合)、推薦結果表示選択部130がコンテンツ受信部110に対して選択されたコンテンツの受信と表示の指示を出力する(ステップS108)。次に、推薦結果表示選択部130が選択されたコンテンツの番組情報を、コンテンツ閲覧ログ生成部140に対して出力し、コンテンツ閲覧ログ生成部140が入力された番組情報を記録する(ステップS109)。
Next, when the user selects any content indicated as the recommendation result (in the case of “yes” in step S107), the recommendation result
次に、嗜好モデル生成部150が、ステップS106でトレーニング情報設定部160が記憶した番組情報や、ステップS109でコンテンツ閲覧ログ生成部140が記録した番組情報に基づいて、新規の属性情報に対応するノードを嗜好モデル151に対して追加したり、既存の判定ノードの出現頻度を更新したりする処理を行うことで、嗜好モデル151を更新する(ステップS110)。以降、例えば所定のタイミングで、ステップS102からの処理が再度実行される。
Next, the preference
次に、図10を参照して、ステップS103でのコンテンツ評価処理について説明する。まず、コンテンツ評価部120が、図7及び図8を参照して上記で説明したようにして、嗜好モデル151から“好き”を命令とする(すなわち“好き”と判定する)ルールの集合と“嫌い”を命令とする(すなわち“嫌い”と判定する)ルールの集合とを抽出する(ステップS201)。その際、コンテンツ評価部120は、嗜好モデル151から新たに生成したルールと、そのルールを生成する際に使用したノードの組み合わせとを表す情報を、ルール生成に関する履歴情報として保持する。そして、コンテンツ評価部120は、この履歴情報にすでに記録されていたノードの組み合わせ以外のノードの組み合わせが検知された場合に、新たなルールを抽出する処理を行う。したがって、ここでは、すでに抽出済みのノードの組み合わせについては、ルールの生成は行われない。
Next, the content evaluation processing in step S103 will be described with reference to FIG. First, as described above with reference to FIGS. 7 and 8, the
次に、コンテンツ評価部120は、トレーニング用番組情報を用いてルールに対して淘汰処理を実行する(ステップS202)。本実施形態では、図7に示したような、有向グラフ151におけるすべてのノードの組み合わせについてルールの生成が可能であるとしている。そのため、生成したルールをすべて記憶していくとすると、大量のルールを保持することとなる。そこで、本実施形態では、次のような淘汰処理によって、進化計算の過程で大量に生成され続けるルールから、嗜好の推定において有効であるとはいえないルールを淘汰している。
Next, the
図11に淘汰処理の流れを模式図を用いて示した。本実施形態では、後述するステップS204において嗜好モデル151に対して遺伝的アルゴリズムで用いられているような進化処理を実行する。その進化処理の前後では嗜好モデル151が異なる世代のモデルである、と定義することができる。また、図11に示したように、ある世代における嗜好モデル151から抽出されたルールの集合302は、“好き”という判定を下すルール群302aと“嫌い”という判定を下すルール群302bとにグループ化できる。コンテンツ評価部120は、これらのルールを集合として一定数保持しておく。このときコンテンツ評価部120は、以下の手順で、ルールの淘汰処理を実行する。
FIG. 11 shows a flow of the wrinkle process using a schematic diagram. In the present embodiment, evolution processing as used in the genetic algorithm is executed on the
(ステップS301)まず、コンテンツ評価部120は、トレーニング用の番組情報301を入力とすると、番組情報301を各ルールにあてはめることで、すべてのルールにおいて“好き”か“嫌い”かの判定結果を算出する。
(Step S301) First, when the
(ステップS302)次に、コンテンツ評価部120は、すべての判定結果を統計的に処理し(すなわち、例えば判定結果の合計値にもとづき)、その番組が“好き”か“嫌い”かの推薦結果303を最終的に決定する。このとき、各判定結果に対しては、そのルールの信頼度を掛け合わせることで、総合的な判定結果への影響度を正規化することができる。
(Step S302) Next, the
(ステップS303)次に、コンテンツ評価部120は、推薦結果303とトレーニング用の番組情報にあらかじめ付与されている正解値304を比較して、一致するルールを良いルール、一致しないルールを悪いルールとして順位付けしていく。
(Step S303) Next, the
以上の操作(ステップS301〜303)を多数のトレーニング用番組情報に対して繰り返すことにより、下位に順位付けされたルールを淘汰し、上位に順位付けされたルールだけを残していく。 By repeating the above operation (steps S301 to S303) for a large number of pieces of training program information, the rules ranked lower are deceived, and only the rules ranked higher are left.
そして、コンテンツ評価部120は、このようなルールの淘汰処理(すなわちステップS202)を、ステップS204で実行する進化処理(あるいは進化計算)における世代交代処理を進めていく中で再帰的に進めることにより、高い推薦精度に寄与するルールだけを残すことができる。
Then, the
ステップS202で複数のトレーニング用番組情報を用いて淘汰処理を実行した後は、ステップS203で、コンテンツ評価部120が、新たに出現したルールの個数が所定の閾値以下であるか否かを判定する。ここで、ルールが新たに出現する場合とは、次のステップS204での進化処理を実行した場合に発生する現象である。また、進化計算と淘汰処理が十分に進むと、図11に示されるような淘汰処理をしても、推薦に寄与する新たなルールがあまり出現しなくなる。本システムでは、新しく出現したルールの個数が所定の閾値を下回る場合、学習処理が終わったと判定して進化計算を終了する。この構成によれば、後述するステップS205での推定処理では、未知の番組情報を入力として、学習が終わったルール群によってユーザの嗜好を判定するため、高い精度が期待される。
After executing the selection process using a plurality of training program information in step S202, in step S203, the
ステップS204における、本実施形態の遺伝的アルゴリズムを用いた進化計算では、一般的な遺伝的アルゴリズムと同様に交叉処理や突然変異処理が行われる。これらの交叉処理や突然変異処理は、嗜好モデル生成部150によって行うことができる。以下、この2つの処理について説明する。
In the evolution calculation using the genetic algorithm of this embodiment in step S204, crossover processing and mutation processing are performed in the same manner as a general genetic algorithm. These crossover processing and mutation processing can be performed by the preference
図12に示すように、本実施形態の交叉処理では、両親となる2つの有効グラフ(すなわち遺伝的アルゴリズムにおける遺伝子)について、次のノードへの接続情報を保持した同じ判定ノード同士が交換される。結果として、新しい有効グラフ(遺伝子)は、2つの遺伝子の有向グラフを組み合わせた新しいグラフ構造となる。 As shown in FIG. 12, in the crossover process of the present embodiment, the same determination nodes holding connection information to the next node are exchanged for two effective graphs (that is, genes in the genetic algorithm) serving as parents. . As a result, the new effective graph (gene) has a new graph structure that combines the directed graphs of the two genes.
また、図13(a)、(b)に示すように、本実施形態の突然変異処理では、判定ノードの番号をランダムに変更するか、次の接続先を表すグラフの構成情報(図3(b))をランダムに変更する。 Further, as shown in FIGS. 13A and 13B, in the mutation process of the present embodiment, the determination node number is changed at random or the configuration information of the graph representing the next connection destination (FIG. 3 ( b)) is changed randomly.
ステップS201〜S204では、ルールの集合の抽出と、淘汰処理及び進化処理を繰り返し実行することで、高い推薦精度に寄与するルールだけを残すことができる。そして、新しく出現したルールの個数が所定の閾値を下回る場合、ステップS203の判定結果が「no」となる。 In steps S201 to S204, it is possible to leave only a rule that contributes to high recommendation accuracy by repeatedly extracting a set of rules and repeatedly executing the selection process and the evolution process. When the number of newly appearing rules is below a predetermined threshold, the determination result in step S203 is “no”.
次に、ステップS205では、コンテンツ評価部120が、嗜好モデル151に基づいて生成された各ルールを、入力された番組情報に対してあてはめることでユーザの嗜好を推定する。すなわち、コンテンツ評価部120は、図14に示したように、未知の番組情報401を、ステップS201〜S204で選択された“好き”と判定を下すルール群402aと“嫌い”と判定を下すルール群402bとを含むルールの集合402の各ルールにあてはめる(ステップS401)。次に、コンテンツ評価部120は、各ルールの判定結果を統計的に処理し、好き嫌いを判定し、推薦結果403(すなわち当該番組情報を推薦すべきか否かを示す情報)を決定する(ステップS402)。
Next, in step S205, the
次に、図10のステップS206では、コンテンツ評価部120が、コンテンツ評価処理を実行すべきすべての番組情報に対する評価が終了したか否かを判定する。評価すべき他の番組情報が残されている場合には、次の番組情報を対象としてステップS205の処理を再度実行する(ステップS206で「no」からステップS205)。評価すべき他の番組情報が残されていない場合には、処理を終了する(ステップS206で「yes」の場合)。
Next, in step S206 of FIG. 10, the
以上のように、本実施形態によれば、各判定ノードに対応づけられた情報と、他の判定ノードに対応づけられた情報とに親子関係は必要としない。よって、嗜好モデルに対する判定ノードの追加や削除の処理を容易に行うことができる。また、本実施形態の嗜好モデルを生成したり、更新したりするための情報は、番組情報等のコンテンツ情報から取得することができるので、トラフィック量の増加や、オフライン環境での使用上の制約といった課題も生じない。 As described above, according to the present embodiment, there is no need for a parent-child relationship between information associated with each determination node and information associated with another determination node. Therefore, it is possible to easily add or delete determination nodes from the preference model. In addition, since the information for generating or updating the preference model according to the present embodiment can be acquired from content information such as program information, an increase in traffic volume and restrictions on use in an offline environment Such a problem does not occur.
また、本実施形態により、コンテンツに関するユーザの嗜好を数式の集合で表現できるようになり、これらの数式集合に未知のコンテンツを与えることで、好みを判定できるようになる。つまり、コンテンツに関するユーザの嗜好を数式としてモデル化できるため、結果の可視化性に優れている。 Further, according to the present embodiment, the user's preference regarding the contents can be expressed by a set of mathematical expressions, and the preference can be determined by giving unknown contents to these mathematical expression sets. In other words, the user's preference regarding the content can be modeled as a mathematical formula, so that the result is highly visible.
また、本実施形態のコンテンツ推薦システムは、大量の入力情報からユーザの嗜好を表現するために必要な情報を自動的に抽出しルール化できるため、大規模なコンテンツデータでも良好な推薦精度が期待される。また、遺伝的アルゴリズムを用いたコンテンツ推薦システムは、完全なオフライン環境でも動作可能であるため、ネットワークなど外部環境に接続できない機器においても有用である。 In addition, since the content recommendation system of this embodiment can automatically extract information necessary for expressing user preferences from a large amount of input information and create rules, it can be expected to have good recommendation accuracy even for large-scale content data. Is done. In addition, since the content recommendation system using the genetic algorithm can operate even in a completely offline environment, it is also useful for devices that cannot be connected to an external environment such as a network.
なお、本発明が特長とする点については例えば次のようにまとめることができる。本発明は、GNP(Genetic Network Programming;遺伝的ネットワークプログラミング)と呼ばれるノードをネットワーク状に接続することでプログラムを自動生成する計算手法の一つを用いたものである、ということができる。ここで、以下の特長1と特長2は、推薦システムにGNPアルゴリズムを適用する場合の独自の工夫点であり、特長3は推薦システム自体の背景とする技術との差異である。
The features of the present invention can be summarized as follows, for example. It can be said that the present invention uses one of calculation methods for automatically generating a program by connecting nodes called GNP (Genetic Network Programming) in a network. Here,
特長1:GNPアルゴリズムにおける各計算において、判定ノードに信頼度情報を入れた点。
GNPによる進化計算は複雑なルールを計算可能であるという利点のほかに、計算コストが膨大であるという欠点がある。したがってGNPアルゴリズムを推薦システムに応用するためには、大量の判定ノードから有意なルールを、効率よく探索する方法が重要となる。本発明では、信頼度情報の導入により、トレーニングデータ(すなわちトレーニング用番組情報)で多く出現している属性情報を含む判定ノードが優先的にルールの一部に採用されやすいように工夫している。この信頼度の導入により、ルールの収束時間が大幅に高まり、GNPアルゴリズムが推薦システムでも現実時間で駆動できるようになった。
Feature 1: The reliability information is entered in the decision node in each calculation in the GNP algorithm.
The evolution calculation by GNP has a disadvantage that the calculation cost is enormous in addition to the advantage that a complicated rule can be calculated. Therefore, in order to apply the GNP algorithm to the recommendation system, a method for efficiently searching for significant rules from a large number of decision nodes is important. In the present invention, by introducing reliability information, a determination node including attribute information frequently appearing in training data (that is, training program information) is devised so as to be easily adopted as a part of the rule. . With the introduction of this reliability, the convergence time of the rule is greatly increased, and the GNP algorithm can be driven in real time even in the recommendation system.
特長2:推薦処理においても、判定ノードの信頼度情報を使って、ルールの影響度に正規化を加えた点。
本発明のシステムにより採用されたルール群を用いて推薦処理をする場合、それらすべてのルールによる判定結果を集計して、“好き”と“嫌い”の判定結果の多数決により決める方法が考えられる。実際に、提案システムもこの方式を採用している。しかし、ルールによっては、トレーニングデータの情報とは全く関連がなくても、偶然うまく判別できただけのものもある。このようなルールは、未知の番組情報を推薦するときに判定処理を失敗する原因となりうる。この問題を回避するため、特長1において導入した信頼度情報を、ルールを用いた“好き”と“嫌い”の判別処理においても、利用できるように工夫した。信頼度情報は、トレーニングデータにおける属性情報の出現頻度を表す。したがって、信頼度をもとに算出されたルールの信頼度は、いかにトレーニングデータと相関があるかを表すことになる。推薦処理において、あるルールが与える影響力をルールの信頼性で正規化することで、より高い推薦精度が確認された。
Feature 2: Even in the recommendation process, the degree of influence of the rule is normalized by using the reliability information of the judgment node.
When the recommendation process is performed using the rule group adopted by the system of the present invention, a method is conceivable in which the determination results based on all the rules are totaled and determined by majority decision of the “like” and “dislike” determination results. In fact, the proposed system also uses this method. However, depending on the rules, there are some that have been successfully discriminated accidentally even though they are not related to the training data information. Such a rule may cause the determination process to fail when recommending unknown program information. In order to avoid this problem, the reliability information introduced in
特長3:推薦システムにおいて、嗜好度(好き嫌い)の分解能が高い点。
GNPを用いた推薦システムそのものが、他の推薦システムと違って優位な点について述べる。その他の推薦システムで採用されているアルゴリズムの多くが、2クラス分類器であり、“好き”か“嫌い”にしか分類できない。それに比べ論理式で判定結果を出力する本手法は、Nクラスに分類できる。実際に本発明のシステムでは、“すごく好き”、”すごく嫌い”、“まあまあ好き”、“まあまあ嫌い”といった複数分類で結果を出力することができる。したがって、アプリケーションの要求によっては、“すごく好き”に加えて“まあまあ好き”といった意外性のある推薦結果を出力することができる。
Feature 3: The recommendation system has high resolution of preference (likes and dislikes).
The following describes the advantages of the recommendation system itself using GNP, unlike other recommendation systems. Many of the algorithms used in other recommendation systems are two-class classifiers that can only be classified as “like” or “dislike”. In contrast, this method of outputting the determination result by a logical expression can be classified into N classes. Actually, the system of the present invention can output the results in a plurality of categories such as “I like it very much”, “I like it a lot”, “I like it so much”, and “I like it so much”. Therefore, depending on the request of the application, an unexpected recommendation result such as “somewhat like” can be output in addition to “very like”.
10 情報処理装置
100 コンテンツ表示機器
120 コンテンツ評価部
130 推薦結果表示選択部
140 コンテンツ閲覧ログ生成部
150 嗜好モデル生成部
151 嗜好モデル
151a 有向グラフ
151a1 開始ノード
151a2 判定ノード
151a3 エッジ
151b 判定ノード内容情報
200 コンテンツ制御機器
210 コンテンツ制御部
DESCRIPTION OF
Claims (7)
前記複数のノードが開始ノード又は判定ノードであり、
前記判定ノードには、複数の属性情報を用いてコンテンツの属性を表すコンテンツ情報に含まれている前記複数の属性情報うちの1つの属性情報と、当該判定ノードに係るユーザの嗜好度合いを判定するための判定式を表す情報と、が対応づけられていて、
前記開始ノードは、該開始ノードに後続する1又は複数の前記判定ノードに対応づけられている1又は複数の前記判定式による1又は複数の判定結果に基づいてユーザの嗜好に関する所定の判定を行うための1又は複数のルールを生成するプログラムの開始点であって、1又は複数の前記判定ノードへの接続情報が対応づけられている、
データ構造を有する嗜好モデル、を記憶した記憶部と、
前記コンテンツ情報を入力し、前記嗜好モデルに基づいて生成された1又は複数の前記ルールを該コンテンツ情報に対してあてはめることで、ユーザの嗜好を推定する推定部と
を備える情報処理装置。 Represented by a directed graph composed of a plurality of nodes and a plurality of edges connecting the plurality of nodes with directionality,
The plurality of nodes are start nodes or decision nodes;
The determination node determines one attribute information of the plurality of attribute information included in the content information representing the attribute of the content using the plurality of attribute information, and a user's preference degree related to the determination node. Is associated with information representing a judgment formula for
The start node makes a predetermined determination regarding user preference based on one or more determination results based on one or more of the determination formulas associated with one or more of the determination nodes following the start node. A starting point of a program for generating one or a plurality of rules for connection with connection information to one or a plurality of the determination nodes,
A storage unit storing a preference model having a data structure;
An information processing apparatus comprising: an estimation unit that inputs the content information and estimates one's preference by applying one or more rules generated based on the preference model to the content information.
前記嗜好モデルに基づいて生成された前記ルールには、該ルールを生成する際に基準とした前記1又は複数の判定結果を求めた前記1又は複数の判定式の信頼性を表す前記1又は複数の所定のパラメータを用いて求めた値であって、該ルールの信頼度を表す値が設定されていて、
前記推定部が、前記1又は複数のルールを前記コンテンツ情報に対してあてはめる際に、前記各ルールに設定されている前記各信頼度を表す値を利用する
ことを特徴とする請求項1に記載の情報処理装置。 The determination node is further associated with a predetermined parameter for representing the reliability of the determination formula associated with the determination node.
The rule generated based on the preference model includes the one or more representing the reliability of the one or more determination formulas obtained from the one or more determination results used as a reference when generating the rule Is a value obtained using a predetermined parameter, and a value representing the reliability of the rule is set,
The said estimation part utilizes the value showing each said reliability set to each said rule, when applying the said 1 or several rule with respect to the said content information. Information processing device.
前記判定ノードに対応づけられている前記所定のパラメータが、前記嗜好モデルを生成又は更新する際に基準とされた前記複数のコンテンツ情報に当該判定ノードに対応づけられている前記属性情報が出現した頻度に応じたものである
ことを特徴とする請求項2に記載の情報処理装置。 The preference model is generated or updated based on a plurality of the content information,
The attribute information associated with the determination node appears in the plurality of content information used as a reference when the predetermined parameter associated with the determination node generates or updates the preference model. The information processing apparatus according to claim 2, wherein the information processing apparatus corresponds to a frequency.
ことを特徴とする請求項1から3のいずれか1項に記載の情報処理装置。 The information according to any one of claims 1 to 3, wherein the estimation unit estimates the user's preference while performing an evolution process on the preference model using a genetic algorithm. Processing equipment.
前記複数のノードが開始ノード又は判定ノードであり、
前記判定ノードには、複数の属性情報を用いてコンテンツの属性を表すコンテンツ情報に含まれている前記複数の属性情報うちの1つの属性情報と、当該判定ノードに係るユーザの嗜好度合いを判定するための判定式を表す情報と、が対応づけられていて、
前記開始ノードは、該開始ノードに後続する1又は複数の前記判定ノードに対応づけられている1又は複数の前記判定式による1又は複数の判定結果に基づいてユーザの嗜好に関する所定の判定を行うための1又は複数のルールを生成するプログラムの開始点であって、1又は複数の前記判定ノードへの接続情報が対応づけられている、
データ構造を有する嗜好モデル、を所定の記憶部に記憶し、
推定部によって、前記コンテンツ情報を入力し、前記嗜好モデルに基づいて生成された1又は複数の前記ルールを該コンテンツ情報に対してあてはめることで、ユーザの嗜好を推定する
ことを特徴とする情報処理方法。 Represented by a directed graph composed of a plurality of nodes and a plurality of edges connecting the plurality of nodes with directionality,
The plurality of nodes are start nodes or decision nodes;
The determination node determines one attribute information of the plurality of attribute information included in the content information representing the attribute of the content using the plurality of attribute information, and a user's preference degree related to the determination node. Is associated with information representing a judgment formula for
The start node makes a predetermined determination regarding user preference based on one or more determination results based on one or more of the determination formulas associated with one or more of the determination nodes following the start node. A starting point of a program for generating one or a plurality of rules for connection with connection information to one or a plurality of the determination nodes,
Storing a preference model having a data structure in a predetermined storage unit;
Information processing characterized by inputting the content information by an estimation unit and estimating the user's preference by applying one or more rules generated based on the preference model to the content information Method.
複数のノードと、前記複数のノード間を方向性を有して接続する複数のエッジとで構成された有向グラフで表され、
前記複数のノードが開始ノード又は判定ノードであり、
前記判定ノードには、複数の属性情報を用いてコンテンツの属性を表すコンテンツ情報に含まれている前記複数の属性情報うちの1つの属性情報と、当該判定ノードに係るユーザの嗜好度合いを判定するための判定式を表す情報と、が対応づけられていて、
前記開始ノードは、該開始ノードに後続する1又は複数の前記判定ノードに対応づけられている1又は複数の前記判定式による1又は複数の判定結果に基づいてユーザの嗜好に関する所定の判定を行うための1又は複数のルールを生成するプログラムの開始点であって、1又は複数の前記判定ノードへの接続情報が対応づけられている、
ことを特徴とするデータ構造。 A data structure for representing a user preference model,
Represented by a directed graph composed of a plurality of nodes and a plurality of edges connecting the plurality of nodes with directionality,
The plurality of nodes are start nodes or decision nodes;
The determination node determines one attribute information of the plurality of attribute information included in the content information representing the attribute of the content using the plurality of attribute information, and a user's preference degree related to the determination node. Is associated with information representing a judgment formula for
The start node makes a predetermined determination regarding user preference based on one or more determination results based on one or more of the determination formulas associated with one or more of the determination nodes following the start node. A starting point of a program for generating one or a plurality of rules for connection with connection information to one or a plurality of the determination nodes,
A data structure characterized by that.
ことを特徴とする請求項6に記載のデータ構造。 The data structure according to claim 6, wherein the determination node is further associated with a predetermined parameter for representing the reliability of the determination formula associated with the determination node.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012265491A JP6074702B2 (en) | 2012-12-04 | 2012-12-04 | Information processing apparatus, information processing method, and data structure |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012265491A JP6074702B2 (en) | 2012-12-04 | 2012-12-04 | Information processing apparatus, information processing method, and data structure |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014110004A true JP2014110004A (en) | 2014-06-12 |
JP6074702B2 JP6074702B2 (en) | 2017-02-08 |
Family
ID=51030578
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012265491A Expired - Fee Related JP6074702B2 (en) | 2012-12-04 | 2012-12-04 | Information processing apparatus, information processing method, and data structure |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6074702B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016002133A1 (en) * | 2014-06-30 | 2016-01-07 | 日本電気株式会社 | Prediction system and prediction method |
CN113886459A (en) * | 2021-09-24 | 2022-01-04 | 深圳市云网万店电子商务有限公司 | Method, system and storage medium for processing custom formula based on directed graph |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007233515A (en) * | 2006-02-28 | 2007-09-13 | Sony Corp | Information processor and information processing method, information providing apparatus and information providing method, and program |
JP2010044518A (en) * | 2008-08-11 | 2010-02-25 | Kddi Corp | Preference estimation device, preference estimation method and computer program |
JP2010205265A (en) * | 2009-03-05 | 2010-09-16 | Nhn Corp | Content retrieval system and method using ontology |
-
2012
- 2012-12-04 JP JP2012265491A patent/JP6074702B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007233515A (en) * | 2006-02-28 | 2007-09-13 | Sony Corp | Information processor and information processing method, information providing apparatus and information providing method, and program |
JP2010044518A (en) * | 2008-08-11 | 2010-02-25 | Kddi Corp | Preference estimation device, preference estimation method and computer program |
JP2010205265A (en) * | 2009-03-05 | 2010-09-16 | Nhn Corp | Content retrieval system and method using ontology |
Non-Patent Citations (1)
Title |
---|
JPN7016001091; 増井 俊之: '進化的学習機構を用いたグラフ配置制約の自動抽出' インタラクティブシステムとソフトウェアII 初版, 19941210, p.195-204, 株式会社近代科学社 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016002133A1 (en) * | 2014-06-30 | 2016-01-07 | 日本電気株式会社 | Prediction system and prediction method |
JPWO2016002133A1 (en) * | 2014-06-30 | 2017-05-25 | 日本電気株式会社 | Prediction system and prediction method |
CN113886459A (en) * | 2021-09-24 | 2022-01-04 | 深圳市云网万店电子商务有限公司 | Method, system and storage medium for processing custom formula based on directed graph |
Also Published As
Publication number | Publication date |
---|---|
JP6074702B2 (en) | 2017-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110297848B (en) | Recommendation model training method, terminal and storage medium based on federal learning | |
US11017024B2 (en) | Media content rankings for discovery of novel content | |
CN101840410B (en) | Learning apparatus, learning method, information processing apparatus, method and program | |
CN109903103B (en) | Method and device for recommending articles | |
CN112100489B (en) | Object recommendation method, device and computer storage medium | |
KR101206160B1 (en) | Method for recommending content based on user preference and profile of content | |
US10740397B2 (en) | User modelling and metadata of transmedia content data | |
CN109446171B (en) | Data processing method and device | |
JP2013025324A (en) | Recommendation device, recommendation method and program | |
CN111159570B (en) | Information recommendation method and server | |
WO2023168856A1 (en) | Associated scene recommendation method and device, storage medium, and electronic device | |
CN111291217A (en) | Content recommendation method and device, electronic equipment and computer readable medium | |
CN107346333B (en) | Online social network friend recommendation method and system based on link prediction | |
CN115455280A (en) | Recommendation list determining method and server | |
CN109451334B (en) | User portrait generation processing method and device and electronic equipment | |
JP6074702B2 (en) | Information processing apparatus, information processing method, and data structure | |
US10706097B2 (en) | Manipulation of non-linearly connected transmedia content data | |
CN110727853B (en) | Presenting controlled heterogeneous digital content to a user | |
CN113535939A (en) | Text processing method and device, electronic equipment and computer readable storage medium | |
CN112612949A (en) | Establishment method and device of recommended data set | |
CN111951808A (en) | Voice interaction method, device, terminal equipment and medium | |
Croydon | Moduli of continuity of local times of random walks on graphs in terms of the resistance metric | |
CN115809339A (en) | Cross-domain recommendation method, system, device and storage medium | |
US10893312B2 (en) | Digital content provision | |
JP6193799B2 (en) | Web element matching device, matching probability distribution generation device, method and program thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150630 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150630 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20150630 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160421 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160510 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160711 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161004 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161027 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161129 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20161215 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161215 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20161215 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6074702 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |