JP6294371B2 - 情報処理装置、情報処理システム、情報処理方法、及び、プログラム - Google Patents

情報処理装置、情報処理システム、情報処理方法、及び、プログラム Download PDF

Info

Publication number
JP6294371B2
JP6294371B2 JP2016039132A JP2016039132A JP6294371B2 JP 6294371 B2 JP6294371 B2 JP 6294371B2 JP 2016039132 A JP2016039132 A JP 2016039132A JP 2016039132 A JP2016039132 A JP 2016039132A JP 6294371 B2 JP6294371 B2 JP 6294371B2
Authority
JP
Japan
Prior art keywords
group
interest
degree
term
interest degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016039132A
Other languages
English (en)
Other versions
JP2017156958A (ja
Inventor
竹本 剛
剛 竹本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Personal Computers Ltd
Original Assignee
NEC Personal Computers Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Personal Computers Ltd filed Critical NEC Personal Computers Ltd
Priority to JP2016039132A priority Critical patent/JP6294371B2/ja
Publication of JP2017156958A publication Critical patent/JP2017156958A/ja
Application granted granted Critical
Publication of JP6294371B2 publication Critical patent/JP6294371B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理装置、情報処理システム、情報処理方法、及び、プログラムに関する。
従来から、番組視聴履歴や番組内容に基づいて個人の興味度や嗜好を学習し、学習された興味度や嗜好に基づいた番組を推薦する技術が既に知られている。
このような技術に関して、例えば特許文献1には、個人の既存の視聴行動履歴と視聴番組内容を表す情報を統合して学習することにより、潜在的興味領域パラメータと興味領域を特徴付けるパラメータを特定し、個人を識別するための認証ID情報と紐付けて記憶し、上記の学習処理で特定した領域パラメータと領域ごとの特徴パラメータとを利用して、個人の新規キーワードデータに対する興味の度合いを表す尤度を算出して、その尤度が規定以上の値であるキーワードを興味キーワード候補として抽出し、推定した興味キーワードを活用することにより、視聴者の興味に対する詳細な情報を提供することが開示されている。
特開2015−215794号公報
しかし、例えば特許文献1において、番組に対する視聴者の行動内容、番組内容を表現する情報等を照合して、視聴者が潜在的に興味を持っている内容を表す興味キーワードを複数抽出すると記載されているように、従来の技術においては、興味ワードを抽出するために利用される情報として、視聴番組の表示や変更、視聴者の映像、並びに番組情報としてのタイトルやジャンル、出演者であるため、抽出された興味ワードが、その視聴者にとって何らかの興味あるワードであることは言えるものの、視聴者が本当にその興味ワードで特定される、例えば出演者に興味を持って当該番組を視聴していたかどうかまでは分からない。つまり、従来技術においては、提供される番組等のコンテンツに対してユーザがどのような観点で当該コンテンツを視聴あるいは閲覧しているかを把握することは困難である。
本発明は、このような実情に鑑みてなされたものであって、コンテンツを視聴あるいは閲覧するユーザの観点を把握することを目的とする。
上記の課題を解決するため、本発明の情報処理装置は、ドキュメントにおける出現傾向が類似するタームを異なる観点でグループ化したグループの複数を記憶するグループ化手段と、ターム、グループごとに興味度を算出する興味度算出手段と、興味度算出手段により算出されたタームの興味度、グループの興味度を比較して興味度が大きいものに基づいて推薦コンテンツを決定する推薦コンテンツ決定手段とを備えることを特徴とする。
本発明によれば、コンテンツを視聴あるいは閲覧するユーザの観点を把握することが可能になる。
本発明の実施形態における情報処理システムの概略図である。 本発明の実施形態における情報処理システムを構成する装置のハードウェア構成図である。 本発明の実施形態における情報処理装置における機能ブロック図である。 本発明の実施形態における情報処理システムにおける機能ブロック図である。 本発明の実施形態における推薦コンテンツの決定処理を説明する模式図である。 本発明の実施形態における推薦コンテンツの決定処理を説明する模式図である。 本発明の実施形態における推薦コンテンツの決定処理を説明する模式図である。 本発明の実施形態における推薦コンテンツの決定処理を説明する模式図である。 本発明の実施形態における推薦コンテンツの決定処理を説明する模式図である。 本発明の実施形態における処理手順を説明するフローチャートである。
本発明の実施形態における情報処理装置、及びこれを含む情報処理システムについて図面を用いて以下説明する。なお、各図中、同一又は相当する部分には同一の符号を付しており、その重複説明は適宜に簡略化乃至省略する。また、以下に記載する実施形態は本発明の最良の形態であって、本発明に係る特許請求の範囲を限定するものではない。
<本実施形態におけるコンテンツ推薦システムのシステム構成について>
本実施形態における情報処理装置を含む情報処理システムのシステム構成について図1を参照して説明する。本実施形態における情報処理システム1は、サーバ10とクライアントである情報処理装置20とがネットワーク30を介して接続されて構成されている。ネットワークの形態としては、LAN(Local Area Network)でもWAN(Wide Area Network)でもよく、また、有線によって接続されるものであっても、無線によって接続されるものであってもよい。
サーバ10は、例えばLANで接続された宅内サーバであっても、WANで接続された外部サーバであってもよい。なお、本実施形態においては、サーバ10を実現するハードウェアの総称として「サーバ」の用語を使用する。サーバ10は、例えばPCでもストレージでもサーバ専用機でもよい。また、サーバ10は、ネットワーク30を介して外部から定期的にWebサイトを構築するための情報やデータを取得し、取得した情報やデータを所定の方式でデータベースとして蓄積しておくことが好ましい。
情報処理装置20は、後述する本実施形態による各処理を実行可能な例えばPC(Personal Computer)等である。また、情報処理装置としては、例えばスマートフォンやタブレットPC等の携帯情報端末であっても、情報処理機能、通信機能、情報表示機能を有するその他の装置であってもよい。なお、本発明としては、サーバ10によって担われる機能を情報処理装置20が備える構成としてもよい。ただし、情報処理装置20にかかる装置負荷の軽減の観点から上記機能はサーバ10に担わせることが好ましい。
<本実施形態における情報処理システムを構成する装置のハードウェア構成について>
次に、本実施形態における情報処理システム1を構成する装置のハードウェア構成について図2を参照して説明する。情報処理システム1を構成する装置は、上述のサーバ10及び情報処理装置20である。なお、図2には、サーバ10、情報処理装置20において、ハードウェア構成として共通する基本的なハードウェアを示している。よって、以下の説明では両者に共通するハードウェア構成についてまとめて説明する。
サーバ10、情報処理装置20は、ハードウェア構成として、CPU11と、RAM12と、ROM13と、NW I/F14と、HDD15と、入力部16と、出力部17を備えている。なお、これらは、サーバ10、情報処理装置20が後述する機能(処理)を実行するための構成の一例を示したものであり、これら以外のハードウェアを排除するものではない。また、これらの構成を全て備える必要もない。例えば、HDD15は必須の構成でなくてもよい。
CPU11は、サーバ10、情報処理装置20における後述する各処理を実現するためのメイン制御部である。CPU11は、ROM13に格納された各処理を規定する処理プログラムがRAM12に読み込まれたものを実行することで、サーバ10、情報処理装置20における各機能を実現する。
RAM12は、上記のようにCPU11のワークメモリとして機能する記憶部である。ROM13は、上記のように各処理を規定した処理プログラムやその他サーバ10や情報処理装置20の制御に要する各種パラメータ等を記憶する記憶部である。
NW I/F14は、図1に示したネットワーク30を介してサーバ10と情報処理装置20とが相互に接続するためのネットワークインタフェースである。HDD15は、例えばドキュメントやコンテンツを記憶する大容量記憶部である。
入力部16は、例えばキーボードやマウス等の入力デバイスである。また、後述する表示部に重畳されたタッチパネルのようにユーザのタッチ操作を受け付けるデバイスであってもよい。さらに、入力部16には、映像を撮影することで画像を取得するカメラや、音声入力を受け付けるマイクが含まれてもよい。
出力部17は、例えばディスプレイ等の表示部である。また、出力部17には、音声を出力するスピーカが含まれてもよい。
また、上記以外に、ユーザの近接を検知して、ユーザID等をユーザが所持する無線通信端末から取得する近距離無線通信デバイスを備えてもよい。
<本実施形態における情報処理装置の機能ブロックについて>
次に、本実施形態における情報処理装置20の機能ブロックについて図3を参照して説明する。本実施形態における情報処理装置20は、機能ブロックとして第1のグループ化部21、第2のグループ化部22、興味度算出部23、及び推薦コンテンツ決定部24を含み構成されている。
第1のグループ化部21は、ドキュメントにおける出現傾向が類似するタームをグループ化した第1のグループを記憶する第1のグループ化手段である。第1のグループ化部21は、図2に示したCPU11、RAM12、ROM13、HDD15によりその機能が実現される。「ドキュメント」とは、対応づけられたテキストを有するコンテンツであり、例えばニュース記事が記載されたWebページなどである。「ターム」とは、ドキュメントを構成する単語のことをいい、例えば形態素解析等によりドキュメントから抽出可能である。「第1のグループ」とは、ドキュメントにおける出現傾向が類似する2以上のタームをグループとしてまとめたものである。「タームの出現傾向が類似」するか否かは、例えばドキュメントにおけるタームの出現頻度を示す出現回数や出現確率に基づいて判定すればよい。他方、第1のグループ化部21は、タームの出現傾向が類似するドキュメントをグループ化した第1のグループを記憶する第1のグループ化手段として機能してもよい。なお、ドキュメント等のコンテンツは、例えばネットワークを介してWebサーバ等から取得すればよい。
第2のグループ化部22は、ドキュメントにおける出現傾向が類似する第1のグループをグループ化した第2のグループを記憶する第2のグループ化手段である。第2のグループ化部22は、図2に示したCPU11、RAM12、ROM13、HDD15によりその機能が実現される。「第2のグループ」とは、ドキュメントにおける出現傾向が類似する2以上の第1のグループをグループとしてまとめたものである。例えば、第1のグループが「犬」や「猫」である場合、「動物」が第2のグループ等であり、カテゴリーといってもよい。「第1のグループの出現傾向が類似」するか否かは、例えばドキュメントにおける第1のグループの出現頻度を示す出現回数や出現確率に基づいて判定すればよい。他方、第2のグループ化部22は、第1のグループの出現傾向が類似するドキュメントをグループ化した第2のグループを記憶する第2のグループ化手段として機能してもよい。
興味度算出部23は、ターム、第1のグループ、第2のグループのそれぞれの興味度を算出する興味度算出手段である。興味度算出部23は、図2に示したCPU11、RAM12、ROM13によりその機能が実現される。興味度は、ユーザがターム、第1のグループ、第2のグループに対して有する興味の度合いの推測値であり、例えばユーザがあるドキュメントに対して閲覧などの操作を行ったときに、操作に応じた得点をそのドキュメントに出現するタームに付与し、タームごとに得点を合計するなどして求めることができる。
推薦コンテンツ決定部24は、興味度算出部23により興味度が算出されたターム、第1のグループ、第2のグループを比較して興味度が大きいものに基づいて推薦コンテンツを決定する推薦コンテンツ決定手段である。推薦コンテンツ決定部24は、図2に示したCPU11、RAM12、ROM13によりその機能が実現される。以上、本実施形態における上記構成によれば、ドキュメントをタームごと、第1のグループごと、第2のグループごとに分類し、それぞれにおける興味度を算出するため、例えば第1のグループ単位でのみ興味度を算出する場合と比較して、ユーザの興味度の範囲や深度を判定することができる。よって、コンテンツを視聴あるいは閲覧するユーザの観点を把握することが可能になる。
さらに、興味度算出部23は、ターム、第1のグループ、及び第2のグループのそれぞれの興味度から分散を求める。ここでの「分散」は、データの散らばり具合、あるいは偏り具合を示す指標をいい、数値が大きいほどデータの散らばり具合が大きいこと等をいう。興味度が大きいものは求められた分散におけるピーク値が高いことになる。
この場合、推薦コンテンツ決定部24は、興味度算出部23により算出されたタームの興味度、第1のグループの興味度、第2のグループの興味度を比較して興味度が大きいものに基づいて推薦コンテンツを決定する。より具体的には、推薦コンテンツ決定部24は、興味度算出部23により算出されたターム、第1のグループ、および第2のグループの興味度から求められる分散に基づいて推薦コンテンツを決定する。そして、推薦コンテンツ決定部24は、興味度算出部23により算出された2以上のタームの興味度が近似している場合、該タームをグループ化した第1のグループに基づいて推薦コンテンツを決定する。さらに、推薦コンテンツ決定部24は、興味度算出部23により算出された2以上の第1のグループの興味度が近似している場合、該第1のグループがグループ化された第2のグループに基づいて推薦コンテンツを決定する。
<本実施形態における情報処理システムの機能ブロックについて>
本実施形態における情報処理システム1の機能ブロックについて図4を参照して説明する。なお、図3に示した各機能ブロックと重複する構成については説明を省略する。ここでは、サーバ10が機能ブロックとして第1のグループ化部101及び第2のグループ化部102を有し、情報処理装置20が機能ブロックとして記憶部201、興味度算出部202、推薦コンテンツ決定部203を有する構成としている。サーバ10で構築され、ROM13等の記憶ユニットに記憶された第1のグループや第2のグループに係るデータベースをNW I/F14を介して情報処理装置20が受信する。情報処理装置20は、受信したデータベースを記憶部201に記憶する。この実施形態によれば、サーバ10においてデータベースを構築・記憶するため、情報処理装置20における装置負荷を軽減することができる。
<本実施形態における推薦コンテンツの決定処理1について>
本実施形態における推薦コンテンツの決定処理1について図5を参照して説明する。以下、図9までは、例えば、タームとして、「○木○紀」「○辺△友」「□橋○なみ」「○田○子」「△島□子」があるドキュメントから抽出され、「○木○紀」「○辺△友」「□橋○なみ」をグループ化した第1のグループとして「グループA」、グループ化するタームは抽出されないが、第1のグループとして抽出された「グループB」、「○田○子」「△島□子」をグループ化した「グループC」が抽出され、さらに、「グループA」「グループB」「グループC」をグループ化した第2のグループとして「アイドル」のカテゴリが抽出されているものとして説明する。
図5においては、興味度算出部23により算出された興味度の分散においてピーク値が高いものが「○辺△友」であることを示している(斜線参照)。つまり、このユーザは「グループA」としてグループ化されたタームのうち「○辺△友」に注目してドキュメントを閲覧していることが分かる。よって、このユーザに対しては、推薦コンテンツ決定部24は、「○辺△友」に基づいて推薦コンテンツを決定する。これにより、例えば世間一般では「グループA」全般に対する興味度が高く、「グループA」に関するあらゆるコンテンツが推薦されるところ、本実施形態においては、「グループA」に所属する「○辺△友」に特化したそのユーザに最適なコンテンツが推薦されることになるため、ユーザの満足度を一層向上させることができる。
<本実施形態における推薦コンテンツの決定処理2について>
次に、本実施形態における推薦コンテンツの決定処理2について図6を参照して説明する。ここでは、興味度算出部23により算出された興味度の分散においてピーク値が高いものが「グループA」であることを示している(斜線参照)。つまり、このユーザは「グループA」に注目してドキュメントを閲覧していることが分かる。よって、このユーザに対しては、推薦コンテンツ決定部24は、「グループA」に基づいて推薦コンテンツを決定する。これにより、例えば世間一般では「○辺△友」に対する興味度が高く、「○辺△友」に特化したコンテンツのみ推薦されるところ、このユーザは「○辺△友」だけではなく「グループA」全般に関する興味度が高く、本実施形態においては、「○辺△友」も所属する「グループA」に関する、そのユーザに最適なコンテンツが推薦されることになるため、ユーザの満足度を一層向上させることができる。
<本実施形態における推薦コンテンツの決定処理3について>
次に、本実施形態における推薦コンテンツの決定処理3について図7を参照して説明する。ここでは、興味度算出部23により算出された興味度の分散においてピーク値が高いものが「アイドル」であることを示している(斜線参照)。なお、本図には、アイドルと同階層のカテゴリとして「スポーツ」を示している。つまり、このユーザは「アイドル」に注目してドキュメントを閲覧していることが分かる。よって、このユーザに対しては、推薦コンテンツ決定部24は、「アイドル」に基づいて推薦コンテンツを決定する。これにより、例えば世間一般では「グループA」に対する興味度が高い場合でも、このユーザによっては、「グループB」「グループC」も含む「アイドル」全般に興味があるため、このユーザに対しては「アイドル」全般に関するコンテンツを推薦することで、このユーザの満足度を一層向上させることができる。
<本実施形態における推薦コンテンツの決定処理4について>
次に、本実施形態における推薦コンテンツの決定処理4について図8を参照して説明する。ここでは、興味度算出部23により算出された興味度の分散において「○木○紀」「○辺△友」「□橋○なみ」のピーク値がいずれも同程度であることを示している(斜線参照)。よって、このユーザに対しては、推薦コンテンツ決定部24は、「○木○紀」「○辺△友」「□橋○なみ」の一人一人に特化したコンテンツではなく、「○木○紀」「○辺△友」「□橋○なみ」をグループ化した「グループA」に関するコンテンツを推薦する。このユーザにとっては、「○木○紀」「○辺△友」「□橋○なみ」の一人一人に特化したコンテンツを推薦するよりは、「○木○紀」「○辺△友」「□橋○なみ」の何れかでも閲覧可能な「グループA」に関するコンテンツを推薦することが、満足度を一層向上させる上で好ましい。例えば、このユーザについては、一人一人に関するコンテンツを逐一推薦されるより、グループA全体に関するコンテンツが推薦される方が、得られる推薦コンテンツが一本化されて、閲覧に際する煩わしさも軽減される。
<本実施形態における推薦コンテンツの決定処理5について>
次に、本実施形態における推薦コンテンツの決定処理4について図9を参照して説明する。ここでは、興味度算出部23により算出された興味度の分散において「グループA」「グループB」「グループC」のピーク値がいずれも同程度であることを示している(斜線参照)。よって、このユーザに対しては、推薦コンテンツ決定部24は、「グループA」「グループB」「グループC」のグループごとに特化したコンテンツではなく、「グループA」「グループB」「グループC」をグループ化した「アイドル」に関するコンテンツを推薦する。このユーザにとっては、「グループA」「グループB」「グループC」のグループごとに特化したコンテンツを推薦するよりは、「グループA」「グループB」「グループC」の何れかでも閲覧可能な「アイドル」のカテゴリ全般に関するコンテンツを推薦することが、満足度を一層向上させる上で好ましい。つまり、このユーザにとっては、結局、「グループA」「グループB」「グループC」に属するアイドル全般に関するコンテンツを推薦することが好ましいため、「アイドル」のカテゴリに関するコンテンツを推薦することが、ユーザの閲覧に対する煩わしさの軽減に繋がる。また、「アイドル」に関するコンテンツを推薦しておけば、「グループA」「グループB」「グループC」それぞれに関するコンテンツを逐一推薦することによる装置負荷を軽減することができる。
<ピーク値の算出処理について>
本実施形態におけるピーク値の算出処理の具体例について以下の表1〜3を参照して説明する。各表は、上述した図5〜9において示した、タームとしての「○木○紀」「○辺△友」「□橋○なみ」「○田○子」「△島□子」、第1のグループ(各表では「G1」としている。)としての「グループA」「グループB」「グループC」、第2のグループ(各表では「G2」としている。)としての「アイドル」について、ドキュメントにおける出現回数、出現確率、タームや各グループに対する興味度、興味度の特徴量を具体的な数値で示したものである。出現回数及び出現確率における「S」は全ドキュメントにおける各タームの出現回数や出現確率を示すものであり、ここでは簡略化のため全ドキュメントにおける総ターム数を1000としている。また、出現回数及び出現確率における「P」は、ここでは、あるユーザの閲覧履歴の出現回数や出現確率を示すものであり、ここでは簡略化のため総閲覧数を100としている。なお、「人気俳優」は第2のグループとして「アイドル」との比較のために示している。
出現確率は、総数に対する各タームの出現回数の割合を示したものである。興味度は、出現確率における「P」を「S」で除することにより算出することができる。興味度の特徴量は、各ターム、各グループの興味度を各ターム、各グループ全体の平均値により除することで算出することができる。興味度の特徴量を算出することにより、各タームや各グループの中でピーキーな箇所を特定しやすくすることができる。
Figure 0006294371
表1は、図5に対応するものであり、ターム「○辺△友」のピーク値が高い例を示したものである。ここでは、「S」における各タームの「P」の出現回数が10%以上であるタームを抽出することにしている。そのため、「P」の出現回数が「30」回である「○辺△友」が抽出される。なお、出現回数が突出しているため、出現確率「0.30」、興味度「1.50」、及び興味度の特徴量「1.52」と算出されているように、いずれも高い数値を示すことになっている(太枠部)。これにより、このユーザは「○辺△友」に対する興味度が最も高いことが分かる。
Figure 0006294371
表2は、図8に対応するものであり、ターム「○木○紀」「○辺△友」「□橋○なみ」の各ピーク値が何れも同程度である例を示したものである。ここでも、「S」における各タームの「P」の出現回数が10%以上であるタームを抽出することにしている。そのため、「P」の出現回数が「23」回である「○木○紀」、「P」の出現回数が「24」回である「○辺△友」、「P」の出現回数が「22」回である「□橋○なみ」が抽出される。これに伴って、対応する出現確率はそれぞれ「0.23」「0.24」「0.22」となり、対応する興味度はそれぞれ「1.15」「1.20」「1.10」となる(太枠部)。この場合、いずれも同程度であるため、タームの段階ではピークを特定することができない。そのため、これらの興味度を平均した「グループA」としての興味度を算出する。その結果、算出されたグループAとしての興味度「1.15」は他のグループの興味度より突出していることが分かる(太枠部)。よって、このユーザは「グループA」全般に対する興味度が高いことが分かる。
Figure 0006294371
表3は、図9に対応するものであり、ターム「○木○紀」「○辺△友」「□橋○なみ」の各ピーク値が何れも同程度で、かつターム「○田○子」「△島□子」の各ピーク値も同程度である例を示したものである。ここでも、「S」における各タームの「P」の出現回数が10%以上であるタームを抽出することにしている。そのため、「P」の出現回数が「20」回である「○木○紀」、「P」の出現回数が「22」回である「○辺△友」、「P」の出現回数が「21」回である「□橋○なみ」が抽出され、「P」の出現回数が「11」回である「○田○子」、「P」の出現回数が「10」回である「△島□子」が抽出される。これに伴って、対応する出現確率はそれぞれ「0.20」「0.22」「0.21」「0.11」「0.10」となり、対応する興味度はそれぞれ「1.00」「1.10」「1.05」「1.10」「1.00」となる(太枠部)。この場合、いずれも同程度であるため、タームの段階ではピークを特定することができない。そのため、これらの興味度を平均した「グループA」「グループC」としての興味度を算出する。その結果、グループAとしての興味度「1.05」、グループCとしての興味度「1.05」が算出される(太枠部)。この場合、いずれも同程度の興味度であるため、第1のグループの段階でもピークを特定することができない。そのため、これらの興味度を平均した「アイドル」としての興味度を算出する。その結果、算出された「アイドル」としての興味度「1.03」は人気俳優の興味度「0.70」より突出していることが分かる(太枠部)。よって、このユーザは「アイドル」全般に対する興味度が高いことが分かる。
以上の処理により、コンテンツを視聴あるいは閲覧するユーザの観点を把握することができ、把握した観点におけるコンテンツを推薦するため、推薦されるコンテンツはユーザの本当に興味のあるものに厳選されることになる。その結果、ユーザの満足度をより一層向上させるとともに、処理装置側の負荷の軽減を図ることが可能になる。なお、上述の表1〜表3における平均比によるピーク算出処理は一例であり、これに限定されるものではなく、例えば偏差等によって算出するものであってもよい。
なお、上述した処理は一例であって、本発明がこれらの例によって限定解釈されるものでないことは言うまでもない。本実施形態においては、例えば「アイドル」のカテゴリを上位層とした場合に、その「アイドル」の下に、中間層として「グループA」「グループB」「グループC」を、さらにその下に、下位層として、中間層の各グループに属するタームをおいた階層構造を例として説明したが、これに限定されない。例えば、「グループA」とは観点の異なる「グループA’」や「グループA’’」に含まれる各タームをグループ化して記憶しておき、各グループにおけるタームの出現回数や出現確率から各タームや各グループの興味度を算出するものであってもよい。「観点の異なるグループ」としては、例えば「グループA」のように特定のメンバーが所属するグループ名と異なり、例えば「20代の女性」という観点のグループや「女優」という観点のグループ等である。これによれば、上述した階層間における関連性を伴う階層構造に限らずとも、ユーザの観点を把握することができる上、上述と同様の効果を奏することが可能になる。なお、階層構造においても、それぞれの階層は観点の異なるグループとして捉えることができる。この場合、図3や図4を参照して説明した「第1のグループ化部」「第2のグループ化部」を「グループ化部」とまとめてもよい。
また、あるタームを基準として、そのタームと共起性の高いタームとともに興味度あるいは興味度の分散傾向を算出し、基準としたタームについて、どの観点でユーザが興味を持っているのかを判定することとしてもよい。また、流行の変遷によって、提供されるコンテンツないしはドキュメントにおけるタームは変化していくものであるが、本実施形態における第1のグループ化部21や第2のグループ化部22は、流行の変遷に追随した新たなタームを記憶することができることは言うまでもない。
<本実施形態における処理手順について>
次に、本実施形態における処理手順について図10を参照して説明する。ここでは、図3に示した情報処理装置20の機能ブロックを用いて説明する。
まず、第1のグループ化部21が、例えば外部から取得したドキュメントについて、タームの出現傾向が類似するドキュメントをグループ化した第1のグループをROM13やHDD15等の記憶ユニットに記憶する(ステップS1)。
次に、第2のグループ化部22が、上記の第1グループの出現傾向が類似するドキュメントをグループ化した第2のグループをROM13やHDD15等の記憶ユニットに記憶する(ステップS2)。
興味度算出部23は、ターム、第1のグループ、第2のグループのそれぞれの興味度を算出する(ステップS3)。さらに、興味度算出部23は、興味度の分散を算出する。
そして、推薦コンテンツ決定部24は、興味度算出部23により算出されたタームの興味度、第1のグループの興味度、第2のグループの興味度のうち、どの興味度が最も大きいかを判定する(ステップS4)。この場合の判定基準としては、相対的に興味度の大きさを判定しても、興味度の閾値を設定し、設定閾値より大きいか否かにより判定してもよい。
推薦コンテンツ決定部24は、タームに対する興味度が大きいと判定した場合(ステップS4、ターム)、タームに基づいて推薦コンテンツを決定する(ステップS5)。
また、推薦コンテンツ決定部24は、第1のグループに対する興味度が大きいと判定した場合(ステップS4、第1のグループ)、第1のグループに基づいて推薦コンテンツを決定する(ステップS5)。
また、推薦コンテンツ決定部24は、第2のグループに対する興味度が大きいと判定した場合(ステップS4、第2のグループ)、第2のグループに基づいて推薦コンテンツを決定する(ステップS5)。
なお、上述する各実施の形態は、本発明の好適な実施の形態であり、本発明の要旨を逸脱しない範囲内において種々変更実施が可能である。例えば、上述した本実施形態の情報処理装置、及び情報処理システムにおける各処理を、ハードウェア、又は、ソフトウェア、あるいは、両者の複合構成を用いて実行することも可能である。
なお、ソフトウェアを用いて処理を実行する場合には、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれているコンピュータ内のメモリにインストールして実行させることが可能である。あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。
また、上述した本実施形態の説明においては、Webサイト等におけるコンテンツあるいはドキュメントを推薦する形態を中心として説明したが、本発明は次のようなシステムにも適用可能である。例えば、ユーザが所有する情報処理機能を有するデジタルテレビと、これに接続されたデジタル放送局の端末で構成されるシステムにおいて、テレビ番組を推薦する形態にも本発明は適用可能である。
また、ユーザごとに例えばNFC等の近距離無線通信が可能な端末を所持させ、情報処理装置20が近距離無線通信を介して認証された特定のユーザの情報を取得し、取得した情報を個人の興味度算出に使用してもよい。特定のユーザの情報としては、例えばユーザの趣味、出身地、血液型、職業等がある。これにより、ユーザは、より精度の高い興味度の算出が可能である。
1 情報処理システム
10 サーバ
20 情報処理装置
11 CPU
12 RAM
13 ROM
14 NW I/F
15 HDD
16 入力部
17 出力部
21、101 第1のグループ化部
22、102 第2のグループ化部
23、202 興味度算出部
24、203 推薦コンテンツ決定部
201 記憶部

Claims (13)

  1. ドキュメントにおける出現傾向が類似するタームを異なる観点でグループ化したグループ複数記憶するグループ化手段と、
    ユーザが操作したドキュメントについて前記ターム、前記グループごとに前記ユーザの興味度を算出する興味度算出手段と、
    前記興味度算出手段により算出された前記タームの興味度、前記グループの興味度を比較して興味度が大きいものに基づいて推薦コンテンツを決定する推薦コンテンツ決定手段と
    を備えることを特徴とする情報処理装置。
  2. タームの出現傾向が類似するドキュメントを異なる観点でグループ化したグループ複数記憶するグループ化手段と、
    ユーザが操作したドキュメントについて前記ターム、前記グループごとに前記ユーザの興味度を算出する興味度算出手段と、
    前記興味度算出手段により算出された前記タームの興味度、前記グループの興味度を比較して興味度が大きいものに基づいて推薦コンテンツを決定する推薦コンテンツ決定手段と
    を備えることを特徴とする情報処理装置。
  3. 前記推薦コンテンツ決定手段は、前記興味度算出手段により算出された前記タームおよび前記グループの興味度の分散においてピーク値が高いものを前記興味度が大きいものとして推薦コンテンツを決定することを特徴とする請求項1又は2記載の情報処理装置。
  4. 前記推薦コンテンツ決定手段は、前記興味度算出手段により算出された2以上の前記タームの興味度が近似していて前記興味度の分散においてピーク値が特定できない場合、該タームをグループ化したグループに基づいて推薦コンテンツを決定することを特徴とする請求項3記載の情報処理装置。
  5. ドキュメントにおける出現傾向が類似するタームをグループ化した第1のグループを記憶する第1のグループ化手段と、複数の前記第1のグループが属するカテゴリーを第2のグループとして記憶する第2のグループ化手段と、
    ユーザが操作したドキュメントについて前記ターム、前記第1のグループ、前記第2のグループごとに前記ユーザの興味度を算出する興味度算出手段と、
    前記興味度算出手段により算出された前記タームの興味度、前記第1のグループの興味度、前記第2のグループの興味度を比較して興味度が大きいものに基づいて推薦コンテンツを決定する推薦コンテンツ決定手段と
    を備えることを特徴とする情報処理装置。
  6. タームの出現傾向が類似するドキュメントをグループ化した第1のグループを記憶する第1のグループ化手段と、
    複数の前記第1のグループが属するカテゴリーを第2のグループとして記憶する第2のグループ化手段と、
    ユーザが操作したドキュメントについて前記ターム、前記第1のグループ、前記第2のグループごとに前記ユーザの興味度を算出する興味度算出手段と、
    前記興味度算出手段により算出された前記タームの興味度、前記第1のグループの興味度、前記第2のグループの興味度を比較して興味度が大きいものに基づいて推薦コンテンツを決定する推薦コンテンツ決定手段と
    を備えることを特徴とする情報処理装置。
  7. 前記推薦コンテンツ決定手段は、前記興味度算出手段により算出された前記ターム、前記第1のグループ、および前記第2のグループの興味度の分散においてピーク値が高いものを興味度が大きいものとして推薦コンテンツを決定するとともに、前記興味度算出手段により算出された2以上の前記タームの興味度が近似していて前記興味度の分散においてピーク値が特定できない場合、該タームをグループ化した前記第1のグループに基づいて推薦コンテンツを決定し、前記興味度算出手段により算出された2以上の前記第1のグループの興味度が近似していて前記興味度の分散においてピーク値が特定できない場合、前記第2のグループに基づいて推薦コンテンツを決定することを特徴とする請求項5又は6記載の情報処理装置。
  8. サーバと情報処理装置とがネットワークを介して接続された情報処理システムであって、
    前記サーバは、
    ドキュメントにおける出現傾向が類似するタームを異なる観点でグループ化したグループ複数記憶するグループ化手段と、
    を備え、
    前記情報処理装置は、
    前記サーバから前記グループ化手段に記憶されるグループを受信して記憶する記憶手段と、
    ユーザが操作したドキュメントについて前記ターム、前記グループごとに前記ユーザの興味度を算出する興味度算出手段と、
    前記興味度算出手段により算出された前記タームの興味度、前記グループの興味度を比較して興味度が大きいものに基づいて推薦コンテンツを決定する推薦コンテンツ決定手段と
    を備えることを特徴とする情報処理システム。
  9. サーバと情報処理装置とがネットワークを介して接続された情報処理システムであって、
    前記サーバは、
    タームの出現傾向が類似するドキュメントを異なる観点でグループ化したグループ複数記憶するグループ化手段と、
    を備え、
    前記情報処理装置は、
    前記サーバから前記グループ化手段に記憶される第1のグループを受信して記憶する記憶手段と、
    ユーザが操作したドキュメントについて前記ターム、前記グループごとに前記ユーザの興味度を算出する興味度算出手段と、
    前記興味度算出手段により算出された前記タームの興味度、前記グループの興味度を比較して興味度が大きいものに基づいて推薦コンテンツを決定する推薦コンテンツ決定手段と
    を備えることを特徴とする情報処理システム。
  10. コンピュータが、ドキュメントにおける出現傾向が類似するタームを異なる観点でグループ化したグループ複数記憶部に記憶するステップと、
    コンピュータが、ユーザが操作したドキュメントについて前記ターム、前記グループごとに前記ユーザの興味度を算出するステップと、
    コンピュータが、算出された前記タームの興味度、前記グループの興味度を比較して興味度が大きいものに基づいて推薦コンテンツを決定するステップと
    を含むことを特徴とする情報処理方法。
  11. コンピュータが、タームの出現傾向が類似するドキュメントを異なる観点でグループ化したグループ複数記憶部に記憶するステップと、
    コンピュータが、ユーザが操作したドキュメントについて前記ターム、前記グループごとに前記ユーザの興味度を算出するステップと、
    コンピュータが、算出された前記タームの興味度、前記グループの興味度を比較して興味度が大きいものに基づいて推薦コンテンツを決定するステップと
    を含むことを特徴とする情報処理方法。
  12. ドキュメントにおける出現傾向が類似するタームを異なる観点でグループ化したグループ複数記憶部に記憶する処理と、
    ユーザが操作したドキュメントについて前記ターム、前記グループごとに前記ユーザの興味度を算出する処理と、
    算出された前記タームの興味度、前記グループの興味度を比較して興味度が大きいものに基づいて推薦コンテンツを決定する処理と
    をコンピュータに実行させることを特徴とするプログラム。
  13. タームの出現傾向が類似するドキュメントを異なる観点でグループ化したグループ複数記憶部に記憶する処理と、
    ユーザが操作したドキュメントについて前記ターム、前記グループごとに前記ユーザの興味度を算出する処理と、
    算出された前記タームの興味度、前記グループの興味度を比較して興味度が大きいものに基づいて推薦コンテンツを決定する処理と
    をコンピュータに実行させることを特徴とするプログラム。
JP2016039132A 2016-03-01 2016-03-01 情報処理装置、情報処理システム、情報処理方法、及び、プログラム Active JP6294371B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016039132A JP6294371B2 (ja) 2016-03-01 2016-03-01 情報処理装置、情報処理システム、情報処理方法、及び、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016039132A JP6294371B2 (ja) 2016-03-01 2016-03-01 情報処理装置、情報処理システム、情報処理方法、及び、プログラム

Publications (2)

Publication Number Publication Date
JP2017156958A JP2017156958A (ja) 2017-09-07
JP6294371B2 true JP6294371B2 (ja) 2018-03-14

Family

ID=59810124

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016039132A Active JP6294371B2 (ja) 2016-03-01 2016-03-01 情報処理装置、情報処理システム、情報処理方法、及び、プログラム

Country Status (1)

Country Link
JP (1) JP6294371B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4129127B2 (ja) * 2000-09-14 2008-08-06 シルバーエッグ・テクノロジー株式会社 推奨情報送信システム
JP2004199544A (ja) * 2002-12-20 2004-07-15 Mitsubishi Electric Corp 商品提案支援装置及び商品提案支援方法及びプログラム及びプログラムを記録したコンピュータ読み取り可能な記録媒体
JP5224868B2 (ja) * 2008-03-28 2013-07-03 株式会社東芝 情報推薦装置および情報推薦方法
JP6056592B2 (ja) * 2013-03-26 2017-01-11 大日本印刷株式会社 情報推薦装置、推薦情報決定方法、推薦情報決定プログラム、及び情報推薦プログラム

Also Published As

Publication number Publication date
JP2017156958A (ja) 2017-09-07

Similar Documents

Publication Publication Date Title
CN110297848B (zh) 基于联邦学习的推荐模型训练方法、终端及存储介质
WO2020048084A1 (zh) 资源推荐方法、装置、计算机设备及计算机可读存储介质
WO2017181612A1 (zh) 个性化视频推荐方法及装置
CN105095508B (zh) 一种多媒体内容推荐方法和多媒体内容推荐装置
CN109033149B (zh) 信息推荐方法、装置、服务器及存储介质
CN106326391B (zh) 多媒体资源推荐方法及装置
US20130036121A1 (en) System and method for recommending blog
WO2020238502A1 (zh) 物品推荐方法及装置、电子设备及存储介质
CN109168047B (zh) 视频推荐方法、装置、服务器及存储介质
US9325754B2 (en) Information processing device and information processing method
JP5442547B2 (ja) コンテンツ推薦装置及び方法
CN102165441A (zh) 用于分级媒体共享频道的方法、系统以及设备
US10255277B2 (en) Crowd matching translators
US10762122B2 (en) Method and device for assessing quality of multimedia resource
EP3149615A1 (en) Information processing device, information processing method, and program
Barragáns-Martínez et al. Developing a recommender system in a consumer electronic device
CN111291217B (zh) 一种内容推荐方法、装置、电子设备以及计算机可读介质
JP2017068547A (ja) 情報提供装置、プログラム及び情報提供方法
US9530024B2 (en) Recommendation system for protecting user privacy
CN105956061B (zh) 一种用户间相似度确定方法及装置
CN112948602B (zh) 一种内容显示方法、装置、系统、设备及存储介质
KR101976056B1 (ko) 추천 시스템 및 추천 방법
JP5627002B2 (ja) 類似映像出力方法、類似映像出力装置および類似映像出力プログラム
US8745074B1 (en) Method and system for evaluating content via a computer network
CN110727853B (zh) 向用户呈现控制的异构数字内容

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180123

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180215

R150 Certificate of patent or registration of utility model

Ref document number: 6294371

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250