JP2018005305A - 情報処理システム、情報処理装置、プログラム - Google Patents

情報処理システム、情報処理装置、プログラム Download PDF

Info

Publication number
JP2018005305A
JP2018005305A JP2016127069A JP2016127069A JP2018005305A JP 2018005305 A JP2018005305 A JP 2018005305A JP 2016127069 A JP2016127069 A JP 2016127069A JP 2016127069 A JP2016127069 A JP 2016127069A JP 2018005305 A JP2018005305 A JP 2018005305A
Authority
JP
Japan
Prior art keywords
keyword
content
information processing
user
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016127069A
Other languages
English (en)
Other versions
JP6421146B2 (ja
Inventor
竹本 剛
Takeshi Takemoto
剛 竹本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Personal Computers Ltd
Original Assignee
NEC Personal Computers Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Personal Computers Ltd filed Critical NEC Personal Computers Ltd
Priority to JP2016127069A priority Critical patent/JP6421146B2/ja
Publication of JP2018005305A publication Critical patent/JP2018005305A/ja
Application granted granted Critical
Publication of JP6421146B2 publication Critical patent/JP6421146B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】装置間でコンテンツと共にコンテンツを検索するためのキーワードを併せて送受信できる情報処理システムを提供することを目的とする。【解決手段】本発明に係る情報処理システムは、サーバが、第1のデータベースを備え、ユーザが閲覧する閲覧ドキュメントに関連する第1のキーワードを、社会一般の興味度に基づいて選定し、第1のキーワードに関連する第1のコンテンツを取得し、第1のキーワード、および取得した第1のコンテンツを情報処理装置に送信し、情報処理装置が、第2のデータベースを備え、閲覧ドキュメントに関連する第2のキーワードを、ユーザの興味度に基づいて選定し、第2のキーワードを送信し、第2のキーワードに関連する第2のコンテンツを受信し、受信した第1のコンテンツ、および第2のコンテンツを閲覧ドキュメントと共に表示する、ことを特徴とする。【選択図】図2

Description

本発明は、情報処理システム、情報処理装置、およびプログラムに関する。
近年、インターネットや放送網から膨大な情報やデータ量が提供されるとともに、提供される情報も多様化してきている。また、インターネットや放送網から情報を取得しようとするユーザも増加している。このような状況の中、インターネットや放送網を使用してコンテンツを提供する事業者が、インターネット等へのユーザのアクセス履歴等を収集し、収集したアクセス履歴に基づいてユーザごとの嗜好を分析し、分析された嗜好に合致するコンテンツを推薦するシステムが既に知られている。
上記のようなコンテンツ推薦システムに関連する技術が例えば特許文献1に開示されている。特許文献1では、ユーザの嗜好変化に追随できるように、履歴情報とユーザ固有の情報を対応させたテーブルを用意し、該テーブルにユーザの履歴情報を反映させていくことにより、ユーザに有益な情報を提供する技術が開示されている。
特開2009−087155号公報
しかし、例えば特許文献1に開示されたような従来の技術は、推薦コンテンツが所定のキーワードに基づいて検索され、検索された推薦コンテンツを取得するものであったが、所定のキーワードが社会一般の興味度が高いものだけであった場合、ユーザ固有の興味度が反映されない。また、検索処理を行う装置が複数あり、同時間帯に一斉に検索エンジンに対して検索を行ったとすると、アクセス集中によりパフォーマンスが低下してしまう。つまり、ユーザ固有の興味度を反映しつつ、装置のパフォーマンスを低下させないレコメンドシステムの構築が課題となっている。
本発明は、このような実情に鑑みてなされたものであって、装置間でコンテンツと共にコンテンツを検索するためのキーワードを併せて共有できる情報処理システムを提供することを目的とする。
本発明に係る情報処理システムは、ネットワークで接続された情報処理装置とサーバとを有する情報処理システムであって、サーバが、ドキュメントに含まれる単語であるタームに社会一般の興味度を対応付けて記憶する第1のデータベースと、ユーザが閲覧する閲覧ドキュメントに関連する第1のキーワードを、社会一般の興味度に基づいて選定する第1のキーワード選定手段と、選定された第1のキーワードに関連する第1のコンテンツを取得する第1のコンテンツ取得手段と、選定された第1のキーワード、および取得した第1のコンテンツを情報処理装置に送信するキーワードコンテンツ送信手段と、を備え、情報処理装置が、ドキュメントに含まれる単語であるタームにユーザの興味度を対応付けて記憶する第2のデータベースと、閲覧ドキュメントに関連する第2のキーワードを、ユーザの興味度に基づいて選定する第2のキーワード選定手段と、第2のキーワードを送信し、第2のキーワードに関連する第2のコンテンツを受信するコンテンツ受信手段と、受信した第1のコンテンツ、および第2のコンテンツを閲覧ドキュメントと共に表示する表示手段と、を備える、ことを特徴とする。
本発明に係る情報処理装置は、ユーザが閲覧する閲覧ドキュメントに関連する第1のキーワードと、第1のコンテンツと、を受信するキーワードコンテンツ受信手段と、ドキュメントに含まれる単語であるタームにユーザの興味度を対応付けて記憶するデータベースと、閲覧ドキュメントに関連する第2のキーワードを、ユーザの興味度に基づいて選定するキーワード選定手段と、第2のキーワードを送信し、第2のキーワードに関連する第2のコンテンツを受信するコンテンツ受信手段と、受信した第1のコンテンツ、および第2のコンテンツを閲覧ドキュメントと共に表示する表示手段と、を備える、ことを特徴とする。
本発明に係る工程をコンピュータに実行させるプログラムは、ユーザが閲覧する閲覧ドキュメントに関連する第1のキーワードと、第1のコンテンツと、を受信する工程と、ドキュメントに含まれる単語であるタームにユーザの興味度を対応付けて記憶するデータベースを生成する工程と、閲覧ドキュメントに関連する第2のキーワードを、ユーザの興味度に基づいて選定する工程と、第2のキーワードを送信し、第2のキーワードに関連する第2のコンテンツを受信する工程と、受信した第1のコンテンツ、および第2のコンテンツを閲覧ドキュメントと共に表示する工程と、を含む、ことを特徴とする。
本発明によれば、装置間でコンテンツと共にコンテンツを特定するためのキーワードを併せて共有できる。
本発明の実施形態にかかる情報処理システムを構成するサーバ1と情報処理装置2のハードウェア構成図である。 本発明の実施形態にかかる情報処理システムの機能ブロック図である。 本発明の実施形態にかかるドキュメントクラスタリングの一例である。 本発明の実施形態にかかる閲覧ドキュメントの一例である。 本発明の実施形態にかかる一般興味度表示の一例である。 本発明の実施形態にかかる個人興味度表示の一例である。 本発明の実施形態にかかる閲覧ドキュメントに関連する一般キーワードと個人キーワードの抽出の一例である。 本発明の実施形態にかかるコンテンツ表示の一例である。 本発明の実施形態にかかるキーワードランキング化の一例である。 本発明の実施形態にかかるキーワードランキング化の一例である。 本発明の実施形態にかかるコンテンツ表示の一例である。 本発明の実施形態にかかるコンテンツ表示のフローチャートである。 本発明の実施形態にかかるキーワードランキング化のフローチャートである。
以下、本発明の実施の形態について詳細に説明する。
まず、本実施形態の情報処理システムにかかるサーバ1と情報処理装置2のハードウェア構成について図1を用いて説明する。ここでのサーバ1とは、複数のコンピュータにネットワーク30を通じて処理要求を行うホストコンピュータを指す。また、情報処理装置2とは、例えばパーソナルコンピュータ、タブレット端末、スマートフォンなどのネットワーク30に接続が可能な情報端末を指す。尚、サーバ1、および情報処理装置2の構成は、図1に示したものと必ずしも同じ構成である必要はなく、本実施形態を実現できるハードウェアを備えていればそれで十分である。
サーバ1は、所定のプログラムを実行することにより、サーバ1の全体の制御を実現するためのCPU10と、サーバ1の電源が投入されたときにCPU10が読出すプログラムを記憶する読出専用の不揮発メモリであるマスクROM、EPROM、またはSSDなどと、CPU10がプログラムを読み出し、演算処理等により生成したデータを一時的に書き込む作業用の揮発メモリであるSRAMやDRAMなどから構成されるメモリ11と、サーバ1の電源が切断されたときに種々のデータの記録を保持することが可能なHDD12と、を備えている。
また、サーバ1は、通信I/F13を更に備えている。サーバ1は通信I/F13を介してネットワーク30に接続されている。通信I/F13は、接続されている複数の情報処理装置2に対するユーザ操作に基づいてネットワーク30経由でアクセス可能な各種情報にアクセスするものであり、通信I/F13の具体例としてUSBポートやLANポート、無線LANポートなどがあり、外部の機器とデータの送受信が行えればどのようなものでも構わない。
情報処理装置2は、所定のプログラムを実行することにより、情報処理装置2の全体の制御を実現するためのCPU20と、情報処理装置2の電源が投入されたときにCPU20が読出すプログラムを記憶する読出専用の不揮発メモリであるマスクROM、EPROM、またはSSDなどと、CPU20がプログラムを読み出し、演算処理等により生成したデータを一時的に書き込む作業用の揮発メモリであるSRAMやDRAMなどから構成されるメモリ21と、情報処理装置2の電源が切断されたときに種々のデータの記録を保持することが可能なHDD22と、マウスや入力キーで構成される入力装置23と、液晶、および有機ELなどのパネルを用いたディスプレイを備えた表示装置24と、を備えている。
また、情報処理装置2は、通信I/F25を更に備えている。情報処理装置2は通信I/F25を介してネットワーク30に接続されている。通信I/F25は、情報処理装置2のユーザの操作に基づいてネットワーク30経由でアクセス可能な各種情報にアクセスするものであり、通信I/Fの具体例としてUSBポートやLANポート、無線LANポートなどがあり、外部の機器とデータの送受信が行えればどのようなものでも構わない。
図2は、本発明の実施形態にかかる情報処理システムの機能ブロック図である。図2に示すように、本発明にかかる情報処理システムを構成するサーバ1は、第1のデータベース100と、第1のキーワード選定手段101と、第1のコンテンツ取得手段102と、キーワードコンテンツ送信手段103と、キーワードランキング手段104と、を備えている。また、本発明にかかる情報処理システムを構成する情報処理装置2は、第2のデータベース200と、第2のキーワード選定手段201と、コンテンツ受信手段202と、表示手段203と、を備えている。
サーバ1の第1のデータベース100は、各種データを不揮発に記憶する情報である。本実施形態では、ネットワーク30を介して外部から定期的に取得した情報やデータを蓄積し、所定の方式でデータベース化して記憶する情報を意味する。本実施形態でデータベースとして扱うものについては、情報を記憶するための専用のHDDなどの不揮発記憶装置を備えてもよいし、HDD12に記憶させてもよい。第1のデータベース100の詳細については後述する。
サーバ1が備える第1のデータベース100は、ネットワーク30経由でアクセス可能なドキュメントを該ドキュメントが含まれるカテゴリごと、該ドキュメントに含まれるタームごとにグループ化した所謂クラスタリング方式で生成したデータベースに対して社会一般の「一般興味度」を対応付けて記憶したものである。尚、本実施形態において「ドキュメント」とは、例えば不特定多数の人間が閲覧可能な多岐に渡る情報を意味しており、例えば、政治経済などの社会記事を配信するサイトの情報や、スポーツ記事を配信するサイトの情報などをいう。本実施形態において「ターム」とは、ドキュメントに出現する単語のことを言う。以後、ユーザが閲覧する閲覧ドキュメントに出現する単語、および各種データベース等を構成する単語は、一律してタームと表記する。尚、一般興味度の詳細については後述する。
ドキュメントのクラスタリングには様々な方式があるが、例えばドキュメントを形態素解析し、出現するタームの出現傾向が類似するタームごと、ドキュメント自体のカテゴリごとでグループ化する二次元データベースの方式がある。また、例えばドキュメントを形態素解析し、出現するタームの出現傾向が類似するタームごとのカテゴリのみでグループ化する一次元データベースの方式もある。このようにクラスタリングを行うことで、膨大な量のドキュメントであっても、ドキュメントに出現するタームの出現傾向に従ってグループ化できる。本実施形態で用いる第1のデータベース100、および第2のデータベース200は上述の一次元データベースの方式でクラスタリングされているものとして説明する。
上記のようにクラスタリングを行った一次元データベースの一例を図3として挙げる。膨大なドキュメントに出現するタームによるグループ化を行うと、無数のカテゴリが生まれることになるが、図3では説明の簡素化のため、カテゴリを「野球」、「サッカー」、「政治」の3つに限定する。また、わかりやすく説明するためにカテゴリ名を「野球」、「サッカー」、「政治」と表記しているが、実際にコンピュータ内でデータベースを生成すると、カテゴリIDや、カテゴリ番号等で管理されることが一般的である。カテゴリ「野球」であれば、「野球」に関連するタームの出現傾向が類似しており、「ジャイアンツ」、「松井秀喜」などがカテゴリ「野球」に属するタームとしてグループ化される。「サッカー」、「政治」に関しても同様にグループ化される。
図3の出現頻度は、一次元データベースを構成する全タームの出現回数に対する所定のタームの出現率を意味する。
サーバ1の第1のキーワード選定手段101は、ユーザが閲覧する閲覧ドキュメントに関連する第1のキーワードを、第1のデータベース100での社会一般の興味度に基づいて選定する。閲覧ドキュメントとは、例えば図4に示すようなネットワーク30経由でアクセス可能なドキュメントである。ここで、図4のドキュメントに関連するキーワードを選定する場合を考えてみる。
まず、一次元データベースに存在する複数のカテゴリの中で、図4のドキュメントが属するカテゴリを特定する方法を説明する。属するカテゴリの判断は、例えば図4のドキュメントを構成する文章を形態素解析して抽出されるタームとタームの出現頻度に着目することで判断できる。詳細に言えば、図4のドキュメントを構成する文章の形態素解析により抽出されるタームの一次元データベースでの出現頻度に基づいて、図4のドキュメントと図3の各カテゴリとの類似性を評価する。類似性は、一次元データベースでの閲覧ドキュメントに出現するタームの出現頻度の合計値と、閲覧ドキュメントでの出現頻度の合計値との相関に基づいて評価することができる。尚、評価方法はこの方法だけに限定されない。例えば、一次元データベースでの閲覧ドキュメントに出現するタームの出現頻度の値が単純に大きいものを類似性が高いと評価することも可能である。更には、ユークリッド距離、またはコサイン類似度などを適用して類似性を評価することも可能である。
類似性の判断結果より、図4のドキュメントと類似する図3のカテゴリは「野球」であるとする。つまり、第1のキーワードはカテゴリ「野球」の中のタームから選定されることになる。図5はカテゴリ「野球」に出現するタームの出現頻度より、一般興味度を算出した一例である。一般興味度とは、図3の一次元データベースに出現するタームの特徴量として定義したものである。サーバ1が取得する情報として、上記で説明したネットワーク30経由でアクセス可能な多様なカテゴリのドキュメントの他に、不特定多数のユーザが自由に発言したり、WEBリンクを張り付けたりできる所謂ツイッタ−(登録商標)やSNSなどのソーシャルネットワークサービスがある。このようなソーシャルネットワークサービスは、例えばあるトピックに対しての不特定ユーザの書き込みやアクセス回数などから現在の流行や注目されていることなどが反映されやすいという特徴がある。つまり社会一般で流行っているもの、注目しているものが顕著に出やすい。サーバ1は、図示していないが、このようなソーシャルネットワークサービスで取得したドキュメントを構成する文章を形態素解析して抽出したタームと出現頻度を関連付けた「ソーシャルデータベース」を備えている。
一般興味度はソーシャルネットワークサービスで取得したドキュメントから生成したデータベースに出現するタームの出現頻度と、図3のデータベースに出現する同タームの出現頻度と、の相関により算出することが可能である。一例として一般興味度は、図5の一次元データベースでの出現頻度をA、ソーシャルデータベースでの出現頻度をBとして、LOG(B/A)で算出できる。尚、本実施形態ではLOGの底を10として算出しているが、底は10に限定されない。算出された値は、社会一般における興味度を示している。一次元データベースでの出現頻度が低く、ソーシャルデータベースでの出現頻度が高いほど大きな値を示し、より嗜好性の強いタームであると言えるからである。図5では、カテゴリ「野球」で一般興味度が高いタームは「ジャイアンツ」、「松井秀喜」、「阪神」ということになる。このように、一次元データベースに対して、ソーシャルデータベース、つまり、社会一般で注目されているサイトの情報から一次元データベースを構成するタームの特徴量としての一般興味度を対応付けて記憶したものが第1のデータベース100として定義される。
算出された一般興味度より、カテゴリ「野球」から、「ジャイアンツ」、「松井秀喜」、「阪神」が選定されるキーワードの候補となる。尚、キーワードは、一般興味度が最も高いものだけを選定してもよいし、所定の規定に基づいて複数選定してもよい。本実施例では興味度の高い上位3つのターム「ジャイアンツ」、「松井秀喜」、「阪神」をキーワードとして選定する。
サーバ1の第1のキーワード選定手段101は、CPU10がメモリ11に記憶されている所定のキーワード選定プログラムに基づいてHDD12に記憶されているデータベース等を読み出して実行し、演算処理等されたデータをメモリ11に一時的に記憶、もしくはHDD12などに記憶することで実現が可能である。
サーバ1の第1のコンテンツ取得手段102は、選定された第1のキーワードに関連する第1のコンテンツを取得する。なお、本実施形態における「コンテンツ」は、コンテンツという語句そのものが有する通常の意味に加え、例えば、映像、音楽、文章、又はそれらの組合せ等の、メディアが記録又は伝送し、人間が鑑賞するひとまとまりの情報をいい、実例でいえば例えばインターネットで配信されるアプリケーションやダウンロード可能な映像コンテンツ若しくは音楽コンテンツ等をいう。
取得されるコンテンツは、全て有効な情報として扱ってもよいが、コンテンツに含まれるドキュメントを構成する文章を再度形態素解析して、出現するタームの一般興味度からコンテンツを絞り込んでもよい。取得したコンテンツを再評価することで、社会一般の嗜好にマッチしたコンテンツに絞り込んで提供することが可能となる。
サーバ1の第1のコンテンツ取得手段102は、CPU10がメモリ11に記憶されている所定のコンテンツ取得プログラムに基づいてHDD12に記憶されているデータベース等を読み出して実行し、通信I/F13よりネットワーク30を介して所定のウェブサイトにアクセスし、コンテンツを取得することで実現が可能である。
サーバ1のキーワードコンテンツ送信手段103は、選定された第1のキーワード、および取得した第1のコンテンツを情報処理装置2に送信する。取得したコンテンツが複数の場合、全てのコンテンツを送信するか、もしくは、第1のコンテンツ取得手段102により、一般興味度が高いと評価されたコンテンツのみを送信してもよい。また、第1のキーワードに関しても同様に、第1のキーワードと第2のコンテンツを紐付け、送信対象となった第1のコンテンツに関連する第1のキーワードのみを送信するようにしてもよい。
サーバ1のキーワードコンテンツ送信手段103は、CPU10がメモリ11に記憶されている所定のキーワードコンテンツ送信プログラムに基づいてHDD12に記憶されているデータベース等を読み出して実行し、通信I/F13よりネットワーク30を介して情報処理装置2に第1のキーワード、および第1のコンテンツを送信することで実現が可能である。
情報処理装置2が備える第2のデータベース200は、ネットワーク30経由でアクセス可能なドキュメントを該ドキュメントが含まれるカテゴリごと、該ドキュメントに含まれるタームごとにグループ化した所謂クラスタリング方式で生成したデータベースに対して「ユーザ興味度」を対応付けて記憶したものである。データベースの生成方式としては、第1のデータベース100の生成方式と同様に、例えばドキュメントを構成する文章を形態素解析し、出現するタームの出現傾向が類似するタームごと、ドキュメント自体のカテゴリごとでグループ化する二次元データベースの方式、もしくはドキュメントを構成する文章を形態素解析し、出現するタームの出現傾向が類似するタームごとのみでグループ化する一次元データベースの方式もある。前述のとおり、第2のデータベース200の土台となるデータベースは、第1のデータベース100と同様の一次元データベースとする。尚、ユーザ興味度の詳細については後述する。
一次元データベースは、第1のデータベース100と同様に図3を用いる。第1のデータベース100において一般興味度を特徴量として定義したように、情報処理装置2が備える第2のデータベース200では、情報処理装置2を保有するユーザ自身のユーザ興味度を特徴量として定義する。情報処理装置2が取得する情報として、上記で説明したネットワーク30経由でアクセス可能な多様なカテゴリのドキュメントの他に、ユーザ自身の嗜好に基づいてネットワーク30経由で取得したドキュメントがある。例えば、「野球」が好きなユーザであれば、必然的に「野球」に関連するドキュメントを閲覧するケースが多くなり、ユーザ自身の操作に基づいてネットワーク30経由で取得したドキュメントが記憶される。このようにユーザ自身の嗜好に基づいてネットワーク30経由で取得したドキュメントの閲覧履歴に基づいて図3の一次元データベースと同様のクラスタリング方式で生成された「ユーザデータベース」も備えている。
ユーザ興味度は、ユーザ自身の嗜好に基づいて取得したドキュメントから生成したユーザデータベースに出現するタームの出現頻度と、図3の一次元データベースに出現する同タームの出現頻度と、の相関により算出することが可能である。計算方法の一例として、図5の一般興味度と同様の計算方法で算出が可能である。算出結果は図6のようになっており、ここでは2つの情報処理装置2がサーバ1とネットワーク30経由で接続されているケースを想定し、「Aさん」と「Bさん」それぞれのユーザ興味度が記載されている。「Aさん」、および「Bさん」それぞれのユーザ興味度は同じカテゴリ「野球」であっても、例えば「Aさん」は「ソフトバンク」というタームの興味度が高く、「Bさん」は「イチロー」というタームの興味度が高いなど、カテゴリ内での興味度はユーザごとで様々である。このように、一次元データベースに対して、ユーザデータベース、つまり、情報処理装置2を保有するユーザが過去に閲覧したドキュメントの履歴情報から一次元データベースを構成するタームの特徴量としてのユーザ興味度を対応付けて記憶したものが第2のデータベース200として定義される。
以上のように、情報処理装置2を保有するユーザがそれぞれ固有の第2のデータベース200を備えている。
情報処理装置2の第2のキーワード選定手段201は、閲覧ドキュメントに関連する第2のキーワードを、第2のデータベース200でのユーザの興味度に基づいて選定する。前述で定義したユーザ興味度に基づいて「Aさん」が保有する情報処理装置2から第2のキーワードを選定する場合を考えてみる。図7に示すとおり、ユーザ興味度に着目すると、カテゴリ「野球」から、「ソフトバンク」、「カープ」、「ジャイアンツ」が選定されるキーワードの候補となる。閲覧ドキュメントと類似性が高いカテゴリは、第1のキーワードを選定した時と同様に「野球」であるものとする。選定する第2のキーワードは、ユーザ興味度が最も高いものだけを選定してもよいし、所定の規定に基づいて複数選定してもよい。また、第1のキーワード選定手段101により選定されたキーワードと重複するキーワードは選定対象としなくてもよい。本実施例ではユーザ興味度の高い上位3つのターム「ソフトバンク」、「カープ」、「ジャイアンツ」をキーワードとして選定する。
選定された第2のキーワードのユーザ興味度を一般興味度と比較すると、「ジャイアンツ」というキーワードが第1のキーワードと重複しているが、「ソフトバンク」、「カープ」は、一般興味度が低く、ユーザ興味度が高いユーザ固有のキーワードである。このように、一般興味度とユーザ興味度双方の嗜好性の高いキーワードを選定することが可能となる。
情報処理装置2の第2のキーワード選定手段201は、CPU20がメモリ21に記憶されている所定のキーワード選定プログラムに基づいてHDD22に記憶されているデータベース等を読み出して実行し、演算処理等されたデータをメモリ21に一時的に記憶、もしくはHDD22などに記憶することで実現が可能である。
情報処理装置2のコンテンツ受信手段202は、第2のキーワードを送信し、第2のキーワードに関連する第2のコンテンツを受信する。前述した第2のキーワード選定手段201で選定された第2のキーワードを第2のコンテンツが取得可能なサーバ1に送信する。尚、第2のキーワードの送信先のサーバとしては、第1のキーワード、および第1のコンテンツの送信元であるサーバ1であってもよいし、または別のサーバやホストコンピュータ等であってもよい。情報処理装置2から受信した第2のキーワードに関連するコンテンツを取得できる機能を有するコンピュータであれば特に制限は設けない。第2のキーワードは前述した「Aさん」が保有する情報処理装置2から選定した「ソフトバンク」、「カープ」、「ジャイアンツ」であるものとする。第2のコンテンツを受信する際に、例えば一般興味度から選定された「ジャイアンツ」という重複したキーワードに関連するコンテンツは取得しなくてもよい。
情報処理装置2のコンテンツ受信手段202は、CPU20がメモリ21に記憶されている所定のコンテンツ受信プログラムに基づいて通信I/F25よりネットワーク30を介して第2のキーワードを送信し、第2のキーワードに関連する第2のコンテンツを外部より受信することで実現が可能である。
情報処理装置2の表示手段203は、受信した第1のコンテンツ、および第2のコンテンツを前記閲覧ドキュメントと共に表示する。図8にコンテンツ表示の一例を示す。受信した第1のコンテンツと、ユーザ興味度に基づいて取得された第2のコンテンツを、例えば表示装置24に出力する。ユーザ固有のキーワードである「ソフトバンク」、「カープ」に関連するコンテンツだけでなく、一般興味度の高い「ジャイアンツ」、「松井秀喜」に関連するコンテンツも閲覧することが可能であり、個人的に嗜好性の高いコンテンツだけでなく、社会一般で嗜好性の高いコンテンツも閲覧することが可能となる。
情報処理装置2の表示手段203は、CPU20がメモリ21に記憶されている所定の情報表示プログラムに基づいて、表示装置24に記憶されている所定の表示形式に従って表示装置24に情報を表示することで実現が可能である。
サーバ1が更に備えるキーワードランキング手段104は、情報処理装置2より受信した第2のキーワードの特徴に基づいてランク付けを行う。尚、ここでは、サーバ1がネットワーク30を介して複数の情報処理装置2と接続されている場合を考えてみる。全ての情報処理装置2が前述の機能を備えており、更に情報処理装置2で選定された第2のキーワードはサーバ1に送信されるものとする。つまりサーバ1に接続されている「Aさん」、「Bさん」それぞれが保有する情報処理装置2から第2のキーワードを受信する。
複数のユーザから受信したキーワードの一覧を図9として示す。尚、各ユーザから受信する第2のキーワードはユーザ興味度が高い上位3つとする。図9を参照すると、「Aさん」が保有する情報処理装置2から受信したキーワードは「ソフトバンク」、「カープ」、「ジャイアンツ」の3つであり、「Bさん」が保有する情報処理装置2から受信したキーワードは「イチロー」、「ジャイアンツ」、「松井秀喜」の3つである。尚、カテゴリ「野球」に属するタームで、キーワードとして選定されなかったタームは「選定外」とし、ユーザ興味度は0とする。
<本実施形態におけるキーワードランキング化の第1の実施形態>
図9に示した情報より、ユーザが保有する情報処理装置2から受信した第2のキーワードをランキング付けする第1の実施形態について説明する。第1の実施形態では、情報処理装置2から受信したキーワードと、キーワードにおけるユーザ興味度の情報からランキング付けを行う。まず、キーワードごとに複数のユーザのユーザ興味度を積算して算出する。例えば、キーワード「ジャイアンツ」は「Aさん」、「Bさん」それぞれの情報処理装置2から受信したキーワードであるため、「Aさん」のユーザ興味度は0.3、「Bさん」のユーザ興味度は0.35とすると、積算結果は0.65になる。このようにキーワードごとにユーザ興味度を積算し、積算結果が大きい順にランキング付けを行う。
積算結果より、上位キーワードは「ソフトバンク」、「イチロー」、「ジャイアンツ」となり、これらのキーワードがユーザに送信されるコンテンツを取得するためのキーワードの候補となる。「Aさん」のユーザ興味度からは「イチロー」というキーワードは「選定外」であったが、「Bさん」のユーザ興味度から「イチロー」というキーワードが選定されている。つまり、自身のユーザ興味度が低いキーワードであっても、他人のユーザ興味度が高ければキーワードとして選定される可能性がある。
<本実施形態におけるキーワードランキング化の第2の実施形態>
次に、図10に示した情報より、ユーザが保有する情報処理装置2から受信した第2のキーワードをランキング付けする第2の実施形態について説明する。第2の実施形態では、受信したキーワードの集計数からランキング付けを行う。本実施形態ではサーバ1とネットワーク30を介して接続されている情報処理装置2は2台の想定であるが、例えば1000台の情報処理装置2と接続されている場合などでは、受信するキーワードの重複が多々起きることが想定される。集計方法としては、「Aさん」が保有する情報処理装置2から受信したキーワードの中に「イチロー」が含まれていれば“1”として集計する。このようにサーバ1とネットワーク30で接続されている全てのユーザの情報処理装置2より受信したキーワードの集計量を算出する。
算出結果により、上位キーワードは「イチロー」、「ジャイアンツ」、「ソフトバンク」となり、これらのキーワードが、ユーザが保有する情報処理装置2に送信されるコンテンツを取得するためのキーワードの候補となる。
本実施形態におけるキーワードランキング化のその他の実施形態としては、例えば一般興味度に基づいて選定されたキーワードと重複するキーワードと、一般興味度に基づいて選定されなかったユーザ固有のキーワードとが共存する場合は、ユーザ固有のキーワードを優先的に上位にランキング化し、一般興味度に基づいて選定されたキーワードと重複するキーワードは除外する。このようにキーワードの数自体を極力減らすことでパフォーマンスの向上が期待できる。また、ユーザ固有のキーワードは、そのユーザごとに優先的にランキング化する方法がある。例えば、一般興味度に基づいて選定されなかった「ソフトバンク」、「イチロー」は、「ソフトバンク」はAさん固有のキーワードであり、「イチロー」はBさん固有のキーワードであるため、「Aさん」に対しては「ソフトバンク」を優先的に上位にランク付けし、「Bさん」に対しては「イチロー」を優先的に上位にランク付ける。このように各ユーザの固有のキーワードを、ユーザごとに優先的にランク付けすることで各ユーザ固有の嗜好性の高いキーワードを漏らさず選定することができる。また、社会一般の興味度が高いキーワードにおいて、取得したコンテンツに対するユーザの反響、つまりアクセス回数などに予めしきい値を設けておき、所定の回数以上のアクセスがあったコンテンツに関連するキーワードを優先的に上位にランキング化するなどの方法もある。
複数のユーザから数種の第2のキーワードを受信した際に、受信した全ての第2のキーワードに関連するコンテンツを取得するのではなく、所定のランキング手法に基づいてキーワードのランキング化を行うことでキーワードの優劣を規定することができ、興味度が高くないキーワードを予め省けるため全体としてのパフォーマンス向上が期待できる。
サーバ1のキーワードランキング手段104は、CPU10がメモリ11に記憶されている所定のキーワードランキングプログラムに基づいてHDD12に記憶されているデータベース等を読み出して実行し、演算処理等されたデータをメモリ11に一時的に記憶、もしくはHDD12などに記憶することで実現が可能である。
図11として、キーワードランキング化に基づいて選定されたキーワードに関連するコンテンツの表示例を示す。図11は「Aさん」保有の情報処理装置2にコンテンツを表示する表示例である。キーワードランキング化の手法は、前述したユーザ興味度に基づいてもよいし、集計量に基づいてもよく、ユーザ固有のキーワードの漏らさず選定できれば特に限定はしない。図11では、図8と同様に指定されたドキュメントと共に一般興味度に基づいて取得された第1のコンテンツと、ユーザ興味度に基づいて取得された第2のコンテンツが共に表示されている。
「Aさん」が保有する情報処理装置2から受信したキーワードの特徴から「イチロー」というキーワードは「選定外」であったが、他のユーザが保有する情報処理装置2から受信したキーワードの特徴から「イチロー」が選定されたため、「Aさん」が保有する情報処理装置2で「イチロー」に関連するコンテンツが表示されている。また、キーワードをコンテンツと共に表示することで、指定されたドキュメントに対して社会一般が関心を寄せているフレーズと、自身、もしくは不特定多数のユーザが関心を寄せているフレーズがどのようなものであるかを認識することが可能である。
以上、本発明の実施形態について説明を行った。本発明により、装置間でコンテンツと共にコンテンツを検索するためのキーワードを併せて共有でき、ユーザ自身の嗜好性が高いコンテンツだけでなく、社会一般、また第3者の嗜好性が高いコンテンツも認識することが可能となる。本発明の情報処理システムにより、従来と比較してユーザに提供するレコメンド情報範囲の拡大が期待できる。
図12は、本発明の実施形態にかかるコンテンツ表示のフローチャートである。
まず、サーバ1が、閲覧ドキュメントに関連する第1のキーワードを選定する(ステップ1)。選定された第1のキーワードに関連する第1のコンテンツを取得する(ステップ2)。第1のキーワード、および取得した第1のコンテンツを情報処理装置2に送信する(ステップ3)。次に、情報処理装置2が閲覧ドキュメントに関連する第2のキーワードを選定する(ステップ4)。尚、情報処理装置2が閲覧ドキュメントに関連する第2のキーワードを選定するタイミングは、サーバ1が第1のキーワード選定するタイミングでもよく、また、第1のコンテンツを受信したタイミングでもよく、特に制限は設けない。
情報処理装置2が、選定された第2のキーワードをサーバ1に送信する(ステップ5)。次に、サーバ1が情報処理装置2より受信した第2のキーワードに関連する第2のコンテンツを取得する(ステップ6)。第2のキーワード、および第2のコンテンツを情報処理装置2に送信する(ステップ7)。次に、情報処理装置2がサーバ1より受信した第1コンテンツ、および第2コンテンツを閲覧ドキュメントと共に表示する(ステップ8)。
図13は、本発明の実施形態にかかるキーワードランキング化のフローチャートである。
複数の情報処理装置2が、閲覧ドキュメントに関連する第2のキーワードを選定する(ステップ9、ステップ11)。選定した第2のキーワードをサーバ1に送信する(ステップ10、ステップ12)。サーバ1が複数の情報処理装置2より受信した第2のキーワードを所定の基準に従ってランキング化する(ステップ13)。ランキング上位となったキーワードに関連する第2のコンテンツを追加で取得する(ステップ14)。
本願発明を実現できるような構成であれば、用いる装置の具備する内容、および装置の数量などは本実施例に限定されない。
100 第1のデータベース
101 第1のキーワード選定手段
102 第1のコンテンツ取得手段
103 キーワードコンテンツ送信手段
104 キーワードランキング手段
200 第2のデータベース
201 第2のキーワード選定手段
202 コンテンツ受信手段
203 表示手段

Claims (8)

  1. ネットワークで接続された情報処理装置とサーバとを有する情報処理システムであって、
    サーバが、
    ドキュメントに含まれる単語であるタームに社会一般の興味度を対応付けて記憶する第1のデータベースと、
    ユーザが閲覧する閲覧ドキュメントに関連する第1のキーワードを、前記社会一般の興味度に基づいて選定する第1のキーワード選定手段と、
    前記選定された第1のキーワードに関連する第1のコンテンツを取得する第1のコンテンツ取得手段と、
    前記選定された第1のキーワード、および前記取得した第1のコンテンツを前記情報処理装置に送信するキーワードコンテンツ送信手段と、
    を備え、
    情報処理装置が、
    ドキュメントに含まれる単語であるタームにユーザの興味度を対応付けて記憶する第2のデータベースと、
    前記閲覧ドキュメントに関連する第2のキーワードを、前記ユーザの興味度に基づいて選定する第2のキーワード選定手段と、
    前記第2のキーワードを送信し、前記第2のキーワードに関連する第2のコンテンツを受信するコンテンツ受信手段と、
    前記受信した第1のコンテンツ、および第2のコンテンツを前記閲覧ドキュメントと共に表示する表示手段と、
    を備える、
    ことを特徴とする情報処理システム。
  2. 前記第2のキーワード選定手段は、前記ユーザの興味度に基づいて、前記受信した第1のキーワードと重複しないキーワードを前記第2のキーワードとして選定する、
    ことを特徴とする請求項1に記載の情報処理システム。
  3. 前記表示手段は、前記第2のキーワード、および前記受信した第1のキーワードを、前記第1のコンテンツ、および前記第2のコンテンツと共に前記閲覧ドキュメントに表示する、
    ことを特徴とする請求項1、もしくは2に記載の情報処理システム。
  4. 前記コンテンツ受信手段は、前記第2のキーワードを前記サーバに送信し、前記第2のキーワードに関連する第2のコンテンツを、前記サーバより受信する、
    ことを特徴とする請求項1から3のいずれか1項に記載の情報処理システム。
  5. サーバが、
    前記情報処理装置より受信した前記第2のキーワードの特徴に基づいてランク付けを行うキーワードランキング手段と、
    を更に備える、
    ことを特徴とする請求項4に記載の情報処理システム。
  6. 前記キーワードランキング手段は、前記第2のキーワードの集計量を算出し、前記集計量が多い順番にランク付けを行う、
    ことを特徴とする請求項5に記載の情報処理システム。
  7. ユーザが閲覧する閲覧ドキュメントに関連する第1のキーワードと、第1のコンテンツと、を受信するキーワードコンテンツ受信手段と、
    ドキュメントに含まれる単語であるタームにユーザの興味度を対応付けて記憶するデータベースと、
    前記閲覧ドキュメントに関連する第2のキーワードを、前記ユーザの興味度に基づいて選定するキーワード選定手段と、
    前記第2のキーワードを送信し、前記第2のキーワードに関連する第2のコンテンツを受信するコンテンツ受信手段と、
    前記受信した第1のコンテンツ、および第2のコンテンツを前記閲覧ドキュメントと共に表示する表示手段と、
    を備える、
    ことを特徴とする情報処理装置。
  8. ユーザが閲覧する閲覧ドキュメントに関連する第1のキーワードと、第1のコンテンツと、を受信する工程と、
    ドキュメントに含まれる単語であるタームにユーザの興味度を対応付けて記憶するデータベースを生成する工程と、
    前記閲覧ドキュメントに関連する第2のキーワードを、前記ユーザの興味度に基づいて選定する工程と、
    前記第2のキーワードを送信し、前記第2のキーワードに関連する第2のコンテンツを受信する工程と、
    前記受信した第1のコンテンツ、および第2のコンテンツを前記閲覧ドキュメントと共に表示する工程と、
    をコンピュータに実行させる、
    プログラム。
JP2016127069A 2016-06-27 2016-06-27 情報処理システム、情報処理装置、プログラム Active JP6421146B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016127069A JP6421146B2 (ja) 2016-06-27 2016-06-27 情報処理システム、情報処理装置、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016127069A JP6421146B2 (ja) 2016-06-27 2016-06-27 情報処理システム、情報処理装置、プログラム

Publications (2)

Publication Number Publication Date
JP2018005305A true JP2018005305A (ja) 2018-01-11
JP6421146B2 JP6421146B2 (ja) 2018-11-07

Family

ID=60949302

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016127069A Active JP6421146B2 (ja) 2016-06-27 2016-06-27 情報処理システム、情報処理装置、プログラム

Country Status (1)

Country Link
JP (1) JP6421146B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117076783A (zh) * 2023-10-16 2023-11-17 广东省科技基础条件平台中心 基于数据分析的科技信息推荐方法、装置、介质及设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006259897A (ja) * 2005-03-15 2006-09-28 Sharp Corp 嗜好度算出装置、コンテンツ推薦装置、コンテンツ記録出力装置、嗜好度算出サーバ、嗜好度算出方法、嗜好度算出プログラム及びこれを記録したコンピュータ読み取り可能な記録媒体
JP2009080574A (ja) * 2007-09-25 2009-04-16 Fujitsu Ltd 情報推奨装置
JP2010002944A (ja) * 2008-06-18 2010-01-07 Hitachi Ltd コンテンツ推薦装置とその方法
JP2011076565A (ja) * 2009-10-02 2011-04-14 Fujitsu Toshiba Mobile Communications Ltd 情報処理装置
JP2015212856A (ja) * 2014-05-01 2015-11-26 Necパーソナルコンピュータ株式会社 情報処理装置およびプログラム
EP2958030A1 (en) * 2004-10-28 2015-12-23 Yahoo! Inc. Search system and methods with integration of user judgments including trust networks

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2958030A1 (en) * 2004-10-28 2015-12-23 Yahoo! Inc. Search system and methods with integration of user judgments including trust networks
JP2006259897A (ja) * 2005-03-15 2006-09-28 Sharp Corp 嗜好度算出装置、コンテンツ推薦装置、コンテンツ記録出力装置、嗜好度算出サーバ、嗜好度算出方法、嗜好度算出プログラム及びこれを記録したコンピュータ読み取り可能な記録媒体
JP2009080574A (ja) * 2007-09-25 2009-04-16 Fujitsu Ltd 情報推奨装置
JP2010002944A (ja) * 2008-06-18 2010-01-07 Hitachi Ltd コンテンツ推薦装置とその方法
JP2011076565A (ja) * 2009-10-02 2011-04-14 Fujitsu Toshiba Mobile Communications Ltd 情報処理装置
JP2015212856A (ja) * 2014-05-01 2015-11-26 Necパーソナルコンピュータ株式会社 情報処理装置およびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117076783A (zh) * 2023-10-16 2023-11-17 广东省科技基础条件平台中心 基于数据分析的科技信息推荐方法、装置、介质及设备
CN117076783B (zh) * 2023-10-16 2023-12-26 广东省科技基础条件平台中心 基于数据分析的科技信息推荐方法、装置、介质及设备

Also Published As

Publication number Publication date
JP6421146B2 (ja) 2018-11-07

Similar Documents

Publication Publication Date Title
US20220237145A1 (en) Method of and system for enhanced local-device content discovery
US11036744B2 (en) Personalization of news articles based on news sources
Feng et al. News recommendation systems-accomplishments, challenges & future directions
TWI636416B (zh) 內容個人化之多相排序方法和系統
US10311478B2 (en) Recommending content based on user profiles clustered by subscription data
CN104969224B (zh) 未认可及新用户的改善用户体验
JP5608286B2 (ja) 無限ブラウズ
TWI533246B (zh) 使用者未知興趣之探索方法與系統
AU2019208239A1 (en) Blending search results on online social networks
US10437859B2 (en) Entity page generation and entity related searching
Zhou et al. Real-time recommendation for microblogs
US9946799B2 (en) Federated search page construction based on machine learning
Chelaru et al. Can social features help learning to rank YouTube videos?
US9864768B2 (en) Surfacing actions from social data
WO2009108576A2 (en) Prioritizing media assets for publication
US11036817B2 (en) Filtering and scoring of web content
US20210004420A1 (en) Post-ranker for search results
Hauger et al. Exploring geospatial music listening patterns in microblog data
WO2018042179A1 (en) Method and system for providing content
JP6421146B2 (ja) 情報処理システム、情報処理装置、プログラム
Yamaba et al. On a serendipity-oriented recommender system based on folksonomy
KR20220004278A (ko) 검색 서비스 제공 방법 및 시스템
Tyler et al. Large Scale Log Analysis of Individuals’ Domain Preferences in Web Search
US20180024998A1 (en) Information processing apparatus, information processing method, and program
Akhilan et al. Personalizing News Documents Using Modified Page Rank Algorithms

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180508

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180614

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181009

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181015

R150 Certificate of patent or registration of utility model

Ref document number: 6421146

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250