JP6696270B2 - 情報提供サーバ装置、プログラム及び情報提供方法 - Google Patents

情報提供サーバ装置、プログラム及び情報提供方法 Download PDF

Info

Publication number
JP6696270B2
JP6696270B2 JP2016073505A JP2016073505A JP6696270B2 JP 6696270 B2 JP6696270 B2 JP 6696270B2 JP 2016073505 A JP2016073505 A JP 2016073505A JP 2016073505 A JP2016073505 A JP 2016073505A JP 6696270 B2 JP6696270 B2 JP 6696270B2
Authority
JP
Japan
Prior art keywords
user
category
similarity
item
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2016073505A
Other languages
English (en)
Other versions
JP2017182746A (ja
Inventor
明生 大門
明生 大門
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2016073505A priority Critical patent/JP6696270B2/ja
Publication of JP2017182746A publication Critical patent/JP2017182746A/ja
Application granted granted Critical
Publication of JP6696270B2 publication Critical patent/JP6696270B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、ユーザにとって意外性を有しつつも、定番なアイテムに関する情報をユーザに提供する情報提供サーバ装置等に関する。
近年、情報通信技術の発展に伴って、書籍その他の商品などの様々なアイテムについて、ユーザに推薦情報を提供するための推薦システムが普及している。現在普及している推薦システムでは、協調フィルタリング方式のシステムと内容ベースフィルタリング方式のシステムが数多く開発されており、こうした推薦システムがこれまでに開示されている(例えば、特許文献1から特許文献3)。
これらのシステムでは、ユーザに対して提供される情報が、当該ユーザにとって、予想もしていなかった思いがけない性質のもの、場合によっては驚きを有する性質のものであることがある。こうした性質は、一般に、「意外性」と呼ばれているので、本明細書においても、以下では、こうした性質を「意外性」として説明する。
特許文献1により開示されているシステムは、ユーザが選択した文章と比較して、カテゴリの類似性が低く、かつ、文章の類似度が高い文献を推薦するシステムである。具体的に、特許文献1に開示されている文書検索用のシステムは、まず、ユーザ端末から検索対象文書の選択を受付けると、検索対象文書の特徴を表現する文書ベクトルを生成する。次いで、カテゴリ情報データベースに登録される各カテゴリに属する文書群と検索対象文書との類似度を算出し、文書情報DB6に登録される各文書と検索対象文書との類似度を算出する。そして、文書検索システムは、これらに基づいてユーザが選択した文書と類似性が低いカテゴリに属するが、文書間で内容が類似する文書を検索して、検索された文書を推薦先文書としてユーザの端末に提示している。
特許文献2に開示されているシステムは、ユーザのプロフィールと書籍との類似度計算において、同一のカテゴリの中と異なるカテゴリ間との双方の組み合わせを利用して情報を推薦している。具体的に、特許文献2に開示されているシステムは、まず、顧客が過去に購入した各書籍のキーワード・ベクトルをカテゴリ別に合成し、顧客プロファイルを生成する。また、書籍データベースを基にして、各書籍毎にキーワード・ベクトルを生成する。そして、同じカテゴリ内、並びに異なるカテゴリ間の双方の組み合わせで、顧客プロファイルのキーワード・ベクトルと未購入の各書籍のキーワード・ベクトルの類似度を計算することによって、有益性と意外性の双方の観点から書籍を検索している。
特許文献3に開示されているシステムでは、複数のコミュニティに属するユーザが既に獲得している知識を推定し、思いがけない分野の情報を推薦するものである。すなわち、特許文献3に開示されているシステムにおいて、類似度算出手段は、所定のユーザと一つ以上のコミュニティにおいて共通して属する他のユーザが、所定のユーザにとって親和性のある情報を扱っている度合いを表す第1の指標値を、共通して属するコミュニティの特徴と、所定のユーザが属する全てのコミュニティの特徴から算出する。また、意外度算出手段は、所定のユーザと一つ以上のコミュニティにおいて共通して属する他のユーザが、所定のユーザにとって思いがけない分野の情報をもたらす度合いを表す第2の指標値を、共通して属するコミュニティの特徴と、所定のユーザと他のユーザが共通して属するコミュニティに属するユーザの中で、所定のユーザが属さず他のユーザが属するコミュニティにも属するユーザの特徴から算出する。そして、推薦手段はそれらの指標値を各ユーザについて算出した結果に基づいて、所定のユーザに情報を推薦する他のユーザを選出している。
特開2015−197722号公報 特開2001−265808号公報 特開2010−113683号公報
しかしながら、上記特許文献1から特許文献3に開示されたシステムのように協調フィルタリング方式と内容ベースフィルタリング方式を用いたシステムを用いて推薦情報を作成した場合、異なる分野や異なるカテゴリの情報に触れたユーザは、意外性を有することを感じることはできるが、普段、読んでいる書籍など、自己が普段使用している情報とは特段の脈絡がなく、しかも突飛な印象を受けてしまう恐れがある。
本発明は、上記課題を解決するためになされたものであり、その目的は、ユーザが意外性を感じつつも、受け入れやすい定番情報を提供することができる情報提供サーバ等を提供することにある。
(1)上述した課題を解決するため、本発明の情報提供サーバ装置は、ネットワークを介してユーザにより所持された通信端末装置に接続され、ユーザに所定コンテンツの1種をなすアイテムに関する情報を推薦情報として前記通信端末装置に提供するための情報提供サーバ装置であって、各ユーザによって購入又は閲覧された前記アイテムの購入数又は閲覧回数を、当該アイテムが属するカテゴリ毎にカウントするカウント手段と、前記購入数又は閲覧回数に基づいて、ユーザ間における前記コンテンツに対する購入又は閲覧の趣向に関する類似度を算出する類似度算出手段と、前記算出された各ユーザ間の類似度に基づいて、前記推薦情報を要求する要求ユーザに対する他のユーザを、閾値に基づいて、高程度類似度クラス、中程度類似度クラス及び低程度類似度クラスの3区分の類似度クラスに属するユーザ群に区分けするユーザ群区分け手段と、前記高程度類似度クラスのユーザ群を構成する各ユーザが購入又は閲覧した前記アイテムと、前記要求ユーザが既に購入又は閲覧した前記アイテムとをカテゴリ毎に比較して、カテゴリ毎の購入数又は閲覧回数の間に、カテゴリ毎の購入数又は閲覧回数の相関関係を数値化した値が所定の条件を具備する関係が成立するカテゴリを意外性カテゴリとして抽出する意外性カテゴリ抽出手段と、前記意外性カテゴリ抽出手段により抽出されたカテゴリに含まれるアイテムの中から、前記中程度類似度クラス及び前記低程度類似度クラスに属するユーザ群のユーザにより購入又は閲覧されたアイテムの購入数又は閲覧回数に基づいて、前記各アイテムの認知の程度としての指標を数値化した定番度を求める定番度算出手段と、前記定番度算出手段により算出された定番度に基づいて、前記意外性カテゴリ抽出手段により抽出されたカテゴリに含まれるアイテムの中から所定の定番度を有するアイテムを抽出するアイテム抽出手段と、前記アイテム抽出手段により抽出されたアイテムに関する情報を前記推薦情報として前記要求ユーザに提供する情報提供出段とを備える構成を有している。
この構成により、趣向性が相互に類似するユーザ同士の間において、同一のカテゴリであるにも関わらず購入又は閲覧をほとんどしておらず、興味をそれほど示さないユーザと、購入又は閲覧を多くしており、興味を大いに示すユーザがいることが分かる。そして興味をそれほど示していないユーザに対し、興味を大いに示すユーザがいるカテゴリに含まれるアイテムに関する情報を提供することにより、そのユーザに意外性を持たせることができる。
その一方で、中程度の類似度のユーザ及び低い程度のユーザにおいても購入した履歴があるアイテムは、世間では一般に定番度が高いアイテムと見なすことができる。定番度が高いアイテムに関する情報を要求ユーザに提供することにより、そのユーザに突飛ではなく、比較的受け入れやすいアイテムの情報を提供することができる。
したがって、上記のように、類似度が高いユーザが購入又は閲覧したことがあるアイテムに基づき意外性あるカテゴリを抽出し、かつ、類似度が中程度及び低いユーザが購入又は閲覧したアイテムに基づき定番度を算出することによって、要求ユーザに、意外性を与えつつも受け入れやすいアイテムについての情報を提供することができる。
(2)また、本発明の情報提供サーバ装置は、ユーザ群区分け手段は、前記高程度類似度クラス、中程度類似度クラス及び低程度類似度クラスに属するユーザ群のユーザを、類似度に関する所定の規則に基づいてソートして前記閾値により分類するソート手段を各クラスに設ける構成を有している。
この構成により、類似度の程度が相互に異なる各ユーザ群から所定の人数のユーザを抽出する場合に、各ユーザ群における類似度の特性を有するユーザを抽出しやすくなる。例えば、高程度類似度クラスのユーザ群の類似度を降順にソートし、類似度が上位の数名を抽出したとき、抽出されたユーザは、類似度が高いという特性を顕著に有している。
(3)また、本発明の情報提供サーバ装置は、カテゴリ毎における前記所定の関係が、前記高程度類似度クラスに属するユーザ群を構成する各ユーザがアイテムを購入した購入数又は閲覧した閲覧回数から前記要求ユーザがアイテムを既に購入した購入数又は閲覧した閲覧回数を差し引いて求めた差が所定の値以上であるという構成を有している。
この構成により、同一のカテゴリに含まれるアイテムについて、購入又は閲覧した数の差が大きければ大きいほど、ユーザ同士の間で、そのカテゴリについての趣向性が異なることになる。このように、購入又は閲覧した数の差を利用することにより、ユーザの所定のカテゴリに対する趣向性の差を客観的に求めることができる。
(4)また、本発明の情報提供サーバ装置は、前記意外性カテゴリ抽出手段により抽出されたカテゴリに含まれるアイテムの中から、前記中程度類似度クラス及び前記低程度類似度クラスに属するユーザ群のユーザにより一度も購入又は閲覧されたことがないアイテムを排除するフィルタリング手段をさらに備える構成を有している。
この構成により、要求ユーザに対し、突飛なアイテムに関する情報を提供することが回避できる。すなわち、中程度類似度クラス及び低程度類似度クラスに属するユーザ群のユーザにより一度も購入又は閲覧されたことがないアイテムは、世間的に認知度が低い特殊な(専門的な)アイテムであると考えられる。当該構成は、世間的に認知度が低い特殊な(専門的な)アイテムを排除することができる。
(5)また、本発明の情報提供サーバ装置において、前記定番度算出手段は、前記アイテムが購入された数又は閲覧された閲覧数を当該アイテム毎に算出して前記定番度を算出する構成を有している。
この構成により、定番度の高いアイテムと定番度の低いアイテムとを区別したり、アイテムに対し定番度の順位付けを行ったりすることができる。その結果、要求ユーザに対し、定番度が高いアイテムの情報を提供することができる。
(6)また、本発明の情報提供サーバ装置において、前記アイテム抽出手段は、前記要求ユーザが未購入又は未だに閲覧をしていないアイテムであって、前記高程度類似度クラスのユーザ群に属するユーザが既に購入又は既に閲覧しているアイテムを抽出する構成を有している。
この構成により、要求ユーザがそれまでは、ほとんど興味を示さなかったカテゴリのアイテムについての情報を提供することができ、要求ユーザに意外性を感じさせることができる。
(7)上述した課題を解決するため、本発明に係るプログラムは、ネットワークを介してユーザにより所持された通信端末装置に接続され、ユーザに所定コンテンツの1種をなすアイテムに関する情報を推薦情報として前記通信端末装置に提供するための情報提供サーバ装置を構成するコンピュータにおいて用いられるプログラムであって、前記コンピュータを、各ユーザによって購入又は閲覧された前記アイテムの購入数又は閲覧回数を、当該アイテムが属するカテゴリ毎にカウントするカウント手段、前記購入数又は閲覧回数に基づいて、ユーザ間における前記コンテンツに対する購入又は閲覧の趣向に関する類似度を算出する類似度算出手段、前記算出された各ユーザ間の類似度に基づいて、前記推薦情報を要求する要求ユーザに対する他のユーザを、閾値に基づいて、高程度類似度クラス、中程度類似度クラス及び低程度類似度クラスの3区分の類似度クラスに属するユーザ群に区分けするユーザ群区分け手段、前記高程度類似度クラスのユーザ群を構成する各ユーザが購入又は閲覧した前記アイテムと、前記要求ユーザが既に購入又は閲覧した前記アイテムとをカテゴリ毎に比較して、カテゴリ毎の購入数又は閲覧回数の間に、カテゴリ毎の購入数又は閲覧回数の相関関係を数値化した値が所定の条件を具備する関係が成立するカテゴリを意外性カテゴリとして抽出する意外性カテゴリ抽出手段、前記意外性カテゴリ抽出手段により抽出されたカテゴリに含まれるアイテムの中から、前記中程度類似度クラス及び前記低程度類似度クラスに属するユーザ群のユーザにより購入又は閲覧されたアイテムの購入数又は閲覧回数に基づいて、前記各アイテムの認知の程度としての指標を数値化した定番度を求める定番度算出手段、前記定番度算出手段により算出された定番度に基づいて、前記意外性カテゴリ抽出手段により抽出されたカテゴリに含まれるアイテムの中から所定の定番度を有するアイテムを抽出するアイテム抽出手段、及び前記アイテム抽出手段により抽出されたアイテムに関する情報を前記推薦情報として前記要求ユーザに提供する情報提供出段、として機能させる構成を有している。
この構成により類似度が高いユーザが購入又は閲覧したことがあるアイテムに基づき意外性あるカテゴリを抽出し、かつ、類似度が中程度及び低いユーザが購入又は閲覧したアイテムに基づき定番度を算出することによって、要求ユーザに、意外性を与えつつも受け入れやすいアイテムについての情報を提供することができる。
(8)上述した課題を解決するため、本発明に係る情報提供方法は、ネットワークを介してユーザにより所持された通信端末装置に接続され、ユーザに所定コンテンツの1種をなすのアイテムに関する情報として前記通信端末装置に提供するための情報提供方法であって、各ユーザによって購入又は閲覧された前記アイテムの購入数又は閲覧回数を、当該アイテムが属するカテゴリ毎にカウントするカウント工程と、前記購入数又は閲覧回数に基づいて、ユーザ間における前記コンテンツに対する購入又は閲覧の趣向に関する類似度を算出する類似度算出工程と、前記算出された各ユーザ間の類似度に基づいて、前記推薦情報を要求する要求ユーザに対する他のユーザを、閾値に基づいて、高程度類似度クラス、中程度類似度クラス及び低程度類似度クラスの3区分の類似度クラスに属するユーザ群に区分けするユーザ群区分け工程と、前記高程度類似度クラスのユーザ群を構成する各ユーザが購入又は閲覧した前記アイテムと、前記要求ユーザが既に購入又は閲覧した前記アイテムとをカテゴリ毎に比較して、カテゴリ毎の購入数又は閲覧回数の間に、カテゴリ毎の購入数又は閲覧回数の相関関係を数値化した値が所定の条件を具備する関係が成立するカテゴリを意外性カテゴリとして抽出する意外性カテゴリ抽出工程と、前記意外性カテゴリ抽出手段により抽出されたカテゴリに含まれるアイテムの中から、前記中程度類似度クラス及び前記低程度類似度クラスに属するユーザ群のユーザにより購入又は閲覧されたアイテムの購入数又は閲覧回数に基づいて、前記各アイテムの認知の程度としての指標を数値化した定番度を求める定番度算出工程と、前記定番度算出手段により算出された定番度に基づいて、前記意外性カテゴリ抽出手段により抽出されたカテゴリに含まれるアイテムの中から所定の定番度を有するアイテムを抽出するアイテム抽出工程と、前記アイテム抽出手段により抽出されたアイテムに関する情報を前記推薦情報として前記要求ユーザに提供する情報提供工程と、を備える工程を有している。
この構成により、類似度が高いユーザが購入又は閲覧したことがあるアイテムに基づき意外性あるカテゴリを抽出し、かつ、類似度が中程度及び低いユーザが購入又は閲覧したアイテムに基づき定番度を算出することによって、要求ユーザに、意外性を与えつつも受け入れやすいアイテムについての情報を提供することができる。
本発明に係る情報提供サーバ装置等は、ユーザが意外性を感じつつも、受け入れやすい定番情報を提供することができる。
本発明の一実施形態における情報提供システムの構成を示すシステム構成図である。 一実施形態における情報提供サーバ装置の構成を示すブロック図である。 一実施形態における情報提供サーバ装置内のユーザ情報データベースに登録されたデータの一例を示す図である。 一実施形態における情報提供サーバ装置内のコンテンツ情報データベースに登録されたデータの一例を示す図である。 一実施形態における情報提供サーバ装置内のカテゴリ情報データベースに登録されたデータの一例を示す図である。 一実施形態における情報提供システムにおいて、要求ユーザに推薦情報を提供するシステムの全体の流れの概要を示す概要図である。 一実施形態における情報提供サーバ装置において、趣向が類似するユーザを抽出する原理を説明するための説明図である。 一実施形態における情報提供サーバ装置において、所定のカテゴリに含まれ、ユーザに意外性を与えるアイテムの抽出機能を説明するための説明図である。 一実施形態における情報提供サーバ装置において、定番度の算出過程を説明するための説明図である。 一実施形態における情報提供サーバ装置により実行される処理を示すフローチャートである。
以下、図面を参照しつつ、本発明の実施形態について説明する。なお、以下の実施形態は、各ユーザが所有する通信端末装置10と、通信端末装置10に直接又は基地局BSを介してネットワーク20に接続され、各通信端末装置10を管理すると共に、推薦情報を通信端末装置10に対して提供する情報提供サーバ装置30とから構成されるシステムに基づき、本発明に係る情報提供サーバ装置、プログラム、及び情報提供システム1に適用した場合の実施形態である。
[1]情報提供システムの概要
まず、図1を用いて本実施形態における情報提供システム1について説明する。図1は、本実施形態の情報提供システム1の構成を示すシステム構成図である。なお、図が煩雑になることを防止するために、図1においては、ユーザの一部のみを示している。すなわち、実際の情報提供システム1においては、図1に表示するよりも多数の通信端末装置10が存在している。
本実施形態の情報提供システム1は、ネットワーク20を介してユーザにより所持された通信端末装置10に接続され、各ユーザに適したアイテムに関する情報を推薦情報としてユーザに提供するための情報提供サーバ装置30を有しており、ユーザに適した推薦情報を提供するシステムである。とりわけ、本実施形態の情報提供システム1は、推薦情報を要求するユーザ(以下、「要求ユーザ」という。)にとって、意外性を有するだけでなく、抵抗感なく受け入れることができる定番的なアイテムに関する情報を提供する点に特徴がある。
なお、本実施形態において、取り扱うコンテンツは、電子書籍を例に説明するが、本実施形態の情報提供システム1で取り扱うことができるコンテンツは、電子書籍には限定されない。取り扱うことができるコンテンツとしては、電子書籍の他に、例えば、音楽、お勧めグルメといった、趣味を反映させることができるコンテンツを挙げることができる。
本実施形態の情報提供システム1は、具体的には、ユーザによって所持されている通信端末装置10、ネットワーク20、及び各ユーザの通信端末装置10に直接又は基地局BSを介してネットワーク20に接続され、各通信端末装置10を管理する情報提供サーバ装置30を備えている。
また、本実施形態における情報提供システム1は、協調フィルタリング方式を採用している。すなわち、多くのユーザのコンテンツに対する嗜好情報を集積し、一のユーザが、あるコンテンツを構成する書籍等のアイテムを購入したり閲覧したりしたデータと、他のユーザが購入したり閲覧したりしたデータの両方を利用し、ユーザが購入したり閲覧したりしたパターンに基づいて、ユーザ間の類似性を相関分析し、一のユーザにパーソナライズされた情報を推薦するシステムである。
本実施形態の情報提供システム1では、このように、協調フィルタリング方式をベースに構成しており、内容ベースフィルタリング方式は採用していないため、システムに多様性及び汎用性を持たせることができる。
本実施形態に用いられる通信端末装置10は、例えば、パーソナルコンピュータ(PC)、スマートフォン、タブレット型情報端末装置、携帯用電話機、ゲーム機、PDA等が用いられる。
通信端末装置10は、XML(eXtensible Markup Language)等のマークアップ言語によって記述されているWWWシステム用のリソースデータと、当該リソースデータのネットワークアドレスを示す固有のURL(Uniform Resource Locator)とを用い、情報提供サーバ装置30とのデータ通信を行うブラウジング機能を有している。通信端末装置10は、具体的に、ブラウジング機能を用いて、情報提供サーバ装置30から受信したリソースデータによって構成される各種のコンテンツ(作業コンテンツを含む)を、ユーザが閲覧可能に表示するとともに、基地局BS及びネットワーク20を介して情報提供サーバ装置30と通信接続することによって、情報提供サーバ装置30からSNSの各種のサービス提供を受けることができるようになっている。
情報提供サーバ装置30は、SNSの各サービスを提供するために用いられる情報提供サーバ装置である。そして、情報提供サーバ装置30は、データベース(以下、「DB」という。)を有し、各ユーザが所持する通信端末装置10を介して入力されたユーザ指示に基づいて、通信端末装置10と連携しつつ、DBに種々の情報を登録する処理を実行する。
情報提供サーバ装置30は、上記の構成に基づいて次の機能を実行する構成を有している。すなわち、情報提供サーバ装置30は、
(1)各ユーザによって購入又は閲覧されたアイテムの購入数又は閲覧回数を、当該アイテムが属するカテゴリ毎にカウントする機能、
(2)購入数又は閲覧回数に基づいて、ユーザ間におけるコンテンツに対する購入又は閲覧の趣向に関する類似度を算出する機能、
(3)算出された各ユーザ間の類似度に基づいて、推薦情報の要求ユーザに対する他のユーザを、閾値に基づいて、高程度類似度クラス、中程度類似度クラス及び低程度類似度クラスの3区分の類似度クラスに属するユーザ群に区分けする機能、
(4)高程度類似度クラスのユーザ群を構成する各ユーザが購入又は閲覧したアイテムと、要求ユーザが既に購入又は閲覧したアイテムとをカテゴリ毎に比較して、カテゴリ毎の購入数又は閲覧回数の間に、カテゴリ毎の購入数又は閲覧回数の相関関係を数値化した値が所定の条件を具備する関係が成立するカテゴリを意外性カテゴリとして抽出する機能、
(5)抽出されたカテゴリに含まれるアイテムの中から、中程度類似度クラス及び低程度類似度クラスに属するユーザ群のユーザにより購入又は閲覧されたアイテムの購入数又は閲覧回数に基づいて、各アイテムの認知の程度としての指標を数値化した定番度を求める手段、
(6)定番度算出手段により算出された定番度に基づいて、意外性カテゴリを抽出するための手段により抽出されたカテゴリに含まれるアイテムの中から所定の定番度を有するアイテムを抽出する機能、及び、
(7)アイテムを抽出するための手段により抽出されたアイテムに関する情報を推薦情報として要求ユーザに提供する機能
を実現するための構成を備えている。
上記の機能を実現するための構成により、本実施形態の情報提供システム1では、ユーザが意外性を感じつつも、受け入れやすい定番情報を提供することができるという本実施形態のシステムに特有の効果を奏する。
[2]情報提供サーバ装置
次に、図2を参照して、本実施形態の情報提供サーバ装置30の構成について説明する。なお、図2は、本実施形態の情報提供サーバ装置30の構成を示すブロック図である。
本実施形態の情報提供サーバ装置30は、図2に示すように、装置全体を制御するサーバ管理制御部310と、各通信端末装置10と通信を行う通信制御部320、各種のメモリとして機能するROM/RAM330、各種の情報を格納する記録部340、及び各種の処理を実行するデータ処理部350と、を有し、上記の各部は、バスBによって相互に接続されている。
サーバ管理制御部310は、主に中央演算処理装置(CPU)によって構成され、プログラムを実行することによって、情報提供サーバ装置30の各部を統合制御する。
通信制御部320は、所定のネットワークインターフェースであり、ネットワーク20を介して、各通信端末装置10とデータの授受を行う。また、通信制御部320は、後述する情報提供部358と協働し、推薦情報を通信端末装置10に送信する。
ROM/RAM330には、情報提供サーバ装置30の駆動に必要な各種のプログラムが記録されている。また、ROM/RAM330は、サーバ管理制御部310やデータ処理部350が各種の処理を実行する際のワークエリアとして用いられる。
[2.1]記録部
記録部340は、例えば、HDD(ハードディスクドライブ)又はSSD(ソリッドステートドライブ)により構成されている。
記録部340は、その記録領域内に、以下のDB341〜343を少なくとも有している。すなわち、記録部340は、情報提供システム1を利用するユーザに関する基本情報をユーザIDに対応付けて登録されたユーザ情報DB341、ユーザにより購入又は閲覧されるコンテンツに関する情報が登録されたコンテンツ情報DB342、及びコンテンツを構成しているアイテムとしての書籍が属するカテゴリの情報が登録されたカテゴリ情報DB343、を有している。
[2.2]データ処理部
データ処理部350は、独立した中央演算処理装置(CPU)によって構成され、又は、サーバ管理制御部310の中央演算処理装置(CPU)を用いて構成される。そして、データ処理部350は、サーバ管理制御部310による制御の下、プログラムを実行することにより、各通信端末装置10にて実行される処理の管理を行う。
具体的には、データ処理部350は、プログラムを実行することによって、各DBを管理するDB管理部351、書籍の購入数又は閲覧回数をカテゴリ毎にカウントするカウント部352、ユーザ同士の間における、コンテンツに対する趣向の類似度を算出する類似度算出部353、ユーザ同士の類似度の程度を高、中、低のユーザ群に区分けするユーザ群区分け部354、ユーザ同士の間におけるカテゴリ毎の購入する又は閲覧回数の間に成立する関係に基づいてユーザにとって意外性のあるカテゴリを抽出する意外性カテゴリ抽出部355、コンテンツを構成する書籍の購入数又は閲覧回数に基づいて、その書籍の定番度を求める定番度算出部356、所定の定番度を有する書籍を抽出するアイテム抽出部357、及び、抽出された書籍を、要求ユーザに対して提供する情報提供部358を、実現する。
(DB管理部)
DB管理部351は、本発明の第1データベース管理手段、第2データベース管理手段等を構成している。このDB管理部351は、記録部340を構成する各DBに種々の情報を登録する処理、各DBに登録された情報を検索する処理、並びに各DBに登録された情報を読み出す処理を実行する。
DB管理部351は、ユーザ情報DB341に対し、新たにユーザの追加があったときに新たな情報を登録する処理、システムにログインしたユーザを検索する処理、及び検索した結果を読み出す処理等を実行する。
また、DB管理部351は、コンテンツ情報DB342に対し、新たに書籍の追加があったときに新たな情報を登録する処理、登録された書籍に関する情報を検索する処理、及検索した情報を読み出す処理等を実行する。
さらに、DB管理部351は、カテゴリ情報DB343に対し、カテゴリの登録、カテゴリの検索及びカテゴリの読み出しといった処理を実行する。
(カウント部)
カウント部352は、本発明のカウント手段を構成する。このカウント部352は、各ユーザによって購入又は閲覧された書籍の購入数又は閲覧回数を、当該書籍が属するカテゴリ毎にカウントする処理を実行する。アイテムが書籍の場合、ここでいうカテゴリは、例えば、SF、ミステリー、IT、ビジネスという分野を挙げることができる。
(類似度算出部)
類似度算出部353は、本発明の類似度算出手段を構成している。類似度算出部353は、購入数又は閲覧回数に基づいて、ユーザ間におけるコンテンツに対する購入又は閲覧の趣向に関する類似度を算出する。類似度の算出方法は特に限定されない。類似度は、各ユーザが購入又は閲覧した書籍のカテゴリについて趣向性についてのベクトルを作成し、このベクトルを利用してコサイン類似度を求める式で求めたり、ユークリッド距離を利用した算出式で求めたりすることにより算出する。
(ユーザ群区分け部)
ユーザ群区分け部354は、本発明のユーザ群区分け手段を構成している。このユーザ群区分け部354は、推薦情報を要求する要求ユーザに対する他のユーザを、高程度類似度クラス、中程度類似度クラス及び低程度類似度クラスの3区分の類似度クラスに属するユーザ群に区分けする。なお、各類似度のクラスは、クラス同士を区分けするために類似度に境界となる数値を設けて区分けしてもよく、算出された類似度の相対的な関係に基づいて区分けしてもよい。ただし、ユーザ群区分け部354は、算出された各ユーザ間の類似度に基づいて、推薦情報を要求する要求ユーザに対する他のユーザを、閾値に基づいて、高程度類似度クラス、中程度類似度クラス及び低程度類似度クラスの3区分の類似度クラスに属するユーザ群に区分けするように構成してもよい。
例えば、類似度としてコサイン類似度を用いる場合、0.6及び0.4を閾値として設定し、算出された類似度が0.6以上、1.0以下の範囲に属するユーザを高程度類似度クラス、類似度が0.4以上、0.6未満の範囲に属するユーザを中程度類似度クラス、類似度が0以上、0.4未満の範囲に属するユーザを低程度類似度クラスとしてユーザ群を区分けする。
また、ユーザ群区分け部354は、高程度類似度クラス、中程度類似度クラス及び低程度類似度クラスに属するユーザ群のユーザを、類似度に関する所定の規則に基づいてソートするソート部を各クラスに設けている。ソート部は、本発明のソート手段を構成している。すなわち、ソート部は、高程度類似度クラス、中程度類似度クラス及び低程度類似度クラスに属するユーザ群のユーザを、類似度に関する所定の規則に基づいてソートして上記の閾値により分類する。
例えば、ソート部は、高程度類似度クラスのユーザ群に属するユーザ、及び中程度類似度クラスのユーザ群に属するユーザを降順にソートする一方で、低程度類似度クラスのユーザ群に属するユーザを昇順にソートする。
また、ユーザ群区分け部354は、クラス分けされた各ユーザ群の中から任意数のユーザを抽出する。例えば、各クラスに区分けされたユーザ群の中から、上位の数人(例えば10人)を抽出する。ただし、抽出するユーザは、クラス毎に異なる基準により行ってもよい。例えば、高程度類似度クラスでは、降順にソートされたユーザの中から上位10人を抽出し、中程度類似度クラスでは、降順にソートされたユーザの中から中間の範囲に属する10人を抽出し、低程度類似度クラスでは、昇順にソートされたユーザの中から下位10人を抽出するというようにユーザを抽出する。
(意外性カテゴリ抽出部)
意外性カテゴリ抽出部355は、本発明の意外性カテゴリ抽出手段を構成している。この意外性カテゴリ抽出部355は、高程度類似度クラスのユーザ群に構成する各ユーザが購入又は閲覧した書籍を利用して、要求ユーザにとって意外性を有するカテゴリを抽出する。具体的に、高程度類似度クラスのユーザ群に構成する各ユーザが購入又は閲覧した書籍と、要求ユーザが既に購入又は閲覧した書籍とをカテゴリ毎に比較する。そして、カテゴリ毎の購入数又は閲覧回数の間に所定の関係が成立するカテゴリを意外性カテゴリとして抽出する。ここでいう所定の関係とは、例えば、カテゴリ毎の購入数又は閲覧回数の相関関係を数値化した値が所定の条件を具備する関係等を意味する。
例えば、上記のカテゴリ毎における所定の関係、すなわち、カテゴリ毎の購入数又は閲覧回数の相関関係を数値化した値が所定の条件を具備する関係等が、高程度類似度クラスに属するユーザ群を構成する各ユーザが書籍を購入した購入数又は閲覧した閲覧回数から要求ユーザが書籍を既に購入した購入数又は閲覧した閲覧回数を差し引いて求めた差が、5であるとか10であるといった所定の値以上であるカテゴリを意外性カテゴリとして抽出する。
また、意外性カテゴリ抽出部355は、意外性カテゴリとして抽出されたカテゴリ毎に、高程度類似度クラスのユーザ群に属する当該ユーザが購入した書籍を抽出する処理を実行する。この抽出された書籍は、後に、要求ユーザに対し推薦する書籍に関する推薦情報の元になるアイテムである。
(定番度算出部)
定番度算出部356は、本発明の定番度算出手段を構成している。この定番度算出部356は、意外性カテゴリ抽出部355により抽出されたカテゴリに含まれる書籍の中から、中程度類似度クラス及び低程度類似度クラスに属するユーザ群のユーザにより購入又は閲覧された書籍の購入数又は閲覧回数に基づいて、定番度を求めている。ここでいう定番度とは、各アイテムとしての書籍がユーザに知れ渡っている認知の程度としての指標を数値化して表した値を意味する。
例えば、あるカテゴリに属する書籍の場合、初心者に向けた入門書は、その書籍を認知しているユーザの人数が相対的に高く定番度が高いといえる。これに対し、あるカテゴリに属する書籍において、専門性が極めて高い専門書は、当該専門書の存在をしるユーザの人数は相対的に少ないため、定番度が低いということができる。すなわち、ここでいう定番度は、認知度を表す指標である。
(アイテム抽出部)
アイテム抽出部357は、本発明のアイテム抽出手段を構成している。このアイテム抽出部357は、定番度算出部356により算出された定番度に基づいて、意外性カテゴリ抽出部355により抽出されたカテゴリに含まれるアイテムとしての書籍の中から所定の定番度を有するアイテムとしての書籍を抽出する。
例えば、アイテム抽出部357は、定番度が最も高い書籍のみを抽出したり、定番度が高い書籍の中から上位5番目とか10番目までの書籍を抽出したりしている。
(情報提供部)
情報提供部358は、本発明の情報提供手段を構成している。アイテム抽出部357により抽出された書籍に関する情報を推薦情報として要求ユーザに提供する。推薦情報を要求ユーザに提供する場合、当該情報提供部358は通信制御部320と協働し、要求ユーザが所持する通信端末装置10に対して推薦情報を送信することにより行っている。
提供する推薦情報としては、例えば、後述する、図5に示したカテゴリ情報DB343に登録された書籍名、本文データ、表示の画像及びその書籍が属するカテゴリ等である。
[3]データベースに登録されたデータの具体例
次に、情報提供サーバ装置30が備える記録部340を構成している各データベースの詳細について、上述した図3から図5を参照しつつ具体的に説明する。なお、図3は、ユーザ情報DB341に登録されたデータの一例を示す図であり、図4は、コンテンツ情報DB342に登録されたデータの一例を示す図であり、図5はカテゴリ情報DB343に登録されたデータの一例を示す図である。
(ユーザ情報DB)
ユーザ情報DB341は、本実施形態の情報提供システム1を利用するユーザの基本情報に関する各データをそれぞれ格納するためのDBである。ユーザ情報DB341には、図3に示すように、
(1)各ユーザを識別するためのユーザID、
(2)各ユーザが当該情報提供システム1にログインするために必要なログイン情報としてのパスワード、及び
(3)各ユーザにより既に購入又は閲覧されたアイテムのリストとしての書籍リスト
が対応付けられて登録される。
図3に例示する場合には、ユーザ情報DB341には、例えば、「U00001」により特定されるユーザのユーザIDと、当該ユーザIDが情報提供システム1にログインするときに必要なパスワード「ABC1234」と、当該ユーザによってこれまでに購入された書籍のリスト「書籍1、書籍2、書籍3、書籍4、・・・・」とが関連づけて登録されている。なお、そのほかに、各ユーザIDにより特定されるユーザに関する基本情報、例えば、ユーザの氏名、ユーザの性別、ユーザの生年月日、ユーザの住所、ユーザの職業等を登録してもよい。
(コンテンツ情報DB)
コンテンツ情報DB342は、コンテンツを構成するアイテムとしての書籍に関する種々の情報が書籍毎にデータとして格納されたDBである。図4に示したコンテンツ情報DB342では、
(1) 各アイテムとしての書籍を識別するための書籍ID、
(2)各書籍IDにより特定される個々の書籍の書籍名、
(3)各書籍の内容を表し、テキストデータにより登録された書籍本文データ、
(4)各書籍の表紙の画像データ、及び
(5)各書籍が属するカテゴリのカテゴリID、
が相互に関連づけて登録されている。
図4に例示したコンテンツ情報DB342では、例えば、書籍ID「B0001」と、書籍名「書籍1」と、書籍本文を表す「本文データ1」と、その書籍の表紙の画像である「画像1」と、当該書籍が属するカテゴリを特定するためのカテゴリID「C0001」とが相互に関連づけて登録されている。
(カテゴリ情報DB)
カテゴリ情報DB343は、アイテムである書籍が属するカテゴリについての情報がカテゴリ別に登録されたDBである。図5に例示したカテゴリ情報DB343では、
(1)カテゴリを特定するためのカテゴリID、及び
(2)各カテゴリIDにより特定されるカテゴリ
が相互に関連づけて登録されている。
例えば、図5に例示したカテゴリ情報DB343では、カテゴリID「C0001」と、このカテゴリIDにより特定されるカテゴリ「SF」とが、関連づけて登録されている。
[4]処理の具体的な内容
次に、データ処理部350により実行される処理内容について、図6から図9を参照して具体的に説明する。なお、図6は、要求ユーザに推薦情報を提供するシステムの全体の流れの概要を示す概要図であり、図7は、趣向が類似するユーザを抽出する原理を説明するための説明図であり、図8は、所定のカテゴリに含まれ、ユーザに意外性を与える書籍の抽出機能を説明するための説明図であり、図9は、定番度の算出過程を説明するための説明図である。
本実施形態の情報提供サーバ装置30において、まず、カウント部352が、要求ユーザと他のユーザとの間で、各ユーザがこれまでに、購入した書籍の購入数をカテゴリ毎にカウントする。
図6に示した例において、推薦を受ける要求ユーザは、SFのカテゴリに属する書籍を購入した数が25、ミステリーのカテゴリに属する書籍を購入した数が1、ホラーのカテゴリに属する書籍を購入した数が、12である。同様に、ITが1、物理が0、ビジネスが2、資格が5である。これに対し、他のユーザの1人がこれまでに購入した、カテゴリ毎の書籍の数は、SFが30、ミステリーが10、ホラーが10、ITが5、物理が0、ビジネスが0、資格が6である。
次に、類似度算出部353が、要求ユーザと他のユーザとの間で類似度をそれぞれ算出する。 類似度の算出方法にあっては、まず、各ユーザがこれまでに購入した書籍のカテゴリに基づいて趣向性ベクトルを作成する。類似度は、作成された趣向性ベクトルに基づいてコサイン類似度を用いて算出される。ただし、類似度の算出方法は特に限定されず、例えばユークリッド距離を利用して類似度を算出してもよい。
ユーザ群区分け部354は、算出された類似度に基づいて、類似度の程度が高い高程度類似度のユーザ群、中程度の中程度類似度のユーザ群、及び低い程度の低程度類似度のユーザ群に区分けする。図6においては、図6に示した領域が、類似度の程度が高い高程度類似度のユーザ群を示し、図6の(2)によって説明している説明文が、中程度の中程度類似度のユーザ群、及び低い程度の低程度類似度のユーザ群に区分けする処理である。
各ユーザを各クラスのユーザ群に区分けする際、ソート部が、各ユーザ群について、高程度類似度クラスに属するユーザ、及び中程度類似度クラスに属するユーザを降順にソートする一方で、低程度類似度クラスに属するユーザを昇順にソートする。また、データ処理部350は、クラス分けされた各ユーザ群の中から任意数のユーザを抽出する。例えば、各クラスに区分けされたユーザ群の中から、上位の10人を抽出する。ただし、抽出する人数は、必要に応じ、その他の人数であってもよい。
そして、意外性カテゴリ抽出部355は、区分けされたユーザ群のうち、高程度類似度のユーザ群について、他のユーザの中から抽出された10人のユーザと要求ユーザとの間で、カテゴリ毎に、購入した書籍の差を求め、差の大きなカテゴリを抽出する。図6に示した例では、購入した書籍の数の差が5以上である場合に、差が大きいとしている。その結果、SFに属するカテゴリと、ミステリーに属するカテゴリとが抽出されている。
次に、図6の(1)に示したように、推薦を受ける要求ユーザが未購入のアイテムである書籍を抽出する。その際、フィルタリング部が、図6の(3)の説明文に示したように、中程度類似度のユーザ群に属するユーザ及び低程度類似度のユーザ群に属するユーザのいずれのユーザによっても購入されたことがない書籍を排除する処理を実行する。逆に、双方のユーザ群により購入されたことがある書籍は、排除されることなく残される。
次に、定番度算出部356は、図6の(4)の説明文に示したように、抽出された書籍についてポイント付けの処理を実行する。具体的に、中程度類度クラスのユーザ群に属するユーザ及び低程度類度クラスのユーザ群に属するユーザにより購入されたことがある書籍についてはポイント1を加算し、購入されたことがない書籍については、ポイントを0とする。そして、定番度算出部356は、加算されたポイントの結果を定番度として定義づけ、図6の(5)の説明文にしめしたように、ポイントの高い順、すなわち、定番度の高い順に書籍をソートする。
次に、アイテム抽出部357が、ソートされた書籍の中から、上位3位までに含まれる書籍を抽出する。ただし、アイテム抽出部357は、定番度が最も高い1つの書籍だけを抽出したり、そのほかの順位に含まれる書籍を抽出したりすることができる。
そして、情報提供部358は、アイテム抽出部357が抽出した書籍を、要求ユーザに対し、推薦情報として推薦する。
以上に説明した処理について、カウント部352、類似度算出部353及びユーザ区分け部354の処理について、図7を用いて、さらに詳しく説明する。
図7に示した例では、ユーザAが推薦を受ける要求ユーザを示し、ユーザBからユーザFがその他のユーザを示している。この図7に示した例において、ユーザAが購入したカテゴリ毎の書籍の購入数は、カテゴリAが20、カテゴリBが15、カテゴリCが10、カテゴリDが5、カテゴリEが0である。
他のユーザの1人であるユーザBが購入したカテゴリ毎の書籍の購入数は、カテゴリAが23、カテゴリBが14、カテゴリCが10、カテゴリDが20、カテゴリEが5である。同様に、他のユーザであるユーザCからユーザFについても購入したカテゴリ毎の書籍の購入数は、図7に図示した通りの数値の書籍がテゴリ毎に購入されている。
また、図7において、図の右側の欄には、各ユーザの類似度が示されている。図7において、類似度は、コサイン類似度により算出されており、ユーザBからユーザFの類似度は、それぞれ、0.898532136、0.16545563、0.22733666、0.561029499、0.568008578である。
さらに、図7の右側に示した、「高」、「中」、「低」の文字は、類似度の程度をそれぞれ表している。図7において、ユーザBは、高程度類似度クラスのユーザ群に属し、ユーザC及びユーザDは、低程度類似度クラスのユーザ群に属し、ユーザE及びユーザFは、中程度類似度クラスのユーザ群に属している。なお、当該図7において、類似度が0.6以上、1.0以下の範囲に属するユーザを高程度類似度クラス、類似度が0.4以上、0.6未満の範囲に属するユーザを中程度類似度クラス、類似度が0以上、0.4未満の範囲に属するユーザを低程度類似度クラスとしてユーザ群を区分けしている。
次に、図8を用いて、意外性カテゴリ抽出部355の処理について説明する。
意外性カテゴリ抽出部355は、要求ユーザが購入した各カテゴリに属する書籍の購入数と高程度類似度クラスのユーザ群に属するユーザが購入した各カテゴリに属する書籍の購入数とに基づいて、要求ユーザに意外性を与えるアイテム、すなわち、書籍を抽出する。
類似度が高いユーザの間においても、あるユーザにおいては、書籍をあまり購入していない
カテゴリがある一方で、他のユーザは、そのカテゴリに属する書籍を数多く購入している場合がある。類似度が高いということは、そのユーザ同士の趣向性が似ていることを示している。ところが、一のユーザがあまり購入したことがないカテゴリの書籍を推薦されると、そのユーザは、推薦された書籍に対して意外性を感じる。意外性カテゴリ抽出部355は、こうしたユーザの心理をついた処理を実行するための構成部である。
今、要求ユーザとユーザBとの間で、購入数の差が5以上であるカテゴリを意外性があるカテゴリとする。図8において、購入数の差が5以上であるカテゴリは、カテゴリDとカテゴリEである。すなわち、要求ユーザであるユーザAは、カテゴリDの書籍を5しか購入していないのに対し、ユーザBは、カテゴリDの書籍を20も購入しており、その差は15である。また、要求ユーザであるユーザAは、カテゴリEの書籍を全く購入していないのに対し、ユーザBは、カテゴリEの書籍を5も購入しており、その差は5である。そのほかのカテゴリAからカテゴリCについては、購入数の差が5未満になっている。
次に、図9を参照し、上述したフィルタリング部の機能について詳細に説明する。
本実施形態の情報提供システム1では、上述したように、定番度が高い書籍に関する情報を要求ユーザに対して提供することが目的の1つである。ところが、中程度類似度クラスのユーザ群に属するユーザや、低程度類似度クラスのユーザ群に属するユーザにより、一度も購入又は閲覧されたことがない書籍は、世間的にあまり認知されておらず、定番度がきわめて低い恐れがある。このような定番度が低い書籍についての情報を要求ユーザに提供した場合、要求ユーザに突飛なイメージを与え、全く興味を示さない恐れがある。フィルタリング部は、こうした事態が生じることを回避するために、設けた構成部である。
図9の「○」は、購入実績があることを示し、「×」は購入実績がないことを示している。 図9において、「書籍い」から「書籍に」までは、中程度類似度クラスのユーザ群に属するユーザ及び低程度類似度クラスのユーザ群に属するユーザの双方により、購入されたことがある書籍であることがわかる。
これに対し、「書籍ほ」は、中程度類似度クラスのユーザ群に属するユーザにより購入されたことがなく、低程度類似度クラスのユーザ群に属するユーザにより購入されたことがある。「書籍へ」は、中程度類似度クラスのユーザ群に属するユーザにより購入されたことはあるが、低程度類似度クラスのユーザ群に属するユーザにより購入されたことがない。そして、「書籍と」は、中程度類似度クラスのユーザ群に属するユーザ及び低程度類似度クラスのユーザ群に属するユーザの双方に購入されたことがない。
そのため、枠内に示した「書籍い」から「書籍に」までは、推薦対象書籍として残るが、枠外に示した「書籍ほ」から「書籍と」までは、推薦対象書籍としては残らない、推薦対象外の書籍となる。
[5]本実施形態の情報提供システムの動作
次に、図10を参照して本実施形態における情報提供システム1が要求ユーザに対し推薦情報を提供する処理について説明する。なお、図10は、情報提供サーバ装置30により実行される処理を示すフローチャートである。
本動作においては、推薦エンジンの初期化の処理は既に実行済みであるものとする。また、ユーザ情報DB341、コンテンツ情報DB342、及びカテゴリ情報DB343には既に必要なデータが登録されているものとする。
まず、情報提供サーバ装置30は、通信制御部320が通信端末装置10からユーザのログイン操作が行われた旨の信号を受信した否かを判断する(ステップS101)。
次いで、カウント部352は、各ユーザによって購入又は閲覧された書籍等のアイテムの購入数又は閲覧回数を、当該書籍が属するカテゴリ毎にカウントする(ステップS102)。このステップにおいて、アイテムとして書籍を例にした場合、カテゴリは、例えば、SF、ミステリー、IT、ビジネスという分野である。カウント部352は、各ユーザにについて、カテゴリがSFについては25、カテゴリがミステリーについては1というように、カウントする。
次いで、類似度算出部353が、要求ユーザとその他のユーザとの間における趣向性の類似度を、その他のユーザ毎に算出する。(ステップS103)。類似度の算出方法は、特に限定されず、コサイン類似度の算出手法を用いて算出したり、ユークリッド距離を利用して算出したりするなど、種々の手法で算出することができる。図7に示した例では、コサイン類似度を算出手法により算出された類似度を示している。
次いで、ユーザ群区分け部354は、算出された類似度に基づいて、ユーザを、高程度類似度クラスのユーザ群、中程度類似度のユーザ群及び低程度類似度のユーザ群に区分けする(ステップS104)。ユーザ群区分け部354は、各クラスのユーザ群について類似度に所定の数値範囲をそれぞれ設定してクラス分けを行う。例えば、ユーザ群区分け部354は、類似度が0.6以上、1.0以下の範囲に属するユーザを高程度類似度クラス、類似度が0.4以上、0.6未満の範囲に属するユーザを中程度類似度クラス、類似度が0以上、0.4未満の範囲に属するユーザを低程度類似度クラスとしてユーザ群を区分けしている。
このステップS104では、ソート部が各ユーザ群に属するユーザを類似度の大きさに応じて、昇順又は降順にソートする処理も実行する。例えば、高程度類似度クラスに属するユーザ、及び中程度類似度クラスに属するユーザを降順にソートする一方で、低程度類似度クラスに属するユーザを昇順にソートする。
また、このステップS104では、各クラスのユーザ群の中から所定の人数のユーザを抽出する。例えば、降順にソートされた高程度類似度クラスのユーザ群に属するユーザは、上から5人であるとか10人のユーザを抽出する。高程度類似度クラスのユーザ群において、ユーザを降順にソートし、上から5人であるとか10であるといったユーザを抽出した場合、抽出されたユーザは、要求ユーザとの間における類似度の程度が高いという特性を顕著にすることができる。
降順にソートされた中程度類似度クラスのユーザ群に属するユーザについても高程度類似度クラスのユーザ群に属するユーザと同様である。ただし、中程度類似度クラスのユーザ群に属するユーザにおいて、類似度の程度が中程度であるという特性を顕著にするには、降順にソートされたユーザの中から、順位が中間の範囲に属するユーザを抽出するとよい。
その一方で、昇順にソートされた低程度類似度クラスのユーザ群に属するユーザは、上から5人であるとか10人のユーザを抽出する。すなわち、類似度が低いユーザから順に5人とか10人を抽出する。低程度類似度クラスのユーザ群において、ユーザを昇順にソートし、上から5人であるとか10であるといったユーザを抽出した場合、抽出されたユーザは、要求ユーザとの間における類似度の程度が低いという特性を顕著にすることができる。
次いで、意外性カテゴリ抽出部355が、要求ユーザにおけるカテゴリ毎の書籍の購入数と、高程度類似度クラスのユーザ群に属するユーザにおけるカテゴリ毎の書籍の購入数とに基づいて、意外性カテゴリを抽出する(ステップS105)。
意外性カテゴリ抽出部355は、要求ユーザにおけるカテゴリ毎の書籍の購入数と、高程度類似度クラスのユーザ群に属するユーザにおけるカテゴリ毎の書籍の購入数との間に、一定の規則があるカテゴリを意外性カテゴリとして抽出する。例えば、要求ユーザにおける書籍の購入数と、高程度類似度クラスのユーザ群に属するユーザにおける書籍の購入数との間に、一定の値以上の差がある場合に、そのカテゴリを意外性カテゴリとして抽出する。図8に示した例では、購入数の差が5以上であるカテゴリDとカテゴリEとが意外性カテゴリとして抽出されている。
また、この意外性カテゴリを抽出するステップS105では、意外性カテゴリとして抽出されたカテゴリ毎に、高程度類似度クラスのユーザ群に属する当該ユーザが購入した書籍を抽出する処理を実行する。
次いで、フィルタリング部が意外性カテゴリとして抽出されたカテゴリに含まれ、高程度類似度クラスのユーザ群に属する当該ユーザが購入した書籍した書籍についてフィルタリングを行う(ステップS106)。
フィルタリング部は、抽出された書籍の中から、中程度類似度クラスのユーザ群に属するユーザと、低程度類似度クラスのユーザ群に属するユーザとのいずれにおいても購入されたことがない書籍を排除する処理を実行する。逆に、中程度類似度クラスのユーザ群に属するユーザと、低程度類似度クラスのユーザ群に属するユーザとの双方が購入したことがある書籍は、そのまま残される。
次いで、定番度算出部356が、意外性カテゴリ抽出部355により抽出されたカテゴリに含まれる書籍の定番度を算出する(ステップS107)。
定番度算出部356は、意外性カテゴリ抽出部355により抽出されたカテゴリに含まれる書籍の中から、中程度類似度クラス及び低程度類似度クラスに属するユーザ群のユーザにより購入又は閲覧された書籍の購入数又は閲覧回数に基づいて定番度を求める。具体的に、中程度類度クラスのユーザ群に属するユーザ及び低程度類度クラスのユーザ群に属するユーザにより購入されたことがある書籍についてはポイント1を加算し、購入されたことがない書籍については、ポイントを0とする。そして、定番度算出部356は、加算されたポイントの結果を定番度として定義づけ、ポイントの高い順、すなわち、定番度の高い順に書籍をソートする。
次いで、アイテム抽出部357が、所定の定番度の書籍を抽出する(ステップS108)。例えば、アイテム抽出部357は、定番度が最も高い書籍のみを抽出したり、定番度が高い書籍の中から上位5番目とか10番目までの書籍を抽出したりしている。
その後、情報提供部358が、アイテム抽出部357により抽出された書籍に関する情報を要求ユーザに送信し(ステップS109)、動作を終了する。
本実施形態における情報提供システム1を構成する情報提供サーバ装置30は、以上に説明した構成により、要求ユーザに推薦情報を提供する処理を実行するので、要求ユーザは、意外性を感じつつも、受け入れやすい情報を提供される。
[6]変形例
[6.1]変形例1
本実施形態の情報提供システム1は、カテゴリとしてアイテムが属する分野を採用している。ただし、カテゴリは、アイテムが属する分野であることには限定されない。
変形例1における情報提供システム1では、カテゴリとして、アイテムの著者、例えば、書籍の著者、音楽の作詞家や作曲家等を採用してもよい。こうした著者をカテゴリとして採用した場合、要求ユーザにとってあまり知識がないが、興味をそそる著者の書籍や、作詞家、作曲家の音楽に関する情報を要求ユーザに提供することができる。
[6.2]変形例2
本実施形態の情報提供システム1においては、購入済みの書籍をメインにして説明したが、購入済みの書籍に代えて、閲覧済み書籍の情報を蓄積して処理を実行することもできる。
この場合、閲覧済みであるか否かの判定は、例えば、書籍閲覧のアプリケーションにて、当該書籍の最終頁が開かれたときに、最終頁が開かれた旨の情報を通信端末装置10から情報提供サーバ装置30に送信する。最終頁まで開かれた旨の情報は、ユーザが当該書籍を最終頁まで読み切ったことが推定されるので、推薦情報を受ける要求ユーザは、役に立ったと感じる確率が高くなる。
[6.3]変形例3
本実施形態における類似ユーザ抽出機能において、近似する類似度のユーザをひとまとめにして処理を実行してもよい。
例えば、中程度類似度クラスのユーザ群において、コサイン類似度が0.4台、0.5台の各範囲に属するユーザをそれぞれひとまとめにして、各範囲の類似度について、購入された書籍を取り扱ってもよい。この変形例3では、データが少ない場合でも良質な結果を得ることができる。
[6.4]変形例4
本実施形態における類似ユーザ抽出機能において、要求ユーザとの間の類似度が極端に低い類似度のユーザを除外して処理を実行してもよい。例えば、要求ユーザとの間のコサイン類似度が0.2未満のユーザは、情報提供システム1における情報提供サーバ装置30にて実行される処理から除外する。
この変形例4では、類似度が極端に低いユーザを除外してしまうため、要求ユーザに提供する情報の意外性は、確かに低減してしまう。しかしながら、類似度が極端に低いユーザを除外することにより、要求ユーザにとって受け入れやすい情報であって、しかも、要求ユーザにとって、役に立つ情報を提供することが可能になる。
[6.5]変形例5
本実施形態における意外性カテゴリ抽出部355の抽出機能において、カテゴリ毎の購入数の差が所定の値よりも小さいカテゴリをすべて排除するというロジックに代えて、購入数の差が大きい上位のカテゴリを採用するというロジックを採用してもよい。例えば、カテゴリに含まれる書籍の購入数の差が大きい上位3つのカテゴリを採用するというロジックである。
[6.6]変形例6
本実施形態の定番度算出部356が備える機能において、中程度類似度クラスのユーザ群及び低程度類似度クラスのユーザ群における定番度に対して、各クラスのユーザ群に対して重み付けを行って定番度を算出してもよい。
例えば、中程度類似度クラスのユーザ群の定番度を算出する場合に、中程度類似度クラスのユーザ群の定番度の重みを上げる処理を行う。この場合、要求ユーザにとって、意外性は低減するが、受け入れやすく役に立つ情報を提供することが可能になる。一方、低程度類似度クラスのユーザ群の定番度を算出する場合に、低程度類似度クラスのユーザ群の定番度の重みを上げる処理を行う。この場合、要求ユーザにとって、意外性を増大させることができる。
[6.7]変形例7
本実施形態においては、情報提供サーバ装置30内に各DB341〜343を設け、これらのDBを情報提供サーバ装置30のみにおいて管理及び制御する構成としたが、各DB341〜343を管理するためのコンピュータシステム別個に設け、各々、個別に管理、運用するようにしてもよい。
1 … 情報提供システム
10 … 通信端末装置
20 … ネットワーク
30 … 情報提供サーバ装置
310 … サーバ管理制御部
320 … 通信制御部
330 … ROM/RAM
340 … 記録部
341 … ユーザ情報DB
342 … コンテンツ情報DB
343 … カテゴリ情報DB
350 … データ処理部
351 … DB管理部
352 … カウント部
353 … 類似度算出部
354 … ユーザ群区分け部
355 … 意外性カテゴリ抽出部
356 … 定番度算出部
357 … アイテム抽出部
358 … 情報提供部

Claims (8)

  1. ネットワークを介してユーザにより所持された通信端末装置に接続され、ユーザに所定コンテンツの1種をなすアイテムに関する情報を推薦情報として前記通信端末装置に提供するための情報提供サーバ装置であって、
    各ユーザによって購入又は閲覧された前記アイテムの購入数又は閲覧回数を、当該アイテムが属するカテゴリ毎にカウントするカウント手段と、
    前記購入数又は閲覧回数に基づいて、ユーザ間における前記コンテンツに対する購入又は閲覧の趣向に関する類似度を算出する類似度算出手段と、
    前記算出された各ユーザ間の類似度に基づいて、前記推薦情報を要求する要求ユーザに対する他のユーザを、閾値に基づいて、高程度類似度クラス、中程度類似度クラス及び低程度類似度クラスの3区分の類似度クラスに属するユーザ群に区分けするユーザ群区分け手段と、
    前記高程度類似度クラスのユーザ群を構成する各ユーザが購入又は閲覧した前記アイテムと、前記要求ユーザが既に購入又は閲覧した前記アイテムとをカテゴリ毎に比較して、カテゴリ毎の購入数又は閲覧回数の間に、カテゴリ毎の購入数又は閲覧回数の相関関係を数値化した値が所定の条件を具備する関係が成立するカテゴリを意外性カテゴリとして抽出する意外性カテゴリ抽出手段と、
    前記意外性カテゴリ抽出手段により抽出されたカテゴリに含まれるアイテムの中から、前記中程度類似度クラス及び前記低程度類似度クラスに属するユーザ群のユーザにより購入又は閲覧されたアイテムの購入数又は閲覧回数に基づいて、前記各アイテムの認知の程度としての指標を数値化した定番度を求める定番度算出手段と、
    前記定番度算出手段により算出された定番度に基づいて、前記意外性カテゴリ抽出手段により抽出されたカテゴリに含まれるアイテムの中から所定の定番度を有するアイテムを抽出するアイテム抽出手段と、
    前記アイテム抽出手段により抽出されたアイテムに関する情報を前記推薦情報として前記要求ユーザに提供する情報提供出段とを備えることを特徴とする情報提供サーバ装置。
  2. 請求項1に記載の情報提供サーバ装置において、
    ユーザ群区分け手段は、前記高程度類似度クラス、中程度類似度クラス及び低程度類似度クラスに属するユーザ群のユーザを、類似度に関する所定の規則に基づいてソートして前記閾値により分類するソート手段を各クラスに設けている、情報提供サーバ装置。
  3. 請求項1又は2に記載の情報提供サーバ装置において、
    カテゴリ毎における前記所定の条件が、前記高程度類似度クラスに属するユーザ群を構成する各ユーザがアイテムを購入した購入数又は閲覧した閲覧回数から前記要求ユーザがアイテムを既に購入した購入数又は閲覧した閲覧回数を差し引いて求めた差が所定の値以上である、情報提供サーバ装置。
  4. 請求項1〜3のいずれか1項に記載の情報提供サーバ装置において、
    前記意外性カテゴリ抽出手段により抽出されたカテゴリに含まれるアイテムの中から、前記中程度類似度クラス及び前記低程度類似度クラスに属するユーザ群のユーザにより一度も購入又は閲覧されたことがないアイテムを排除するフィルタリング手段をさらに備えている、情報提供サーバ装置。
  5. 請求項1〜4のいずれか1項に記載の情報提供サーバ装置において、
    前記定番度算出手段は、前記アイテムが購入された数又は閲覧された閲覧数を当該アイテム毎に算出して前記定番度を算出している、情報提供サーバ装置。
  6. 請求項1〜5のいずれか1項に記載の情報提供サーバ装置において、
    前記アイテム抽出手段は、前記要求ユーザが未購入又は未だに閲覧をしていないアイテムであって、前記高程度類似度クラスのユーザ群に属するユーザが既に購入又は既に閲覧しているアイテムを抽出する、情報提供サーバ装置。
  7. ネットワークを介してユーザにより所持された通信端末装置に接続され、ユーザに所定コンテンツの1種をなすアイテムに関する情報を推薦情報として前記通信端末装置に提供するための情報提供サーバ装置を構成するコンピュータにおいて用いられるプログラムであって、
    前記コンピュータを、
    各ユーザによって購入又は閲覧された前記アイテムの購入数又は閲覧回数を、当該アイテムが属するカテゴリ毎にカウントするカウント手段、
    前記購入数又は閲覧回数に基づいて、ユーザ間における前記コンテンツに対する購入又は閲覧の趣向に関する類似度を算出する類似度算出手段、
    前記算出された各ユーザ間の類似度に基づいて、前記推薦情報を要求する要求ユーザに対する他のユーザを、閾値に基づいて、高程度類似度クラス、中程度類似度クラス及び低程度類似度クラスの3区分の類似度クラスに属するユーザ群に区分けするユーザ群区分け手段、
    前記高程度類似度クラスのユーザ群を構成する各ユーザが購入又は閲覧した前記アイテムと、前記要求ユーザが既に購入又は閲覧した前記アイテムとをカテゴリ毎に比較して、カテゴリ毎の購入数又は閲覧回数の間に、カテゴリ毎の購入数又は閲覧回数の相関関係を数値化した値が所定の条件を具備する関係が成立するカテゴリを意外性カテゴリとして抽出する意外性カテゴリ抽出手段、
    前記意外性カテゴリ抽出手段により抽出されたカテゴリに含まれるアイテムの中から、前記中程度類似度クラス及び前記低程度類似度クラスに属するユーザ群のユーザにより購入又は閲覧されたアイテムの購入数又は閲覧回数に基づいて、前記各アイテムの認知の程度としての指標を数値化した定番度を求める定番度算出手段、
    前記定番度算出手段により算出された定番度に基づいて、前記意外性カテゴリ抽出手段により抽出されたカテゴリに含まれるアイテムの中から所定の定番度を有するアイテムを抽出するアイテム抽出手段、及び
    前記アイテム抽出手段により抽出されたアイテムに関する情報を前記推薦情報として前記要求ユーザに提供する情報提供出段、
    として機能させることを特徴とするプログラム。
  8. ネットワークを介してユーザにより所持された通信端末装置に接続され、ユーザに所定コンテンツの1種をなすアイテムに関する情報を推薦情報として前記通信端末装置に提供するための情報提供サーバ装置が実行する情報提供方法であって、
    各ユーザによって購入又は閲覧された前記アイテムの購入数又は閲覧回数を、当該アイテムが属するカテゴリ毎にカウントするカウント工程と、
    前記購入数又は閲覧回数に基づいて、ユーザ間における前記コンテンツに対する購入又は閲覧の趣向に関する類似度を算出する類似度算出工程と、
    前記算出された各ユーザ間の類似度に基づいて、前記推薦情報を要求する要求ユーザに対する他のユーザを、閾値に基づいて、高程度類似度クラス、中程度類似度クラス及び低程度類似度クラスの3区分の類似度クラスに属するユーザ群に区分けするユーザ群区分け工程と、
    前記高程度類似度クラスのユーザ群を構成する各ユーザが購入又は閲覧した前記アイテムと、前記要求ユーザが既に購入又は閲覧した前記アイテムとをカテゴリ毎に比較して、カテゴリ毎の購入数又は閲覧回数の間に、カテゴリ毎の購入数又は閲覧回数の相関関係を数値化した値が所定の条件を具備する関係が成立するカテゴリを意外性カテゴリとして抽出する意外性カテゴリ抽出工程と、
    前記意外性カテゴリ抽出工程により抽出されたカテゴリに含まれるアイテムの中から、前記中程度類似度クラス及び前記低程度類似度クラスに属するユーザ群のユーザにより購入又は閲覧されたアイテムの購入数又は閲覧回数に基づいて、前記各アイテムの認知の程度としての指標を数値化した定番度を求める定番度算出工程と、
    前記定番度算出工程により算出された定番度に基づいて、前記意外性カテゴリ抽出工程により抽出されたカテゴリに含まれるアイテムの中から所定の定番度を有するアイテムを抽出するアイテム抽出工程と、
    前記アイテム抽出工程により抽出されたアイテムに関する情報を前記推薦情報として前記要求ユーザに提供する情報提供工程と、を備えることを特徴とする情報提供方法。
JP2016073505A 2016-03-31 2016-03-31 情報提供サーバ装置、プログラム及び情報提供方法 Expired - Fee Related JP6696270B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016073505A JP6696270B2 (ja) 2016-03-31 2016-03-31 情報提供サーバ装置、プログラム及び情報提供方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016073505A JP6696270B2 (ja) 2016-03-31 2016-03-31 情報提供サーバ装置、プログラム及び情報提供方法

Publications (2)

Publication Number Publication Date
JP2017182746A JP2017182746A (ja) 2017-10-05
JP6696270B2 true JP6696270B2 (ja) 2020-05-20

Family

ID=60007451

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016073505A Expired - Fee Related JP6696270B2 (ja) 2016-03-31 2016-03-31 情報提供サーバ装置、プログラム及び情報提供方法

Country Status (1)

Country Link
JP (1) JP6696270B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6797781B2 (ja) * 2017-11-16 2020-12-09 東芝映像ソリューション株式会社 システム、方法及びプログラム
JP7239628B2 (ja) * 2021-03-18 2023-03-14 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001265808A (ja) * 2000-03-22 2001-09-28 Skysoft Inc 情報検索システム及び情報検索方法
JP4331257B2 (ja) * 2006-11-06 2009-09-16 パナソニック株式会社 情報検索装置
JP4981511B2 (ja) * 2007-05-02 2012-07-25 ヤフー株式会社 商品データを配信する方法
JP5395729B2 (ja) * 2010-04-20 2014-01-22 株式会社日立ソリューションズ 情報提示装置

Also Published As

Publication number Publication date
JP2017182746A (ja) 2017-10-05

Similar Documents

Publication Publication Date Title
Chehal et al. Implementation and comparison of topic modeling techniques based on user reviews in e-commerce recommendations
US8234306B2 (en) Information process apparatus, information process method, and program
US9201880B2 (en) Processing a content item with regard to an event and a location
RU2627717C2 (ru) Способ и устройство для автоматического генерирования рекомендаций
Hsu A personalized English learning recommender system for ESL students
CN104281622B (zh) 一种社交媒体中的信息推荐方法和装置
CN107862022B (zh) 文化资源推荐系统
CN107077486A (zh) 情感评价系统和方法
US20110320423A1 (en) Integrating social network data with search results
US9483740B1 (en) Automated data classification
JP6033697B2 (ja) 画像評価装置
CN106326391A (zh) 多媒体资源推荐方法及装置
KR102108683B1 (ko) 비관심사 컨텐츠를 포함하는 추천 컨텐츠를 제공하는 방법
US20140297628A1 (en) Text Information Processing Apparatus, Text Information Processing Method, and Computer Usable Medium Having Text Information Processing Program Embodied Therein
US20150302036A1 (en) Method, system and computer program for information retrieval using content algebra
US20120311140A1 (en) Method of processing web access information and server implementing same
US9552415B2 (en) Category classification processing device and method
CN106462644B (zh) 标识来自多个结果页面标识的优选结果页面
CN112989824A (zh) 信息推送方法及装置、电子设备及存储介质
KR102132931B1 (ko) 사용자 맞춤식 가치 정보 검색 및 소셜 네트워크 구성 시스템 및 그 방법
CN113191896A (zh) 一种招标信息的推荐方法、装置及计算机设备
US9516089B1 (en) Identifying and processing a number of features identified in a document to determine a type of the document
KR101652433B1 (ko) Sns 문서에서 추출된 토픽을 기반으로 파악된 감정에 따른 개인화 광고 제공 방법
JP6696270B2 (ja) 情報提供サーバ装置、プログラム及び情報提供方法
KR20130053448A (ko) 검색 장치, 검색 방법, 및 검색 프로그램을 기억하는 컴퓨터 판독 가능한 기록 매체

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190130

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200310

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200312

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200324

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200406

R150 Certificate of patent or registration of utility model

Ref document number: 6696270

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees