JP2017068720A - 情報提供装置及びプログラム - Google Patents

情報提供装置及びプログラム Download PDF

Info

Publication number
JP2017068720A
JP2017068720A JP2015195451A JP2015195451A JP2017068720A JP 2017068720 A JP2017068720 A JP 2017068720A JP 2015195451 A JP2015195451 A JP 2015195451A JP 2015195451 A JP2015195451 A JP 2015195451A JP 2017068720 A JP2017068720 A JP 2017068720A
Authority
JP
Japan
Prior art keywords
information
word
electronic book
posted
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015195451A
Other languages
English (en)
Inventor
明生 大門
Akio Daimon
明生 大門
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2015195451A priority Critical patent/JP2017068720A/ja
Publication of JP2017068720A publication Critical patent/JP2017068720A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】電子書籍等のデジタルコンテンツを推薦する際に、デジタルコンテンツの特定精度を向上させて適切なコンテンツ推薦を行うこと。【解決手段】電子書籍推薦システム1は、電子書籍のタイトル及び本文から、当該電子書籍の特徴を示すコンテンツ特徴語を抽出するとともに、投稿者が投稿した各投稿情報から、現在のトレンドを示す投稿話題語を抽出し、少なくとも1の投稿話題語をコンテンツ特徴語として含む電子書籍を最終陳列スコアに応じて並べ変えつつ、推薦情報の生成及び配信を実行する構成を有している。【選択図】図1

Description

本発明は、電子書籍等のデジタルコンテンツに関する情報を推薦情報としてユーザに提供する情報提供装置などに関する。
近年、タブレット型情報通信端末、スマートフォン、電子書籍閲覧用端末装置等の情報通信端末装置(以下、「通信端末装置」という)の機能向上及び普及に伴い、ユーザは、自身の所望する書籍に対応するデジタルコンテンツ(いわゆる、電子書籍)をWWW(World Wide Web)上のサーバ装置により開設されるオンラインストアにて購入し、いつでも閲覧(読書)できるようになっている。
この種のオンラインストアは、実世界上に存在する実書店と異なり、書籍の販売スペースに制限がないため、非常に数多くの電子書籍を取扱(販売)可能である。その一方、ユーザが目的の電子書籍を探すためには、キーワード、著者、書籍のジャンル(例えば、小説、コミック、雑誌等)に基づく検索を実行する必要性がある。
このため、購入対象となる電子書籍が決まっていない状態で、何気なくオンラインストアにアクセスしたような場合には、ユーザに対し、実書店において実施される書籍フェアのように、話題の電子書籍を積極的にアピールすること、及び、その結果、購買に繋げることが難しく、電子書籍の販売機会を逸失してしまう可能性も多い。
そこで、最近では、時事情報(例えば、ニュース記事等)から現在のトレンドとなっている時事キーワードを特徴語として抽出するとともに、当該特徴語に基づき、現在のトレンドに近い商品に関する広告を通信端末装置に提供(配信)するシステムが提案されている。
このシステムは、
(1)各商品の属する商品カテゴリ名を検索キーとして、Web検索を実行し、
(2)当該検索結果に対応するスニペットから頻出語又は特徴語を抽出し、
(3)当該抽出した頻出語及び特徴語を、当該商品の関連単語として、対応する商品名と対応付けつつ、予めデータベースに記録する、
構成を有している。
そして、このようなシステムは、当該関連単語と、特徴語と、に基づき、トレンドに近い商品特定する構成を採用している(例えば、特許文献1)。
特許4859892号
しかしながら、上記特許文献1に記載のシステムにおいては、商品そのものの特徴を示す関連単語が、Web検索結果のスニペットから抽出される構成になっているため、商品との関係性の低い単語が関連単語として抽出される可能性があり、推薦対象を特定する際の精度を向上させることが難しい。
本発明は、上記課題を解決するためになされたものであり、その目的は、オンラインストストアにアクセスしたユーザに対して、電子書籍等のデジタルコンテンツを積極的に推薦するとともに、当該推薦時におけるデジタルコンテンツの特定精度を向上させ、適切なコンテンツ推薦を行うことができる情報提供装置等を提供することにある。
(1)上述した課題を解決するため、本発明の情報提供装置は、ネットワークを介して接続された通信端末装置に、文字列を含むコンテンツに関する情報を推薦情報として提供する情報提供装置であって、前記コンテンツを識別するためのコンテンツ識別情報と、当該コンテンツ識別情報に対応するコンテンツデータと、が対応付けて複数のデータが記録される記録手段を管理する管理手段と、前記コンテンツデータに含まれる文字列を構成する各語句の出現頻度に応じて、当該コンテンツデータの特徴を示す語句をコンテンツ特徴語として抽出するコンテンツ特徴語抽出手段と、前記抽出されたコンテンツ特徴語に基づき、前記記録手段に記録されたデータの中から前記特徴が関連する複数のコンテンツデータを特定する特定手段と、前記特定されたコンテンツデータの特徴を含む情報をそれぞれ関連付けた推薦情報を生成する生成手段と、前記生成された前記推薦情報を第1の推薦情報として関連付けてユーザに閲覧可能に前記通信端末装置に提供する提供手段と、を具備する構成を有している。
この構成により、本発明の情報提供装置は、デジタルコンテンツとしての電子書籍に含まれる文字列から電子書籍の特徴を示すコンテンツ特徴語を抽出し、当該抽出したコンテンツ特徴語に基づき、相互に関連性を有する複数のコンテンツデータを特定し、ユーザに提示することができる。
したがって、本発明の情報提供装置は、電子書籍に含まれる語句から、当該電子書籍の特徴(例えば、電子書籍の題材等)を示すコンテンツ特徴語を、直接抽出することができるので、精度の高いコンテンツ特徴語抽出を実現できるとともにユーザの関心事等に関連する全ての電子書籍を確実に、かつ、積極的にユーザに推薦して、ユーザによる電子書籍の購入を促進することができる。
(2)また、本発明の情報提供装置は、実世界において発生した各種の事象に対する文字列を含む情報であって、仮想世界上に投稿される投稿情報を取得する取得手段と、前記取得された投稿情報に含まれる文字列に基づき、前記投稿情報において出現頻度に関して所定の条件を具備する語句を投稿話題語として抽出する投稿話題語抽出手段と、を更に有し、前記特定手段が、前記抽出された投稿話題語と前記コンテンツ特徴語に基づき、前記記録手段に記録されたデータの中から前記特徴が関連する複数のコンテンツデータを特定する構成を有している。
この構成により、本発明の情報提供装置は、実世界において発生した各種の事象に対する文字列を含む記事、つぶやき、意見等の投稿情報から、実世界における現在のトレンドを示す投稿話題語を抽出し、少なくとも1の投稿話題語をコンテンツ特徴語として含む電子書籍を推薦対象として特定できる。
したがって、本発明の情報提供装置は、現在のトレンドに合致する電子書籍を推薦対象として特定し、当該電子書籍を積極的に推薦することができるとともに、トレンドを示すキーワードとしての投稿話題語を投稿情報に含まれる文字列から直接的に抽出できるため、実際のトレンドに即して高精度にて、投稿話題語を抽出し、精度の高い電子書籍推薦を実現することができる。
(3)また、本発明の情報提供装置は、前記投稿話題語抽出手段が、予め定められたタイミングから所定時間前の期間内に投稿された前記投稿情報を抽出し、当該抽出した投稿情報の中から出現頻度について前記所定の条件を具備する語句を前記投稿話題語として抽出する構成を有している。
通常、投稿情報は、古いものよりも新しいものに実世界におけるトレンドが反映される傾向が強い。
したがって、本発明の情報提供装置は、上記構成により、最新のトレンドに合わせて、推薦対象となる電子書籍を特定し、積極的にユーザに提示することができる。
(4)また、本発明の情報提供装置は、前記投稿話題語抽出手段が、前記投稿情報における各語句の出現頻度に対して、当該語句を含む前記投稿情報の種別に応じた係数による重み付けを行うとともに、当該重み付けされた出現頻度について前記所定の条件を具備する語句を前記投稿話題語として抽出する構成を有している。
この構成により、本発明の情報提供装置は、投稿情報の種別(ニュース記事、ブログ、SNS等)に応じて、ユーザにより閲覧される可能性が高く、トレンドを形成しやすい投稿情報に含まれる語句を中心としつつ、投稿話題語を抽出できるので、トレンド性の高い語句を投稿話題語として抽出することができる。
(5)また、本発明の情報提供装置は、前記投稿話題語抽出手段が、前記投稿情報における、各語句の出現頻度に対して、当該語句が含まれる部位に応じた係数による重み付けを行うとともに、当該重み付けされた出現頻度について前記所定の条件を具備する語句を投稿話題語として抽出する構成を有している。
この構成により、本発明の情報提供装置は、投稿情報における各語句の出現箇所に応じて、重み付けを行いつつ、投稿話題語を抽出できるので、例えば、タイトルなど、人目につきやすい部位に出現する語句を優先的に投稿話題語に抽出することができる。
(6)また、本発明の情報提供装置は、前記投稿情報に対して、読者が設定されている場合に、前記投稿話題語抽出手段が、前記投稿情報における、語句の出現頻度に対して、当該投稿情報に設定されている読者数に応じた係数による重み付けを行うとともに、当該重み付けされた出現頻度について前記所定の条件を具備する語句を投稿話題語として抽出する構成を有している。
この構成により、本発明の情報提供装置は、投稿情報の読者数に応じて重み付けを行い、より多くの人目につきやすく、トレンドを形成しやすい投稿情報に含まれる語句を優先的に投稿話題語として抽出することができる。
(7)また、本発明の情報提供装置は、前記投稿話題語抽出手段が、所定の時間周期にて、前記投稿話題語を抽出する場合に、今回の抽出タイミングと、前回以前の抽出タイミングと、の時間差に応じた係数と、過去における投稿話題語の抽出時における各語句の出現頻度と、を乗算するとともに、当該乗算後の出現頻度と、今回の抽出タイミングにおける各語句の出現頻度に基づき、前記投稿話題語を抽出する構成を有している。
この構成により、本発明の情報提供装置は、過去に抽出された投稿話題語を用いつつ、推薦対象の電子書籍を特定できるので、ゆるやかに投稿話題語をフェードアウトすることでトレンドに対する感度が低いユーザに対しても、最適な電子書籍を推薦することができる。
(8)また、本発明の情報提供装置は、前記コンテンツ特徴語抽出手段が、前記コンテンツデータに含まれる各語句の出現頻度に応じて、当該語句の重要度を示す第1の特徴量を算出するとともに、当該第1の特徴量が所定の条件を満たす語句を前記コンテンツ特徴語として抽出する構成を有している。
この構成により、本発明の情報提供装置は、電子書籍に出現する語句の重要度を正確に特定しつつ、コンテンツ特徴語を抽出して、推薦対象となる電子書籍を特定することができる。
(9)また、本発明の情報提供装置は、前記特定手段が、前記算出された第1の特徴量に基づき、対応するコンテンツデータ全体の特徴を示す第2の特徴量を算出し、当該第2の特徴量に基づき、前記記録手段に記録されたデータの中から前記特徴が関連する複数のコンテンツデータを特定する構成を有している。
この構成により、本発明の情報提供装置は、電子書籍全体の特徴を加味しつつ、推薦対象となる電子書籍を特定することができる。
(10)また、本発明の情報提供装置は、前記第2の特徴量に基づき、前記コンテンツデータ間の類似度を算出する類似度算出手段を更に有し、前記提供された推薦情報に基づき、前記通信端末装置において、1の前記コンテンツデータが指定された場合に、前記生成手段が、当該指定されたコンテンツデータと、前記類似度が所定の条件を満たす前記コンテンツデータを関連コンテンツデータとして特定し、当該特定された関連コンテンツデータの特徴を含む情報を推薦情報として、生成するとともに、前記提供手段が、前記生成された推薦情報を第2の推薦情報として、対応する通信端末装置に提供する構成を有している。
この構成により、本発明の情報提供装置は、相互に類似する電子書籍を確実に特定して、各電子書籍に関連する電子書籍の情報をユーザに提供することができる。
(11)また、本発明のプログラムは、ネットワークを介して接続された通信端末装置に、文字列を含むコンテンツに関する情報を推薦情報として提供する情報提供装置としてのコンピュータを、前記コンテンツを識別するためのコンテンツ識別情報と、当該コンテンツ識別情報に対応するコンテンツデータと、が対応付けて複数のデータが記録される記録手段を管理する管理手段、前記コンテンツデータに含まれる文字列を構成する各語句の出現頻度に応じて、当該コンテンツデータの特徴を示す記語句をコンテンツ特徴語として抽出するコンテンツ特徴語抽出手段、前記抽出されたコンテンツ特徴語に基づき、前記記録手段に記録されたデータの中から前記特徴が関連する複数のコンテンツデータを特定する特定手段、前記特定されたコンテンツデータの特徴を含む情報をそれぞれ関連付けた推薦情報を生成する生成手段、前記生成された前記推薦情報を第1の推薦情報として関連付けてユーザに閲覧可能に前記通信端末装置に提供する提供手段、として機能させる構成を有している。
この構成により、本発明のプログラムは、コンピュータにより、デジタルコンテンツとしての電子書籍に含まれる文字列から電子書籍の特徴を示すコンテンツ特徴語を抽出し、当該抽出したコンテンツ特徴語に基づき、相互に関連性を有する複数のコンテンツデータを特定し、ユーザに提示することができる。
したがって、本発明のプログラムは、電子書籍に含まれる語句から、当該電子書籍の特徴(例えば、電子書籍の題材等)を示すコンテンツ特徴語を、直接抽出することができるので、精度の高いコンテンツ特徴語抽出を実現できるとともにユーザの関心事等に関連する全ての電子書籍を確実に、かつ、積極的にユーザに推薦して、ユーザによる電子書籍の購入を促進することができる。
本発明は、オンラインストストアに立ち寄ったユーザに対して、電子書籍等のデジタルコンテンツを積極的に推薦するとともに、当該推薦時におけるデジタルコンテンツの特定精度を向上させ、適切なコンテンツ推薦を行うことができる。
本発明に係る一実施形態における書籍推薦システムの構成を示すシステム構成図である。 一実施形態の電子書籍サーバ装置の構成を示すブロック図である。 一実施形態の電子書籍サーバ装置に設けられたユーザ管理データベースに記録されるデータの一例を示す図である。 一実施形態の電子書籍サーバ装置に設けられた電子書籍管理データベースに記録されるデータの一例を示す図である。 一実施形態の電子書籍サーバ装置に設けられた投稿情報管理データベースに記録されるデータの一例を示す図である。 一実施形態の電子書籍サーバ装置に設けられた著者管理データベースに記録されるデータの一例を示す図である。 一実施形態の電子書籍サーバ装置において、新規登録電子書籍を登録する際に実行されるコンテンツ特徴語抽出処理を説明するためのイメージ図の一例である。 一実施形態の電子書籍サーバ装置において、新規登録電子書籍を登録する際に実行される関連書籍選定処理を説明するためのイメージ図の一例である。 一実施形態の電子書籍サーバ装置において、所定の時間間隔にて実行される投稿話題語抽出処理において生成される投稿話題語リストの一例を示す図である。 一実施形態の電子書籍サーバ装置において、所定の時間間隔にて実行される投稿話題語リスト更新処理において生成される投稿話題語リストの一例を示す図である。 一実施形態の電子書籍サーバ装置において実行されるコンテンツ特徴語抽出処理及び関連書籍選定処理を示すフローチャートである。 一実施形態の電子書籍サーバ装置において実行される投稿話題語抽出処理及び投稿話題語リスト更新処理を示すフローチャートである。 一実施形態の電子書籍サーバ装置において推薦情報を生成する際に実行される処理を示すフローチャートである。 一実施形態の電子書籍サーバ装置30において生成される推薦情報の一例を示す図である。
以下、図面を参照しつつ、本発明の実施形態について説明する。なお、以下の実施形態は、ユーザによって所持される通信端末装置と、当該通信端末装置とネットワークを介して接続される書籍販売及び推薦用のサーバ装置と、を有する通信システムに対し、本発明に係る、情報提供装置及びプログラムを適用した場合の実施形態である。
[1]電子書籍推薦システム
まず、図1を用いて、本実施形態における電子書籍推薦システム1の構成及び概要について説明する。
なお、図1は、本実施形態の電子書籍推薦システム1の構成を示すシステム構成図である。また、図1においては、図が煩雑になることを防止するために一部のユーザ及び通信端末装置のみを示している。すなわち、実際の電子書籍推薦システム1においては、表示するよりも多数のユーザ及び通信端末装置10が存在している。
本実施形態の電子書籍推薦システム1は、電子書籍のオンラインストアのサービスを提供するとともに、当該サービスに対して、ユーザによってアクセスされた場合に、推薦対象となる電子書籍に関する情報を推薦情報として当該ユーザに提供し、その電子書籍の購入を促進するためのシステムである。
通常、オンラインストアにおいては、実書店において行われるように、現在のトレンドに合わせて、売り場の一部に、当該トレンドに合致する書籍を平積みして、陳列販売するような販売形態を行うことが難しく、購入対象となる電子書籍が決まっていない状態で、何気なくオンラインストアにアクセスしたようなユーザに対して、積極的にお勧めの電子書籍を推薦し、アピールすることが難しい。
例えば、大きな地震が起こった場合に、実書店においては、従業者が「地震」に関連する書籍をピックアップして、レジの近辺に平積み陳列して、来店客の目を引くことができるが、オンラインストアの場合には、取扱書籍の数が膨大であるため、当該オンラインストアのオペレータが、「地震」に関連する本を全てピックアップして、当該オンラインストアのトップページ等に陳列することが難しい。
したがって、仮に同様の方法を実現しようとすると、オペレータの負担が非常に大きくなるとともに、オンラインストアの運営コストが増大する可能性がある。
この結果、オンラインストアは、実書店と比較し、購入目的が定まっていないユーザ対する訴求力が弱くなり、この種のユーザに対して電子書籍購入の動機付けを行うことが難しく、また、電子書籍の販売機会を逸失する可能性が生じてしまう。
そこで、本実施形態の電子書籍推薦システム1は、実世界上にて発生した事象(例えば、事件、事故、災害、経済的な出来事等)に基づいて投稿されたニュース記事、つぶやき又は意見等の文字列を含む情報(以下、「投稿情報」という。)から、現在のトレンドを示すキーワード(以下、「投稿話題語」という)を抽出し、当該抽出した投稿話題語に基づいて電子書籍を選定してオンラインストアの所定のページ(例えば、話題書籍紹介ページ等)において推薦情報として提供する構成を有している。
すなわち、本実施形態の電子書籍推薦システム1は、電子書籍のタイトル及び本文から、当該電子書籍の特徴を示すコンテンツ特徴語を抽出するとともに、投稿情報から、現在のトレンドを示す投稿話題語を抽出し、少なくとも1の投稿話題語をコンテンツ特徴語として含む電子書籍を最終陳列スコアに応じて並べ変えつつ、推薦情報を生成し、通信端末装置10に配信する構成を有している。
特に、本実施形態の電子書籍推薦システム1は、
(1)電子書籍のタイトル及び本文から当該電子書籍の特徴を示すコンテンツ特徴語を抽出し

(2)投稿者が投稿した各投稿情報から、現在のトレンドを示す投稿話題語を抽出し、
(3)少なくとも1の投稿話題語をコンテンツ特徴語として含む電子書籍を最終陳列スコアに応じてリスト化し、
(4)リスト化した際に所定の条件を具備する電子書籍を推薦情報の生成及び配信を実行する構成を有している。
具体的には、本実施形態の電子書籍推薦システム1は、各ユーザによって所有される複数の通信端末装置10と、ネットワーク20を介して、各通信端末装置10に通信接続され、電子書籍の販売を行うためのオンラインストアを管理運営する電子書籍サーバ装置30と、オンラインストアの運営事業者のオペレータにより利用される管理端末装置40と、を有している。
本実施形態の通信端末装置10は、ユーザによって使用される、パーソナルコンピュータ、タブレット型情報通信端末装置、スマートフォン、電子書籍リーダ等の通信端末装置であり、基地局BSを介して、ネットワーク20と、通信接続される。
また、通信端末装置10は、XML(eXtensible Markup Language)等のマークアップ言語によって記述されているWWWシステム用のリソースデータと、当該リソースデータのネットワークアドレスを示す固有のURL(Uniform Resource Locator)とを用いつつ、電子書籍サーバ装置30との間でデータ通信を行うブラウジング機能を有している。
そして、通信端末装置10は、当該ブラウジング機能を用いて、電子書籍サーバ装置30により運営されるオンラインストアにアクセスするとともに、当該アクセス時に電子書籍サーバ装置30から配信される推薦情報に基づいて、当該推薦情報に対応する画面をユーザが閲覧可能に表示するようになっている。
さらに、通信端末装置10は、上記の推薦情報の表示状態において、推薦情報に含まれるいずれかの電子書籍の選択を検出すると、該当する電子書籍の購入するための処理を実行する構成を有している。
なお、電子書籍購入時に実行される処理は、従来のオンラインストアと同様であるため、詳細は省略する。
一方、通信端末装置10は、電子書籍表示機能を有しており、EPUB、JPEG、PDF等の形式にて生成された電子書籍データを表示する機能を有し、電子書籍を購入するための処理完了後に電子書籍サーバ装置30から配信される電子書籍データに基づく表示処理を実行して、対応する電子書籍のタイトル、本文及び当該電子書籍に掲載されている写真等を表示する構成を有している。
また、通信端末装置10は、ブラウジング機能を用いて、SNS、ブログサービス等の提供サーバ装置(図示しない)にアクセスして、投稿情報を投稿する機能を有している。
電子書籍サーバ装置30は、各種のデータベース(以下、「DB」と略す。)を有しており、オンラインストアのサービスに登録しているユーザを管理するとともに、オンラインストアに対するユーザのログイン等を管理し、ログイン状態のユーザに対する電子書籍の販売及び配信を行う。
特に、電子書籍サーバ装置30は、
(1)新刊や未登録の書籍などの新規に電子書籍が登録された場合に当該電子書籍の特徴(例えば、電子書籍の題材等)を表す語句を、コンテンツ特徴語として、当該登録対象の電子書籍データから抽出するコンテンツ特徴語抽出処理、
(2)新規に登録された電子書籍(以下、「新規登録電子書籍」という。)と既に登録済みの電子書籍との関連性を求め、所定の条件を具備する新規登録電子書籍及び登録済みの電子書籍双方における関連書籍のリスト(以下、「関連書籍リスト」という。)を生成する関連書籍選定処理、
(3)投稿情報から現在のトレンドを示すキーワードを投稿話題語として抽出して投稿話題語リストとしてリスト化する投稿話題語抽出処理及び所定時間毎に当該抽出した投稿話題語を更新する投稿話題語リスト更新処理、及び、
(4)投稿話題語リストに含まれる各投稿話題語を検索キーとして各電子書籍の特徴語スコアリストを検索し、当該投稿話題語を含む電子書籍を推薦対象の電子書籍として特定し、当該特定した電子書籍を推薦するための推薦情報を生成する推薦情報生成処理、
を実行する構成を有している。
そして、電子書籍サーバ装置30は、推薦情報生成処理によって生成した推薦情報を予め定められたタイミング及び予め定められた操作に従って通信端末装置10に配信してユーザに提示する構成を有している。
管理端末装置40は、オンラインストアの運営事業者のオペレータが利用するコンピュータであり、新刊が発行された場合などの未登録の電子書籍を登録する場合であってこれらの新規登録電子書籍データを新規に登録する場合に利用される。
具体的には、管理端末装置40は、オペレータによって操作される管理端末装置40と連動し、電子書籍サーバ装置30の電子書籍管理DBに、電子書籍に対応するデータ(以下、「電子書籍データ」という。) を、新規に登録(記録)ことが可能な構成を有している。
この構成により、本実施形態の電子書籍推薦システム1は、電子書籍に含まれる語句から、当該電子書籍の特徴(例えば、電子書籍の題材等)を示すコンテンツ特徴語を、直接抽出することができるので、精度の高いコンテンツ特徴語抽出を実現することができるとともに、ユーザの関心事等に関連する全ての電子書籍を確実に、かつ、積極的にユーザに推薦してユーザによる電子書籍の購入を促進することができるようになっている。
[2]電子書籍サーバ装置
[2.1]構成
次に、図2〜図6を用いて本実施形態の電子書籍サーバ装置30について説明する。なお、図2は、本実施形態の電子書籍サーバ装置30の構成を示すブロック図であり、図3〜図6は、それぞれ、電子書籍サーバ装置30に設けられたユーザ管理DB331、電子書籍管理DB332、投稿情報管理DB333及び著者管理DB334に記録されるデータの一例を示す図である。
本実施形態の電子書籍サーバ装置30は、図2に示すように、ネットワーク20に通信接続される通信制御部310と、各種のメモリとして機能するROM/RAM320と、各種のDBを有する記録装置330と、装置全体を制御する管理制御部340と、オンラインストアを管理するとともに、上記コンテンツ特徴語の抽出及び関連書籍選定処理と、投稿話題語抽出及び投稿話題語リスト更新処理と、推薦情報生成処理を実行するとともに、推薦情報を生成して、通信端末装置10に配信するデータ処理部350と、現在日時を特定するタイマ360と、を有する。なお、上記の各部は、バスBによって相互に接続され、各構成要素間におけるデータの転送が実行される。
通信制御部310は、所定のネットワークインターフェースであり、ネットワーク20を介して、通信端末装置10に通信接続され、各種データの授受を行う。
ROM/RAM320には、電子書籍サーバ装置30の駆動に必要な各種のプログラムが記録されている。また、ROM/RAM320は、各種の処理が実行される際のワークエリアとして用いられる。
記録装置330は、HDD(Hard Disc Drive)、又は、SSD(Solid State Drive)により構成される。そして、記録装置330は、ユーザ管理DB331と、電子書籍管理DB332と、投稿情報管理DB333と、著者管理DB334と、を有している。
ユーザ管理DB331は、各ユーザを管理するためのユーザ情報と位置情報とが記録されるDBである。例えば、ユーザ管理DB331には、図3に示すように、各ユーザを識別するためのユーザIDに対応付けて、当該ユーザの属性を示すユーザ情報が記録される。
特に、ユーザ情報には、
(1)ユーザの氏名と、
(2)住所と、
(3)アカウント名と、
(4)ログインパスワード(以下、「パスワード」という。)と、
(5)メールアドレスと、
(6)電子書籍の購入時に決済を行うための決済情報と、
(7)当該ユーザが購入済の電子書籍に対応する書籍ID(以下、「購入済み書籍ID」という。)と、
が含まれている。
例えば、図3には、ユーザID「U001」に対応するユーザのユーザ情報として、氏名「○○太郎」、住所「東京都北区***」、アカウント名「tarou」、パスワード「****」、メールアドレス「marumarutarou@123.co.jp」、決済情報「card1」、購入済電子書籍の書籍IDとして、「B001、B002、B102・・・」、なる情報が記録された場合におけるユーザ管理DB331のデータ記録例が示されている。
なお、ユーザ情報は、オンラインストアの初回利用時にサイトにて、ユーザに登録させるようにしてもよく、電子書籍サーバ装置30により、会員登録用サイトを開設するようにしてもよい。
電子書籍管理DB332は、オンラインストアにて、販売される書籍を管理するための情報がデータとして記録されるDBである。例えば、電子書籍管理DB332には、図4に示すように、
(1)各書籍を識別するための書籍IDと、
(2)当該書籍の属性を示す書籍属性情報と、
(3)表紙サンプルデータと、
(4) 電子書籍データと、
(5)特徴語スコアリストと、
(6)関連電子書籍リストと、
が対応付けて記録される。
特に、書籍属性情報には、
(2A)当該電子書籍の属するカテゴリ情報と、
(2B)当該電子書籍の著者を識別するための著者IDと、
(2C)当該電子書籍のシリーズ名と、
(2D)タイトルと、
(2E)価格情報と、
が含まれている。
そして、書籍属性情報は、オンラインストアにて、ユーザが電子書籍を購入する際に、通信端末装置10に配信されて、購入確認等を行うために利用される。
また、電子書籍管理DB332に記録される特徴語スコアリスト、及び、関連電子書籍リストは、後述するように、電子書籍の新規登録時に、コンテンツ特徴語の抽出及び関連書籍選定処理が実行されることによって生成されて記録される。
さらに、表紙サンプルデータは、例えば、PDF、JPEG、EPUB等の形式にて構成され、電子書籍サーバ装置30が、推薦情報の生成時に推薦情報に掲載するために用いられる。
例えば、図4には、書籍ID、「B001」、「B002」、「B003」、「B004」に対応する書籍が「小説」カテゴリに属し、「B001」及び「B002」が、「サスペンス」、「推理小説」に属しており、「B003」及び「B004」が、「ファンタジー」、「冒険もの」に属しているおり、「B001」に対応付けて,電子書籍データ「Data1」、表紙サンプルデータ「sample001」、特徴語スコアリスト「CL001」、関連電子書籍リスト「RBL001」が記録された場合のデータ記録例が示されている。そして、図7には、各書籍IDに対応する電子書籍のタイトル、価格等が格納された状態が示されている。
なお、例えば、本実施形態の電子書籍管理DB332は、本発明の「記録手段」を構成する。
投稿情報管理DB333は、ネットワーク20上に投稿されるニュース記事、ブログ、SNS上におけるつぶやきや意見等に対応する投稿情報を管理するためのDBである。例えば、投稿情報管理DB333には、図5(A)に示すように、
(A1)各投稿情報を識別するための投稿IDと、
(A2)ニュース、ブログ又はSNS等の投稿情報の種別(以下、「投稿種別」という。)と、
(A3)投稿情報本体と、
(A4)当該ニュース、ブログ若しくはSNS等をフォローし、又は、購読しているユーザの数を示すフォロー数と、
(A5)当該投稿情報の投稿日時と、
が対応付けて記録される。
また、投稿情報管理DB333には、上記投稿話題語抽出及び投稿話題語リスト更新処理によって、生成された投稿話題語リストを記録するためのフィールドが設けられており、このフィールドには、図5(B)に示すように、
(B1)投稿話題語リストの生成した日時、すなわち、投稿話題語抽出及び投稿話題語リスト更新処理の実行日時(以下、単に「実行日時」ともいう。)と、
(B2)当該生成された投稿話題語リストと、
が対応付けて記録されている。
なお、当該フィールドに記録される投稿話題語リストは、所定の時間間隔にて、後述するように、投稿話題語抽出及び投稿話題語リスト生成処理が実行されることによって生成されて、投稿情報管理DB333に記録されるとともに、推薦情報生成処理において更新される。
例えば、図5(A)には、新聞に関する投稿ID「P001」に対応する投稿情報であって、「この一ヶ月火山性微動が頻発し、専門家は、噴火の可能性について・・・」の内容、「50000」のフォロー数、及び、「2015年9月8日10::00」に投稿されたことを示すデータが示されている。
また、図5(B)には、「2015年9月8日10:00」から24時間おきに4回、投稿話題語リストが生成され、投稿情報管理DB333の投稿話題語リスト格納フィールドに記録された状態のデータが示されている。
著者管理DB334は、書籍の著者を管理するための情報がデータとして記録されるDBである。例えば、著者管理DB334には、図6に示すように、
(1)各著者に対応する著者IDと、
(2)著者名と、
(3)著者種別と、
(4)著書シリーズと、
が対応付けて記録される。
例えば、図6には、著者ID「A001」に対応する小説家「○○次郎」が、「探偵○○シリーズ」を著作している場合のデータを示している。
管理制御部340は、主に中央演算処理装置(CPU)によって構成され、プログラムを実行することによって、電子書籍サーバ装置30の各部を統合制御する。
データ処理部350は、独立した中央演算処理装置(CPU)によって構成され、又は、管理制御部340の中央演算処理装置(CPU)を用いて構成される。
そして、データ処理部350は、管理制御部340による制御の下、プログラムを実行することにより、ユーザ管理DB331、電子書籍管理DB332、投稿情報管理DB333及び著者管理DB334を管理するDB管理制御部351と、電子書籍の特徴語を抽出するコンテンツ特徴語抽出処理を行うコンテンツ特徴語抽出部352と、を実現する。
また、データ処理部350は、抽出されたコンテンツ特徴語に基づいて関連書籍選定処理を実行する関連書籍選定部353と、タイマ360と連動しつつ、投稿話題語抽出処理及び投稿話題語リスト生成処理の実行タイミングを制御する実行タイミング制御部354と、投稿情報取得部355と、投稿話題語抽出部356と、投稿話題語リスト生成更新部357と、陳列スコア算出部358と、オンラインストア管理部359と、を実現する。
なお、例えば、本実施形態のDB管理制御部351は、本発明の「管理手段」を構成し、実行タイミング制御部354は、投稿情報取得部355と連動して、「取得手段」を構成するとともに、投稿話題語抽出部356は、投稿話題語リスト生成更新部357と連動して、「投稿話題語抽出手段」を構成し、コンテンツ特徴語抽出部352は、「コンテンツ特徴語抽出手段」を構成し、陳列スコア算出部358及びオンラインストア管理部359は、連動して、「生成手段」及び「提供手段」を構成する。
DB管理制御部351は、ユーザ管理DB331、電子書籍管理DB332、投稿情報管理DB333及び著者管理DB334に対するデータの読み出し及び書き込みを管理するための各種の制御を行う。
具体的には、DB管理制御部351は、投稿情報が投稿された場合に、投稿情報管理DB333に対する投稿情報の記録を管理するとともに、電子書籍を新規登録する場合には、管理端末装置40と連動しつつ、電子書籍管理DB332に対する電子書籍データ等の登録を管理する。
DB管理制御部351は、SNS又はブログサービス等が提供するAPI(Application Programming Interface)を利用して各サーバ装置(図示内)などから投稿情報を取得し、投稿情報管理DB333に記録する。
コンテンツ特徴語抽出部352は、電子書籍の新規登録時においてコンテンツ特徴語抽出処理を実行する。特に、コンテンツ特徴語抽出部352は、コンテンツ特徴語抽出処理としては、
(1A)新規登録電子書籍に対して、書籍IDを割り当て、
(1B)各新規登録電子書籍データに含まれる語句に基づき、当該電子書籍に対応するコンテンツ特徴語を抽出し、
(1C)当該抽出したコンテンツ特徴語の出現回数に基づく特徴語スコアリストを生成し、
(1D)生成した特徴語リストを、電子書籍の書籍IDと対応付けて電子書籍管理DB332に記録させる、
各処理を実行する。
なお、本実施形態のコンテンツ特徴語抽出部352において実行されるコンテンツ特徴語抽出処理の詳細については後述する。
関連書籍選定部353は、電子書籍の新規登録時において、コンテンツ特徴語抽出処理に引き続いて実行される関連書籍選定処理を実行する。特に、関連書籍選定部353は、関連書籍選定処理としては、
(2A)コンテンツ特徴語抽出部352によって生成された特徴語スコアリストと、電子書籍管理DB332に記録された登録済み電子書籍の特徴語スコアリストと、の間における類似度を算出し、
(2B)算出された類似度に基づき、新規登録電子書籍との類似度が高い順に、登録済み電子書籍をソートして関連電子書籍リストを生成し、
(2C)DB管理制御部351と連動することによって新規登録電子書籍の書籍IDと対応付けて、関連電子書籍リストを電子書籍管理DB332に記録させ、
(2D)生成した関連電子書籍リストに含まれる既に登録済みの電子書籍に対応する関連電子書籍リストを更新する、
各処理を実行する。
なお、本実施形態の関連書籍選定部353において実行される関連書籍選定処理の詳細については後述する。
実行タイミング制御部354は、所定のサーバ定期実行システムに対応するプログラムを実行することにより、タイマ360にて検出される現在日時を監視して、時効タイミングの到来を検出すると、投稿情報取得部355に投稿話題語抽出及び投稿話題語リスト更新処理の開始命令を出力する。
投稿情報取得部355は、実行タイミング制御部354から実行命令を受けると、投稿話題語抽出部356及び投稿話題語リスト生成更新部357と連動して、投稿話題語抽出処理及び投稿話題語リスト生成処理を実行するための投稿情報を取得する。
具体的には、投稿情報取得部355は、現在日時をタイマ360に検出させ、当該現在日時の所定時間前(例えば、24時間前)から現在日時までに投稿された投稿情報を投稿情報管理DB333から取得する。
なお、投稿情報管理DB333が、記録装置330内に設けられず、ネットワーク20上の記録装置330又は他のサーバ装置に設けられる場合に、投稿情報取得部355は、当該装置から投稿情報を収集することによって取得してもよい。
投稿話題語抽出部356は、投稿情報取得部355によって取得された投稿情報に対して投稿話題語抽出処理を実行する。具体的には、投稿話題語抽出部356は、投稿話題語抽出処理としては、
(3A)取得された投稿情報に対して形態素解析を施して投稿情報に含まれる文字列を複数の語句に分割し、
(3B)分割した各語句の出現頻度をカウントし、
(3C)カウントされた各語句の出現頻度が、高い上位所定数の語句を投稿話題語候補として抽出し、
(3D)投稿話題語候補の各語句を検索キーとして、直近の10分間に投稿された投稿情報を検索し、当該検索によるヒット割合の高い所定数の語句を投稿話題語として抽出する、
各処理を実行する。
なお、本実施形態の投稿話題語抽出部356において実行される投稿話題語抽出処理の詳細については後述する。
投稿話題語リスト生成更新部357は、投稿話題語抽出部356により、抽出された投稿話題語に基づき、投稿話題語リストを生成する投稿話題語リスト生成処理を実行する。具体的には、投稿話題語リスト生成更新部357は、生成された投稿話題語リストを、現在日時(すなわち、実行日時)と対応付けて、投稿情報管理DB333の投稿話題語リスト格納フィールドに記録させる。
陳列スコア算出部358は、オンラインストア管理部359と連動して、ユーザがオンラインストアにアクセスした際に、既に生成された特徴語スコアリスト及び投稿話題語リストに基づいて推薦情報を生成する推薦情報生成処理を実行する。
特に、陳列スコア算出部358は、オンラインストア管理部359と連動し、ユーザによって通信端末装置10を用いてオンラインストアにアクセスされた際に、お勧めの電子書籍が陳列されたオンラインストアのトップページを推薦情報として生成する推薦情報生成処理を実行する。
具体的には、陳列スコア算出部358は、
(4A)投稿話題語リスト生成更新部357によって生成された投稿話題語リストに含まれる投稿話題語を検索キーとして、電子書籍管理DB332を検索し、当該投稿話題語と同一の語句をコンテンツ特徴語に含む1以上の電子書籍の特徴語スコアリストを読み出し、
(4B)読み出した各電子書籍の特徴語スコアリストに基づいて電子書籍毎の陳列スコア及び最終陳列スコアを算出し、
(4C)当該算出した陳列スコア及び最終陳列スコアを対応する投稿話題語リストに追加して、投稿話題語リストを更新し、
(4D)投稿話題語リストに含まれる最終陳列スコアの高い順に、電子書籍を並べつつ、推薦情報を生成してオンラインストア管理部359に提供する、
各処理を実行する。
なお、本実施形態の投稿話題語リスト生成更新部357において実行される推薦情報生成処理の詳細については後述する。
オンラインストア管理部359は、オンラインストアにおける電子書籍の販売を管理するための処理を行う。
また、オンラインストア管理部359は、通信制御部310が、通信端末装置10から自機のユーザに対応するユーザIDを指定した、ログイン要求を受信すると、当該受信された情報と、ユーザ管理DB331に記録されたデータに基づき、ログイン認証を行うとともに、当該ユーザによる購入指示がなされると、決済情報に従って、決済のための処理を実行する。
そして、オンラインストア管理部359は、決済の完了後に、当該電子書籍に対応する電子書籍データを該当する通信端末装置10に配信するとともに、当該電子書籍の書籍IDをユーザ管理DB331の当該ユーザに対応する購入済電子書籍格納フィールドに記録させる。
また、オンラインストア管理部359は、ユーザによって通信端末装置10を用いてオンラインストアにアクセスされた際に、陳列スコア算出部358に推薦情報を生成させ、当該生成させた推薦情報を対応する通信端末装置10に配信する。
[2.2]コンテンツ特徴語抽出処理
次に、図7を用いて、本実施形態のコンテンツ特徴語抽出処理について説明する。なお、図7は、本実施形態の電子書籍サーバ装置30において、新規登録電子書籍を登録する際に実行されるコンテンツ特徴語抽出処理を説明するためのイメージ図である。
コンテンツ特徴語抽出部352は、電子書籍の新規登録時に当該新規登録電子書籍のタイトル及び本文に対して形態素解析を実行し、タイトル及び本文の新規登録電子書籍に含まれる文字列を複数の語句(例えば、単語・熟語・慣用句等の形態素)に分割する。
また、コンテンツ特徴語抽出部352は、図7(A)に示すように、各語句が新規登録電子書籍にて出現する回数をカウントするとともに、図7(B)に示すように、各語句が出現する登録済みの電子書籍の数をカウントする。そして、コンテンツ特徴語抽出部352は、各語句の新規登録電子書籍において出現した回数を集計して総出現回数を算出する。
特に、コンテンツ特徴語抽出部352は、図7(A)に示すように、新規登録電子書籍に含まれる各語句(例えば、図7(A)の場合には、「試験」、「噴火」、「科学」、「火山」、「歴史」、「雷」等の各語句)と、当該語句の出現回数をカウントするためのカウンタとを対応させたリストを生成するとともに、各語句を検索キーとして新規登録電子書籍のタイトル及び本文を検索して各語句の出現回数をカウントする。
例えば、図7(A)には、「試験」が、「121回」、「噴火」が、「105回」、「科学」が「71回」、「火山」が、「56回」、「歴史」が、「35回」、「雷」が、「35回」、新規登録電子書籍に出現している場合のリスト例が示されている。また、例えば、図7(A)に示す出現回数がカウントされた場合に、コンテンツ特徴語抽出部352は、総出現回数=「3000」と算出する。
一方、コンテンツ特徴語抽出部352は、図7(B)に示すように、各語句と登録済みの電子書籍の数をカウントするためのカウンタとを対応付けたリストを生成するとともに、当該語句を検索キーとして、登録済みの電子書籍のタイトル及び本文を検索し、当該語句を含む電子書籍がヒットする度に出現書籍数をカウンタする。
例えば、図7(B)には、「試験」の出現する電子書籍が、「56冊」、「噴火」の出現する電子書籍が、「8冊」、「科学」の出現する電子書籍が、「78冊」、「火山」の出現する電子書籍が、「10冊」、「歴史」の出現する電子書籍が、「56冊」、「雷」の出現する電子書籍が、「10冊」登録済みである場合のリストが示されている。
他方、コンテンツ特徴語抽出部352は、カウントした各語句の出現回数と、出現書籍数と、総出現数と、を以下のTF(Term Frequency)−IDF(Inverse Document Frequency)に基づく(式1)に代入することにより、特徴語スコアSを算出し、当該算出した特徴語スコアSと、対応する語句と、を対応付けつつ、図7(C)に示すような特徴語スコアリストを生成する。
S=TF×IDF=(N÷M)×[log(X)÷(Y+1)]…(式1)
なお、(式1)において、「N」は、特徴語スコア算出対象となる語句の出現数を示し、「M」は、新規登録される電子書籍から抽出された全語句の総出現数を示す。また、(式1)において、「X」は、登録済み書籍数を示し、「Y」は、特徴語スコア算出対象語句の出現書籍数を示す。さらに、「総出現数」とは、新規登録電子書籍において抽出された全語句が、当該新規登録電子書籍に出現した回数の総和を示し、図7(A)に例示する場合には、「3000」となる。
そして、例えば、図7(A)及び(B)に例示する場合には、コンテンツ特徴語抽出部352は、語句「試験」についての特徴語スコアS(試験)と、語句「噴火」の特徴語スコアS(噴火)については、以下(式2)及び(式3)に示す値を算出する。
S(試験)=(105÷3000)×{log(100÷8)+1}=0.073…(式2)
S(噴火)=(121÷3000)×{log(100÷56)+1}=0.05…(式3)
最後に、コンテンツ特徴語抽出部352は、算出した特徴語スコアの値が大きくなる上位所定数の語句(例えば、1000語句程度)を、コンテンツ特徴語として、抽出するとともに、図7(C)に示すように、当該抽出したコンテンツ特徴語と、当該コンテンツ特徴語に対応する特徴語スコアと、に基づき、特徴語スコアリストを作成して、当該新規登録される電子書籍に対応する特徴スコアリストとして電子書籍管理DB332に登録する。
このとき、コンテンツ特徴語抽出部352は、新規登録される電子書籍に対して、各電子書籍を識別するための書籍IDを割り当てる。
例えば、既に99冊の電子書籍が登録済みの場合には、コンテンツ特徴語抽出部352は、書籍IDとして「100」を割り当て、当該割り当てられた書籍ID(すなわち、100)と、電子書籍データと、当該新規登録される電子書籍の表紙又はサンプルに対応する表紙サンプルデータと、生成された特徴語スコアリストと、を対応付けつつ、電子書籍管理DB332に登録させる。
なお、電子書籍データ及び表紙サンプルデータは、管理端末装置40に接続されたスキャナにより、電子書籍に対応する実書籍の表紙及び本文等を読み込み、EPUB、JPEG、PDF等の形式にてドキュメントファイル又は画像ファイルを作成されて登録されてもよく、これらの形式にて作成されたファイルをUSB(Universal Serial Bus)メモリ等に記録させておき、当該メモリから読み出されるようにしてもよい。
[2.3]関連書籍選定処理
次に、図8を用いて、本実施形態の関連書籍選定処理について説明する。なお、図8は、本実施形態の電子書籍サーバ装置30において、新規登録電子書籍を登録する際に実行される関連書籍選定処理を説明するためのイメージ図である。
関連書籍選定部353は、新規登録電子書籍に関する特徴語スコアリストと、既に登録済みの電子書籍に対応する特徴語スコアリストと、に基づき、電子書籍間の類似度を算出し、例えば、図8(A)に示すような新規登録電子書籍に対する関連電子書籍リストを作成して電子書籍管理DB332に登録する。
なお、関連書籍選定部353は、電子書籍間の類似度を算出する方法としては、任意の手法を用いる。例えば、関連書籍選定部353は、特徴語スコアリスト間のcos類似度を算出するようにしてもよく、特徴語スコアリストのユークリッド空間上における距離に基づき、類似度を算出するようにしてもよい。また、これらの類似度の算出手法は、従来と同様の技術であるため、その説明を省略する。
一方、関連書籍選定部353は、特徴語スコアリストに基づいて、新規登録電子書籍と、他の登録済みの電子書籍と、における各類似度を算出すると、当該類似度が最も高くなる順に電子書籍をソートするとともに、類似度が高い上位所定数の電子書籍(例えば、上位100冊程度)を関連電子書籍として特定し、類似度と既に登録済みの特定した電子書籍とを対応付けた新規登録電子書籍における関連電子書籍リストを生成する。
また、新規登録電子書籍を新規に登録した場合には、既に登録済みの電子書籍に対応する関連電子書籍リストを変更する必要性が生じる場合があるので、関連書籍選定部353は、電子書籍の新規登録時においては、既に登録済みの全ての電子書籍に対応する関連電子書籍リストを更新する。
例えば、新規登録される電子書籍の関連電子書籍リストが、図8(A)及び(B)に示す場合を想定する。
具体的には、図8(A)には、新規登録電子書籍(例えば、書籍ID「100」)と最も類似度の高い電子書籍の書籍IDとして、「2」が示されるとともに、その類似度として「0.061」が示されている。また、図8(B)には、既に登録済みの電子書籍の書籍ID「2」に対応する関連電子書籍リストにおいて、類似度が高い順の書籍IDとして「99」、「7」及び「71」が示されている。
また、書籍ID「2」に対応する関連電子書籍リストに含まれる類似度について、書籍ID「2」の電子書籍と、新規登録電子書籍(例えば、書籍ID「100」)と、の類似度「0.061」とを比較すると、新規登録電子書籍が書籍ID「2」に対応する電子書籍の関連電子書籍リストにおける地位は、最上位から3番目となっている。
このような状況下において、関連書籍選定部353は、図8(C)に示すように、書籍ID「2」に対応する関連書籍リストにおいて求めた類似度「0.061」に基づいて、書籍ID「2」の電子書籍に対応する関連電子書籍リストを更新する。
なお、関連書籍選定部353は、各既に登録済みの電子書籍に対して上記の更新処理を実行する。
[2.4]投稿話題語抽出処理
次に、図9を用いて、本実施形態の投稿話題語抽出処理について説明する。なお、図9は、本実施形態の電子書籍サーバ装置30において実行される投稿話題語抽出処理を説明するためのイメージ図である。
投稿話題語抽出部356は、投稿情報取得部355によって前回の投稿情報取得タイミング(例えば、1日前)から今回の取得タイミングまでの間(すなわち、1日間)に投稿された投稿情報が収集及び取得されると、当該取得された投稿情報に対して、形態素解析を実行し、当該投稿情報に含まれる文字列を複数の語句に分割する。
そして、投稿話題語抽出部356は、取得した全ての投稿情報における各語句の出現回数をカウントし、カウントが完了すると、出現頻度の高い語句(すなわち、出現回数の多い語句)の上位所定数(例えば、50語)を、投稿情報において、話題となっている語句(すなわち、現在のトレンドを示す投稿話題語)の候補を投稿話題語候補として抽出する。
また、実世界におけるトレンドを示す語句は、古い投稿情報よりも、新しい投稿情報に含まれている可能性が高いため、投稿話題語抽出部356は、収集された投稿情報から、直近10分間に投稿された投稿情報を抽出し、当該抽出された投稿情報に対して、各投稿話題語候補を検索キーとして検索を実行し、検索ヒット割合の高い上位所定数の語句(例えば、上位10語句程度)を投稿話題語として抽出する。
さらに、投稿話題語抽出部356は、各投稿話題語に対応する語句が出現した頻度に応じて、図9に示すような投稿話題語リストを生成する。具体的には、投稿話題語リストは、図9に示すように、
(1)各投稿話題語と、
(2)投稿話題語が投稿情報に出現した回数の合計と、
(3)投稿話題語候補を検索キーとして、直近10分間に投稿された投稿情報を検索した際の検索ヒット回数と、
(4)投稿話題語候補の検索ヒット割合と、
が対応付けられた生成される。
[2.5]推薦情報生成処理
次に、図10を用いて、本実施形態の推薦情報生成処理について説明する。なお、図10は、本実施形態の電子書籍サーバ装置30において実行される推薦情報生成処理を説明するためのイメージ図である。
陳列スコア算出部358は、
(1)直近の投稿話題語抽出処理及び投稿話題語リスト生成処理により作成された投稿話題語リストに含まれる各投稿話題語を検索キーとして電子書籍管理DBに記録された特徴語スコアリストを検索し、
(2)投稿話題語を含む電子書籍を推薦対象の電子書籍として特定し、
(3)特定した電子書籍の特徴語スコアリストを電子書籍管理DB332から読み出し、
(4)特徴語スコアリストに含まれる特徴語スコアを対応する書籍IDと対応付けつつ、投稿話題語リストに追加して投稿話題語リストを更新する。
特に、陳列スコア算出部358は、図10(A)に示すように、
(4A)対応する投稿話題語と、同一の語句に関する特徴語スコアの高い順に、電子書籍をソートし、
(4B)当該ソート後の順序にて、書籍ID及び特徴語スコアを対応付けて投稿話題語リストに追記し、
投稿話題語リストを更新する。
例えば、投稿話題語「噴火」に対応するコンテンツ特徴語を含む電子書籍として、書籍ID「1」「4」及び「2」等が特定され、これらの電子書籍に対応する特徴語スコアリストが読み出された場合には、図10(A)に示すように、特徴語スコアの高いものから順に、書籍ID「1」に対応付けて、「0.51」、書籍ID「4」に対応付けて、「0.44」、書籍ID「2」に対応付けて、「0.31」等の特徴語スコアが、投稿話題語リストに追加される。
また、陳列スコア算出部358は、投稿話題語毎に、かつ、電子書籍毎の陳列スコアを算出する。特に、陳列スコア算出部358は、各投稿話題語の検索ヒット割合と、当該投稿話題語に対応する特徴語スコアと、を乗算して、電子書籍毎の陳列スコアを算出する。
例えば、投稿話題語リストが、図10(A)に示すものである場合に、陳列スコア算出部358は、「噴火」に対応する検索ヒット割合「0.61」と、書籍ID「1」、「4」及び「2」等に対応する特徴語スコア「0.51」、「0.44」及び「0.31」等と、を各々、乗算し、投稿話題語「噴火」に対する書籍ID「1」、「4」及び「2」等の各々に対応する陳列スコアとして、「0.34」、「0.29」及び「0.2」等を算出する。
そして、陳列スコア算出部358は、図10(B)に示すように、算出した陳列スコアを投稿話題語リストに追記して投稿話題語リストを更新する。
このとき、陳列スコア算出部358は、1の電子書籍に複数の投稿話題語が含まれる場合に、各投稿話題語の検索ヒット割合と、当該書籍における同一語句の特徴語スコアを乗算した結果値を加算して、当該電子書籍の最終陳列スコアとして設定する。
例えば、図10(B)には、書籍ID「1」に対応する電子書籍に「噴火」、「火山」及び「雷」という、3つの投稿話題語が含まれており、各投稿話題語についての陳列スコアが「0.34」、「0.20」及び「0.04」となっている。この場合には、陳列スコア算出部358は、「0.34+0.2+0.04=0.58」を最終陳列スコアに設定する。
一方、図10(A)の書籍ID「13」等のように、1の電子書籍に1の投稿話題語のみが含まれている場合には、陳列スコア算出部358は、当該投稿話題語に対応する特徴語スコアと、投稿話題語の検索ヒット割合を乗算し、当該乗算結果を、そのまま、最終陳列スコアに設定する。
そして、陳列スコア算出部358は、書籍毎の最終陳列スコアの算出が完了すると、当該算出した最終陳列スコアを各書籍IDに対応付けて登録する。
他方、陳列スコア算出部358は、投稿話題語リストに対する陳列スコア及び各書籍における最終陳列スコアの登録を完了すると、最終陳列スコアの高い順に、電子書籍を並べて推薦情報を生成する。このとき、陳列スコア算出部358は、各電子書籍の表示又はサンプルに対応するデータと、各電子書籍の書籍IDと、を対応付けつつ、推薦情報を生成する。
なお、オンラインストア管理部359は、推薦情報が生成されると、オンラインストアにアクセスしたユーザの通信端末装置10に生成した推薦情報を配信する。
また、推薦情報の生成においては、各書籍に対応する投稿話題語の中で、特徴語スコアが最も高い投稿話題語を代表話題語として抽出するとともに、例えば、「トレンドキーワード噴火についての関連書籍です。」等の文字列とともに当該代表投稿話題語を推薦情報に記載するようにしてもよい。
[3]電子書籍推薦システムの動作
次に、図11〜図14を参照しつつ、本実施形態の電子書籍推薦システム1において実行される処理について説明する。
なお、図11は、本実施形態の電子書籍サーバ装置30において実行されるコンテンツ特徴語抽出処理及び関連書籍選定処理を示すフローチャートであり、図12は、本実施形態の電子書籍サーバ装置30において実行される投稿話題語抽出処理及び投稿話題語リスト更新処理を示すフローチャートである。また、図13は、本実施形態の電子書籍サーバ装置30において推薦情報を生成する際に実行される処理を示すフローチャートであり、図14は、本実施形態の電子書籍サーバ装置30において生成される推薦情報の一例を示す図である。
[3.1]コンテンツ特徴語抽出処理及び関連書籍選定処理
まず、図11を用いて本実施形態の電子書籍サーバ装置30において実行されるコンテンツ特徴語抽出処理及び関連書籍選定処理について説明する。
本処理は、オンラインストアのオペレータが、管理端末装置40に対して新規に電子書籍を登録する旨の操作を行った際に実行される処理である。
また、この処理に先立って、ユーザ管理DB331、電子書籍管理DB332、投稿情報管理DB333及び著者管理DB334には、必要なデータが既に記録済みであるものとする。特に、電子書籍管理DB332には、登録済みの電子書籍に関する各種のデータが記録済であるものとする。
まず、コンテンツ特徴語抽出部352は、管理端末装置40からの指示を受信すると(ステップSa1)、電子書籍サーバ装置30の当該新規登録される新規登録電子書籍に書籍IDを割り当てる(ステップSa2)。
このとき、コンテンツ特徴語抽出部352は、DB管理制御部351と連動して、電子書籍管理DB332における最終書籍IDを読み出し、当該書籍IDに続く、連番の書籍IDを割り当てる。
次いで、コンテンツ特徴語抽出部352は、管理端末装置40から供給される新規登録電子書籍の電子書籍データに基づき、当該新規登録電子書籍のタイトル及び本文に対して形態素解析を施し、タイトル及び本文を複数の語句に分割する(ステップSa3)。
次いで、コンテンツ特徴語抽出部352は、各語句が新規登録電子書籍データに出現する回数をカウントするとともに、当該新規登録電子書籍における全語句の総出現数を算出する(ステップSa4)。このとき、コンテンツ特徴語抽出部352は、図7(A)に例示するようなリストを生成しつつ、各語句の出現数をカウントする。
次いで、コンテンツ特徴語抽出部352は、カウントされた各語句の出現回数に応じて、出現回数の多い、上位所定数の語句(例えば、上位1000位程度までの語句)を、コンテンツ特徴語として抽出する(ステップSa5)。
次いで、コンテンツ特徴語抽出部352は、抽出したコンテンツ特徴語を検索キーとして、電子書籍管理DB332に記録されたデータを検索し、当該コンテンツ特徴語の出現する電子書籍数をカウントする(ステップSa6)。このとき、コンテンツ特徴語抽出部352は、図7(B)に例示するようなリストを生成しつつ、各コンテンツ特徴語の出現する電子書籍数をカウントする。
次いで、コンテンツ特徴語抽出部352は、各コンテンツ特徴語の出現数と、出現書籍数と、総出現数と、を上記(式1)に代入して演算を実行し、当該演算の結果に応じて、特徴語スコアを算出する(ステップSa7)。
次いで、コンテンツ特徴語抽出部352は、図7(C)に示すような特徴語スコアリストを生成する(ステップSa8)。
次いで、関連書籍選定部353は、当該電子書籍の特徴語スコアリストと、電子書籍管理DB332に記録済みの登録済み電子書籍の特徴語スコアリストに基づき、各登録済み電子書籍との類似度を算出する(ステップSa9)。
次いで、関連書籍選定部353は、算出した類似度に基づき、図8(A)に示す関連電子書籍リストを生成するとともに、書籍IDと対応付けつつ、電子書籍管理DB332に記録させ、かつ、他の電子書籍に関する関連電子書籍リストを更新して(ステップSa10)、本処理を終了する。
この処理により、電子書籍管理DB332には、新規登録される電子書籍の電子書籍データ、表紙サンプルデータ、特徴語スコアリスト及び関連電子書籍リストが登録される。また、登録済みの電子書籍に関する関連電子書籍リストは、更新され、後に新たな電子書籍を登録する際に、又は、推薦情報を生成する際に利用可能となる。
[3.2]投稿話題語抽出及び投稿話題語リスト更新処理
次に、図12を用いて本実施形態の電子書籍サーバ装置30において実行される投稿話題語抽出及び投稿話題語リスト更新処理について説明する。
この処理は、実行タイミング制御部354により、処理の開始タイミングの到来が、検出され、かつ、実行タイミング制御部354から実行命令が、出力された場合に、投稿情報取得部355と、投稿話題語抽出部356と、投稿話題語リスト生成更新部357と、が連動することにより実行される処理である。
また、この処理に先立って、ユーザ管理DB331、電子書籍管理DB332、投稿情報管理DB333及び著者管理DB334には、必要なデータが既に記録済みであるものとする。すなわち、電子書籍サーバ装置30においては、上記コンテンツ特徴語抽出及び関連書籍選定処理が完了し、電子書籍管理DB332に特徴語スコアリスト及び関連電子書籍リストが登録済みの状態になっているものとする。
まず、投稿情報取得部355は、タイマ360と連動して、予め定め得られた日時になったことを検出すると(ステップSb1)、現在日時を投稿情報管理DB333に記録された前回の実行日時と比較し、前回の実行日時から現在日時までの間に投稿された投稿情報を投稿情報管理DB333から検索し、該当する投稿情報を取得する(ステップSb2)。
次いで、投稿話題語抽出部356は、取得された投稿情報に対して、形態素解析を施し、当該投稿情報を複数の語句に分割する(ステップSb3)。
次いで、投稿話題語抽出部356は、分割によって得られた各語句が、ステップSb2において取得された投稿情報に出現する回数をカウントする(ステップSb4)。
次いで、各語句の出現回数のカウントが完了すると、投稿話題語抽出部356は、出現回数に応じて、所定数の投稿話題語候補を抽出する(ステップSb5)。
次いで、投稿話題語抽出部356は、ステップSb2において取得された投稿情報において、現在日時より10分前から現在までの10分間に投稿された投稿情報を抽出して当該投稿情報を投稿話題語候補の語句により検索し、当該検索によって各投稿話題語候補の語句がヒットした回数をカウントする(ステップSb6)。
次いで、投稿話題語抽出部356は、各語句の検索ヒット割合を算出し(ステップSb7)、当該算出した検索ヒット割合の高い順に投稿話題語候補をソートして投稿話題語を抽出する(ステップSb8)。
そして、投稿話題語リスト生成更新部357は、投稿話題語抽出部356によってソートされた順に投稿話題語と、投稿話題語出現数と、検索ヒット回数と、を対応付けつつ、投稿話題語リストを生成するとともに、投稿情報管理DB333の投稿情報格納フィールドに現在日時と対応付けつつ登録し(ステップSb9)、本処理を終了する。
[3.3]推薦情報生成処理
次に、図13を用いて本実施形態の電子書籍サーバ装置30において実行される推薦情報生成処理について説明する。
本処理は、ユーザが通信端末装置10を用いて、オンラインストアにアクセスした際に、陳列スコア算出部358及びオンラインストア管理部359が連動することによって実行される処理である。
まず、オンラインストア管理部359は、ユーザによって通信端末装置10を用いてオンラインストアにアクセスしたことを検出すると(ステップSc1)、陳列スコア算出部358は、投稿情報管理DB333を検索し、直近に生成された投稿話題語リストを実行時間に基づいて特定するとともに、当該特定された投稿話題語リストを読み出し、ROM/RAM320に記録させる(ステップSc2)。
次いで、陳列スコア算出部358は、投稿話題語リストに含まれるいずれかの投稿話題語を検索キーとして、電子書籍管理DB332を検索して、当該投稿話題語をコンテンツ特徴語として含む電子書籍を推薦対象の電子書籍として特定する(ステップSc3)。
次いで、陳列スコア算出部358は、このようにして特定された推薦対象の電子書籍に対応する、特徴語スコアリストと、表紙サンプルデータを電子書籍管理DB332から読み出し、ROM/RAM320に記録させる(ステップSc4)。
次いで、陳列スコア算出部358は、投稿話題語リストに含まれる検索ヒット割合と、特徴語スコアと、を乗算して電子書籍毎の陳列スコアを算出し、投稿話題語リストに追加しつつ、投稿話題語リストを更新する(ステップSc5)。
次いで、陳列スコア算出部358は、当該電子書籍に含まれる投稿話題語が、1つであるか否かを判定し(ステップSc6)、1つである場合には、ステップSc5において算出した陳列スコアを最終陳列スコアに設定し、投稿話題語リストに追記する(ステップSc7)。
一方、当該電子書籍に2以上の投稿話題語が含まれる場合には、陳列スコア算出部358は、当該推薦対象の電子書籍に含まれる各投稿話題語の陳列スコアを加算し、当該加算値を当該電子書籍の最終陳列スコアに設定して投稿話題語リストに追加する(ステップSc8)。
次いで、陳列スコア算出部358は、最終陳列スコアの高い順にステップSc2において特定した電子書籍をソートする(ステップSc9)。
次いで、陳列スコア算出部358は、最終陳列スコアを投稿話題語毎に加算して、加算値が最も大きくなる投稿話題語を代表投稿話題語に特定し(ステップSc10)、特定した代表投稿話題語と最終陳列スコアとに基づいて電子書籍を陳列させた推薦情報を生成する(ステップSc11)。例えば、陳列スコア算出部358は、代表投稿話題語を表示しつつ、最終陳列スコア順に電子書籍を陳列させた推薦情報を生成する。
なお、このとき、陳列スコア算出部358は、各推薦電子書籍の表紙等と、書籍IDと、を対応付けつつ、推薦情報を生成する。また、陳列スコア算出部358は、オンラインストア管理部359は、ソート後の順序に従って、表紙サンプルデータを配置して、図14に例示するような推薦情報を生成する。
最後に、オンラインストア管理部359は、生成された推薦情報を通信端末装置10に配信して(ステップSc12)、本処理を終了する。
なお、推薦情報を受信した通信端末装置10においては、推薦情報に基づき、投稿話題語から、抽出されたトレンドに合致する電子書籍が表示され、スクロールしていくと、次々に関連する電子書籍が表示される。
以上説明したように、本実施形態の電子書籍推薦システム1は、電子書籍のタイトル及び本文から、当該電子書籍の特徴を示すコンテンツ特徴語を抽出するとともに、投稿情報から、現在のトレンドを示す投稿話題語を抽出し、少なくとも1の投稿話題語をコンテンツ特徴語として含む電子書籍を最終陳列スコアに応じて並べ変えつつ、推薦情報を生成し、ユーザに提供することができる。
したがって、本実施形態の電子書籍推薦システム1は、オンラインストストアに立ち寄ったユーザに対して、電子書籍等のデジタルコンテンツを積極的に推薦するとともに、当該推薦時におけるデジタルコンテンツの特定精度を向上させ、適切なコンテンツ推薦を行うことができる。
なお、上記の推薦情報生成処理においては、オンラインストアにアクセスした際に実行されるが、これに代えて、予め定められたタイミングにおいてバッチ処理等で処理して推薦情報を生成して所定のDBに登録し、オンラインストアへのアクセス時に、当該登録された推薦情報を当該DBから読み出して利用してもよい。
[4]変形例
[4.1]変形例1
本変形例は、上記実施形態において、オンラインストアにアクセスされた際に、投稿話題語と同一の語句を含む電子書籍を推薦対象として特定し、かつ、当該特定された電子書籍を最終陳列スコアに基づいて推薦情報を生成する点に代えて、所定の電子書籍を指定する旨のユーザの入力操作を受け付けた場合に、当該電子書籍に関連する他の電子書籍を推薦する推薦情報を生成する点に特徴がある。
なお、その他の構成は、上記実施形態と同様の構成であり、特に明記しない場合には、同一部材には同一の符号を付しその説明を省略する。
また、本変形例において、このような機能を実現するため、オンラインストア管理部359は、通信端末装置10に対する推薦情報の配信した後に、通信端末装置10から、1の電子書籍に対応する書籍IDを受信した場合に、DB管理制御部351と連携して、陳列スコア算出部358に、当該書籍IDに対応する電子書籍の関連電子書籍リストを読み出し、当該読み出した関連電子書籍リストに基づいて推薦情報を生成させる。
そして、陳列スコア算出部358は、関連電子書籍リストに含まれる書籍IDの順に(すなわち、類似度が高い順に)表紙サンプルデータを並べ替えつつ、当該推薦情報を生成する。
なお、通信端末装置10には、ユーザによって選択された電子書籍の関連電子書籍の表紙等が、表示されてユーザに関連電子書籍の一覧が提示される。また、上記実施形態における推薦情報は、例えば、本発明の「第1の推薦情報」に相当するとともに、本変形例における推薦情報は、「第2の推薦情報」に相当する。
この構成により、本変形例の電子書籍推薦システム1は、トレンドに即した電子書籍の推薦のみならず、各推薦対象電子書籍の関連電子書籍をユーザに推薦し、オンラインストアにおける電子書籍の販売を促進することができる。
[4.2]変形例2
上記実施形態においては、陳列スコア算出部358が、全ての投稿情報を等価に扱いつつ、各電子書籍の陳列スコアを算出していたが、各投稿情報の種別(新聞、ブログ、SNS等)に応じた重み付けを行いつつ、陳列スコアを算出するようにしてもよい。
この場合には、例えば、SNSの投稿情報に対して「1」、新聞の投稿情報に対して「2」等の重み付け係数を予め定めておき、当該係数を対応する投稿話題語の検索ヒット割合(図4(A)参照)に乗算した後に、陳列スコアを算出するようにすればよい。
なお、上記に代えて、各投稿情報に対応するフォロー数に基づき、投稿話題語の検索ヒット割合に対して重み付けを行いつつ、陳列スコアを算出するようにしてもよい。
また、投稿情報にタイトルが存在するとき、本文とタイトルで出現数、又は、検索ヒット割合に重み付けを行ってもよい。例えば、タイトルは本文を要約したものが多く、人の目につきやすいという性質がある。
このため、本構成を採用する場合に、タイトルの語句は本文での出現回数10回分とする等の方法を採用することができる。
この構成により、トレンドになりやすい投稿話題語に対応する陳列スコアの重みを大きくして、適切な電子書籍を選別することができる。
[4.3]変形例3
上記実施形態においては関連書籍選定時に、電子書籍のカテゴリ及び著者を加味せずに関連電子書籍を決定する構成を採用したが、電子書籍の属するカテゴリ及び著者に応じて、関連電子書籍を決定するようにしてもよい。
例えば、著者に応じて推薦書籍を決定する場合には、関連書籍選定部353は、
(1)著者管理DB334に記録された情報に基づき、新規登録される電子書籍と同一の著者により執筆された電子書籍を特定し、
(2)当該電子書籍に関する特徴語スコアリストと新規登録される電子書籍の特徴語スコアリストに基づき、類似度を算出し
(3)算出した類似度の高い所定数の電子書籍を関連電子書籍として特定する。
なお、関連書籍選定部353は、同一カテゴリの電子書籍に対する重み付けを大きくしつつ、関連電子書籍を決定するようにしてもよい。
また、カテゴリに応じて推薦書籍を決定する場合には、関連書籍選定部353は、
(1)電子書籍管理DB332に記録されたデータに基づき、新規登録される電子書籍と同一のカテゴリに属する登録済み電子書籍を特定し、
(2)当該電子書籍に関する特徴語スコアリストと新規登録される電子書籍の特徴語スコアリストに基づき、類似度を算出し
(3)算出した類似度の高い所定数の電子書籍を関連電子書籍として特定する。
さらに、同一カテゴリの電子書籍に対する重み付けを大きくしつつ、関連電子書籍を決定するようにしてもよい。
上記に加えて、ユーザの購買済み書籍に応じて、陳列スコアに重み付けを行ってもよい。この場合に、陳列スコア算出部358は、ユーザ管理DB331に記録された購入済電子書籍の書籍IDからユーザのよく購入する電子書籍のカテゴリを特定し、当該特定したカテゴリの電子書籍に関する陳列スコアの重みを大きくする。この結果、ユーザの嗜好に合致する電子書籍を推薦対象として特定することができる。
[4.4]変形例4
上記実施形態においては、過去の投稿話題語リストを加味することなく、直近の投稿話題語リストに基づき、陳列スコアを算出し、当該算出された陳列スコアに基づいて、推薦対象となる電子書籍を決定する構成を採用したが、過去に生成された投稿話題語リストを利用しつつ、陳列スコアPを算出するようにしてもよい。
例えば、陳列スコア算出部358は、各々の経過時間に応じた重み付けを行いつつ、陳列スコアを算出するようにすればよい。この場合に、陳列スコア算出部358は、例えば、(式4)を用いて算出する。
P={(E(n)×F)×1}+{(E(n−1)×F)×0.5}
+{(E(n−2)×F)×0.3} …(式4)
なお、(式4)において、「E」は、投稿話題語ヒット割合を示し、「n」は、タイミングを示す。また、(式4)において、「F」は、特徴語スコアと示す。さらに、上述の(式4)は、前2回のヒット割合を用いているが、係数を変化させて前3回以上のヒット割合を持ち手もよい。
この構成により、 ゆるやかに投稿話題語をフェードアウトすることで、情報感度がそれほど高くないユーザに対しても購入の動機付けを行うことが可能となる。
[4.5]変形例5
また、ユーザの購買済み書籍に応じて、陳列スコアに重み付けを行ってもよい。この場合に、陳列スコア算出部358は、ユーザ管理DB331に記録された購入済電子書籍の書籍IDからユーザのよく購入する電子書籍のカテゴリを特定して、当該カテゴリの電子書籍に関する陳列スコアの重みを大きくする。この構成により、ユーザの嗜好に合致する電子書籍を推薦対象として、特定することができる。
[4.6]変形例6
上記実施形態においては、購買済み書籍の著者情報からよく読む著者の順位をあげる構成にしてもよい。この構成を採用することによって、ユーザの嗜好に合致する電子書籍の優先度を向上させて、電子書籍の販売を促進することができる。
[4.7]変形例7
上記実施形態においては、システムの構成を簡略化し、かつ、当該システムの構築を容易にするため、ユーザ管理DB331と、電子書籍管理DB332と、投稿情報管理DB333と、著者管理DB334を、電子書籍サーバ装置30の記録装置330内に設ける構成を採用しているが、記録装置330をネットワークに直接的に接続し、電子書籍サーバ装置30、管理端末装置40、ネットワーク20上に設けられた図示せぬSNS提供サーバ装置、ブログサービスの提供サーバ装置、又は、ニュースサイトの運営サーバ装置等から直接、アクセスできる構成としてもよい。
特に、投稿情報管理DB333に関しては、投稿情報の種別(ニュース記事、SNSのつぶやき、意見、ブログ等)に応じて、分割し、対応するサービスを提供するサーバ装置の記録装置に振り分けつつ、持たせる構成としてもよい。
1 … 電子書籍推薦システム
10 … 通信端末装置
20 … ネットワーク
30 … 電子書籍サーバ装置
310 … 通信制御部
320 … ROM/RAM
330 … 記録装置
331 … ユーザ管理DB
332 … 電子書籍管理DB
333 … 投稿情報管理DB
334 … 著者管理DB
340 … 管理制御部
350 … データ処理部
351 … DB管理制御部
352 … コンテンツ特徴語抽出部
353 … 関連書籍選定部
354 … 実行タイミング制御部
355 … 投稿情報取得部
356 … 投稿話題語抽出部
357 … 投稿話題語リスト生成更新部
358 … 陳列スコア算出部
359 … オンラインストア管理部

Claims (11)

  1. ネットワークを介して接続された通信端末装置に、文字列を含むコンテンツに関する情報を推薦情報として提供する情報提供装置であって、
    前記コンテンツを識別するためのコンテンツ識別情報と、当該コンテンツ識別情報に対応するコンテンツデータと、が対応付けて複数のデータが記録される記録手段を管理する管理手段と、
    前記コンテンツデータに含まれる文字列を構成する各語句の出現頻度に応じて、当該コンテンツデータの特徴を示す語句をコンテンツ特徴語として抽出するコンテンツ特徴語抽出手段と、
    前記抽出されたコンテンツ特徴語に基づき、前記記録手段に記録されたデータの中から前記特徴が関連する複数のコンテンツデータを特定する特定手段と、
    前記特定されたコンテンツデータの特徴を含む情報をそれぞれ関連付けた推薦情報を生成する生成手段と、
    前記生成された前記推薦情報を第1の推薦情報として関連付けてユーザに閲覧可能に前記通信端末装置に提供する提供手段と、
    を具備することを特徴とする、情報提供装置。
  2. 請求項1に記載の情報提供装置において、
    実世界において発生した各種の事象に対する文字列を含む情報であって、仮想世界上に投稿される投稿情報を取得する取得手段と、
    前記取得された投稿情報に含まれる文字列に基づき、前記投稿情報において出現頻度に関して所定の条件を具備する語句を投稿話題語として抽出する投稿話題語抽出手段と、
    を更に有し、
    前記特定手段が、
    前記抽出された投稿話題語と前記コンテンツ特徴語に基づき、前記記録手段に記録されたデータの中から前記特徴が関連する複数のコンテンツデータを特定する、情報提供装置。
  3. 請求項2に記載の情報提供装置において、
    前記投稿話題語抽出手段が、
    予め定められたタイミングから所定時間前の期間内に投稿された前記投稿情報を抽出し、当該抽出した投稿情報の中から出現頻度について前記所定の条件を具備する語句を前記投稿話題語として抽出する、情報提供装置。
  4. 請求項2又は3に記載の情報提供装置において、
    前記投稿話題語抽出手段が、
    前記投稿情報における各語句の出現頻度に対して、当該語句を含む前記投稿情報の種別に応じた係数による重み付けを行うとともに、当該重み付けされた出現頻度について前記所定の条件を具備する語句を前記投稿話題語として抽出する、情報提供装置。
  5. 請求項2〜4のいずれか1項に記載の情報提供装置において、
    前記投稿話題語抽出手段が、
    前記投稿情報における、各語句の出現頻度に対して、当該語句が含まれる部位に応じた係数による重み付けを行うとともに、当該重み付けされた出現頻度について前記所定の条件を具備する語句を投稿話題語として抽出する、情報提供装置。
  6. 請求項2〜5のいずれか1項に記載の情報提供装置において、
    前記投稿情報に対して、読者が設定されている場合に、
    前記投稿話題語抽出手段が、
    前記投稿情報における、語句の出現頻度に対して、当該投稿情報に設定されている読者数に応じた係数による重み付けを行うとともに、当該重み付けされた出現頻度について前記所定の条件を具備する語句を投稿話題語として抽出する、情報提供装置。
  7. 請求項2〜6のいずれか1項に記載の情報提供装置において、
    前記投稿話題語抽出手段が、
    所定の時間周期にて、前記投稿話題語を抽出する場合に、
    今回の抽出タイミングと、前回以前の抽出タイミングと、の時間差に応じた係数と、過去における投稿話題語の抽出時における各語句の出現頻度と、を乗算するとともに、当該乗算後の出現頻度と、今回の抽出タイミングにおける各語句の出現頻度に基づき、前記投稿話題語を抽出する、情報提供装置。
  8. 請求項1〜7のいずれか1項に記載の情報提供装置において、
    前記コンテンツ特徴語抽出手段が、
    前記コンテンツデータに含まれる各語句の出現頻度に応じて、当該語句の重要度を示す第1の特徴量を算出するとともに、当該第1の特徴量が所定の条件を満たす語句を前記コンテンツ特徴語として抽出する、情報提供装置。
  9. 請求項8に記載の情報提供装置において、
    前記特定手段が、
    前記算出された第1の特徴量に基づき、対応するコンテンツデータ全体の特徴を示す第2の特徴量を算出し、当該第2の特徴量に基づき、前記記録手段に記録されたデータの中から前記特徴が関連する複数のコンテンツデータを特定する、情報提供装置。
  10. 請求項9に記載の情報提供装置において、
    前記第2の特徴量に基づき、前記コンテンツデータ間の類似度を算出する類似度算出手段を更に有し、
    前記提供された推薦情報に基づき、前記通信端末装置において、1の前記コンテンツデータが指定された場合に、
    前記生成手段が、
    当該指定されたコンテンツデータと、前記類似度が所定の条件を満たす前記コンテンツデータを関連コンテンツデータとして特定し、当該特定された関連コンテンツデータの特徴を含む情報を推薦情報として、生成するとともに、
    前記提供手段が、
    前記生成された推薦情報を第2の推薦情報として、対応する通信端末装置に提供する、情報提供装置。
  11. ネットワークを介して接続された通信端末装置に、文字列を含むコンテンツに関する情報を推薦情報として提供する情報提供装置としてのコンピュータを、
    前記コンテンツを識別するためのコンテンツ識別情報と、当該コンテンツ識別情報に対応するコンテンツデータと、が対応付けて複数のデータが記録される記録手段を管理する管理手段、
    前記コンテンツデータに含まれる文字列を構成する各語句の出現頻度に応じて、当該コンテンツデータの特徴を示す語句をコンテンツ特徴語として抽出するコンテンツ特徴語抽出手段、
    前記抽出されたコンテンツ特徴語に基づき、前記記録手段に記録されたデータの中から前記特徴が関連する複数のコンテンツデータを特定する特定手段、
    前記特定されたコンテンツデータの特徴を含む情報をそれぞれ関連付けた推薦情報を生成する生成手段、
    前記生成された前記推薦情報を第1の推薦情報として関連付けてユーザに閲覧可能に前記通信端末装置に提供する提供手段、
    として機能させるプログラム。
JP2015195451A 2015-09-30 2015-09-30 情報提供装置及びプログラム Pending JP2017068720A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015195451A JP2017068720A (ja) 2015-09-30 2015-09-30 情報提供装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015195451A JP2017068720A (ja) 2015-09-30 2015-09-30 情報提供装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2017068720A true JP2017068720A (ja) 2017-04-06

Family

ID=58494986

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015195451A Pending JP2017068720A (ja) 2015-09-30 2015-09-30 情報提供装置及びプログラム

Country Status (1)

Country Link
JP (1) JP2017068720A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018185645A (ja) * 2017-04-26 2018-11-22 大日本印刷株式会社 発注補助装置及びプログラム
CN111104507A (zh) * 2019-11-08 2020-05-05 上海连尚网络科技有限公司 一种用于提供关联书籍信息的方法与设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1185765A (ja) * 1997-09-08 1999-03-30 Toshiba Corp タグ付文書検索システム
JP2006227965A (ja) * 2005-02-18 2006-08-31 Dainippon Printing Co Ltd トレンド予測装置およびトレンド予測方法
JP2007122513A (ja) * 2005-10-28 2007-05-17 Dainippon Printing Co Ltd コンテンツ検索方法、及び、コンテンツ検索サーバ
JP2013109606A (ja) * 2011-11-22 2013-06-06 Ricoh Co Ltd 情報処理装置およびプログラム
JP2013190994A (ja) * 2012-03-14 2013-09-26 Kddi Corp 対話誘発装置、対話誘発方法、およびプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1185765A (ja) * 1997-09-08 1999-03-30 Toshiba Corp タグ付文書検索システム
JP2006227965A (ja) * 2005-02-18 2006-08-31 Dainippon Printing Co Ltd トレンド予測装置およびトレンド予測方法
JP2007122513A (ja) * 2005-10-28 2007-05-17 Dainippon Printing Co Ltd コンテンツ検索方法、及び、コンテンツ検索サーバ
JP2013109606A (ja) * 2011-11-22 2013-06-06 Ricoh Co Ltd 情報処理装置およびプログラム
JP2013190994A (ja) * 2012-03-14 2013-09-26 Kddi Corp 対話誘発装置、対話誘発方法、およびプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018185645A (ja) * 2017-04-26 2018-11-22 大日本印刷株式会社 発注補助装置及びプログラム
CN111104507A (zh) * 2019-11-08 2020-05-05 上海连尚网络科技有限公司 一种用于提供关联书籍信息的方法与设备
CN111104507B (zh) * 2019-11-08 2024-04-09 上海连尚网络科技有限公司 一种用于提供关联书籍信息的方法与设备

Similar Documents

Publication Publication Date Title
AU2012274726B2 (en) Information Processing Apparatus, Information Processing Method, Information Processing Program, Recording the Medium having Stored therein Information Processing Program
JP2011154668A (ja) ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法
JP6018338B1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
US20140100990A1 (en) Review text output system, review text output method, program and computer-readable information storage medium
US9542077B2 (en) Information processing apparatus, information processing method, information processing program, and recording medium
CN108604248A (zh) 利用基于人工智能的相关性计算的笔记提供方法及装置
US10445793B2 (en) Review text output system and review text output method
CN108351875B (zh) 音乐检索系统、音乐检索方法、服务器装置和程序
JP6422544B1 (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP2006236228A (ja) 評価情報提供システムおよびその方法
JP2017068720A (ja) 情報提供装置及びプログラム
JP2013218482A (ja) 電子書籍表示装置、蔵書情報表示プログラム及び蔵書情報表示方法
JP6144799B2 (ja) 検索結果内に添付された情報データベースに基づいた検索リスト及び検索語順位の提供方法及びシステム
Hider et al. Fiction genres in bookstores and libraries: a comparison of commercial and professional classifications
KR101692439B1 (ko) 보유 도서 기반 중고 거래 지원 서비스 제공 장치 및 방법
US9542497B2 (en) Information processing apparatus, information processing method, and information processing program
KR101132431B1 (ko) 관심 정보 제공 시스템 및 방법
JP2020091539A (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP2016177620A (ja) 情報処理装置、情報処理方法および情報処理プログラム
KR100929925B1 (ko) 홈페이지 통합 서비스 제공 시스템 및 방법
JP2017182746A (ja) 情報提供サーバ装置、プログラム及び情報提供方法
JP6030225B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP2009129218A (ja) 書籍情報提供システム及び書籍情報提供方法
JP4385087B2 (ja) 生活情報支援システム
JP2016173804A (ja) 情報処理装置、制御方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180730

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190731

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190903

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200317