JP5494126B2 - 文書推薦システム、文書推薦装置、文書推薦方法、及びプログラム - Google Patents

文書推薦システム、文書推薦装置、文書推薦方法、及びプログラム Download PDF

Info

Publication number
JP5494126B2
JP5494126B2 JP2010080217A JP2010080217A JP5494126B2 JP 5494126 B2 JP5494126 B2 JP 5494126B2 JP 2010080217 A JP2010080217 A JP 2010080217A JP 2010080217 A JP2010080217 A JP 2010080217A JP 5494126 B2 JP5494126 B2 JP 5494126B2
Authority
JP
Japan
Prior art keywords
document
recommended
user
understanding
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010080217A
Other languages
English (en)
Other versions
JP2011215679A (ja
Inventor
宣幸 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2010080217A priority Critical patent/JP5494126B2/ja
Publication of JP2011215679A publication Critical patent/JP2011215679A/ja
Application granted granted Critical
Publication of JP5494126B2 publication Critical patent/JP5494126B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、ユーザに適した文書を推薦する文書推薦システム等に関する。
近年、情報技術の発達やインターネットの普及に伴い、情報源が多様化し、大量の情報が蓄積されている。そのため、大量の蓄積情報を整理したり、ユーザが望む情報を適切に入手したりするための情報フィルタリング技術が研究されている。また、情報フィルタリング技術を利用して、ユーザに適した情報を推薦するリコメンデーション技術(情報推薦)が提案されている。
例えば、特許文献1では、所定の専門分野に関連する語彙または情報を具備する専門知識リストを作り、情報提供サービスにおけるユーザの操作履歴と専門知識リスト内の情報の認知度に応じて各ユーザの信頼度を評価し、信頼度の高いユーザ間で認知されている情報を専門分野に関する情報として推薦することが提案されている。
ところで、書籍や文書を推薦する場合は、推薦対象とするユーザの既読文書の傾向や知識レベルに応じた文書を推薦することが望まれる。
特開2004−192542号公報
しかしながら、上述の特許文献1では情報推薦者の信頼度が評価されるのみで、推薦のターゲットとするユーザの知識レベルを評価していない。また、従来の書籍購入サイト等では、既読ユーザが商品に対する評価やレビューを登録できるようになっているものがあるが、これらの評価は評価者の知識レベルが専門レベルか入門レベルかが問われていない。そのため、評価やユーザの購入履歴に基づいてユーザの読書分野の傾向を判断し、適した書籍を推薦するとしても、ユーザの知識レベルに適合したものが推薦されるとは限らず、その結果、ユーザの知識レベルが高いにも関わらず入門レベルの書籍を提示してしまったり、知識レベルが低いにも関わらず専門レベルの書籍を提示してしまうことがあった。
本発明は、このような課題に鑑みてなされたもので、その目的とするところは、ユーザの知識レベルに適合した文書を推薦する文書推薦システム等を提供することである。
前述した課題を解決するため第1の発明は、ユーザ端末とサーバとがネットワークを介して通信接続され、複数の前記ユーザ端末と前記サーバとの間で文書に関する情報を共有する文書推薦システムであって、前記ユーザ端末が、既読文書に対する評価として理解度及び有益度を付与し、サーバに登録する登録手段と、前記サーバにおいて、前記登録手段により登録された文書全体から有益度が比較的高い文書を抽出し、理解度レベル別に推薦文書群を作成する推薦文書群抽出手段と、前記サーバにおいて、各ユーザの前記既読文書に対する前記理解度に応じた推薦文書を、対応する理解度レベルの前記推薦文書群から検索する検索手段と、前記サーバにおいて、前記検索手段により検索された推薦文書の情報を前記ユーザ端末に提示する提示手段と、を備え、前記推薦文書群抽出手段は、前記文書全体から少なくとも平易な有益文書群と、難解な有益文書群とを抽出し、前記検索手段は、ユーザの理解度の低い分野については前記平易な有益文書群から推薦文書を検索し、ユーザの理解度の高い分野については前記難解な有益文書群から推薦文書を検索することを特徴とする文書推薦システムである。
第1の発明によれば、複数のユーザ端末とサーバとの間で文書に関する情報を共有する文書推薦システムにおいて、ユーザ端末が、既読文書に対する評価として理解度及び有益度を付与し、サーバに登録すると、サーバは、登録されている文書全体から有益度が比較的高い文書を抽出し、理解度レベル別に推薦文書群を作成する。また、サーバは、各ユーザの既読文書に対する理解度に応じた推薦文書を、対応する理解度レベルの推薦文書群から検索し、検索された推薦文書の情報をユーザ端末に提示する。
従って、サーバは、全ユーザの文書に対する評価を基に理解度レベルに応じた推薦文書群を抽出でき、また、その中から各ユーザの既読文書の理解度に応じた文書を検索して推薦できる。そのため、ユーザの理解度レベル(知識レベル)に適合した文書を推薦することが可能となる。その結果、文書に対するコンバージョン(閲覧、購買等)を向上させることが可能となる。
また、ユーザの理解度に応じて、ユーザの苦手分野に対しては易しくて有益な文書を推薦でき、ユーザの得意分野に対しては難しいが有益な文書を推薦できるようになる。
また、前記検索手段は、前記推薦文書群の各文書の特徴を表現する文書ベクトルを生成する文書ベクトル生成手段と、前記既読文書の特徴を文書ベクトルの形式で表現する検索クエリを生成する検索クエリ生成手段と、前記文書ベクトル生成手段によって生成された前記推薦文書群の各文書の文書ベクトルと、前記検索クエリ生成手段により生成された検索クエリとの類似度を算出する類似度算出手段と、前記類似度算出手段によって算出された類似度に基づいて、推薦文書を決定する推薦文書決定手段と、を備えることが望ましい。
これにより、サーバによる推薦文書の検索の際に、文書の特徴を表現する文書ベクトルによりユーザの既読文書の特徴を求め、その特徴に類似する推薦文書を決定できる。その結果ユーザの既読文書の傾向に応じた適切な文書を推薦できるようになる。
第2の発明は、ユーザ端末とサーバとがネットワークを介して通信接続され、複数の前記ユーザ端末と前記サーバとの間で文書に関する情報を共有する文書推薦システムであって、前記ユーザ端末が、既読文書に対する評価として理解度及び有益度を付与し、サーバに登録する登録手段と、前記サーバにおいて、前記登録手段により登録された文書全体から有益度が比較的高い文書を抽出し、理解度レベル別に推薦文書群を作成する推薦文書群抽出手段と、前記サーバにおいて、各ユーザの前記既読文書に対する前記理解度に応じた推薦文書を、対応する理解度レベルの前記推薦文書群から検索する検索手段と、前記サーバにおいて、前記検索手段により検索された推薦文書の情報を前記ユーザ端末に提示する提示手段と、を備え、前記検索手段は、前記推薦文書群の各文書の特徴を表現する文書ベクトルを生成する文書ベクトル生成手段と、前記既読文書の特徴を文書ベクトルの形式で表現する検索クエリを生成する検索クエリ生成手段と、前記文書ベクトル生成手段によって生成された前記推薦文書群の各文書の文書ベクトルと、前記検索クエリ生成手段により生成された検索クエリとの類似度を算出する類似度算出手段と、前記類似度算出手段によって算出された類似度に基づいて、推薦文書を決定する推薦文書決定手段と、を備え、前記検索クエリ生成手段は、全ユーザが前記文書に対して付与した理解度から該文書の理解度の基準値を求め、該基準値に対する相対的なユーザの理解度を重みとして算出する理解度重み算出手段を更に備え、前記理解度重み算出手段により算出された重みを、前記既読文書の特徴を表現する文書ベクトルに乗じて、前記検索クエリを生成することを特徴とする文書推薦システムである。
第2の発明によれば、複数のユーザ端末とサーバとの間で文書に関する情報を共有する文書推薦システムにおいて、ユーザ端末が、既読文書に対する評価として理解度及び有益度を付与し、サーバに登録すると、サーバは、登録されている文書全体から有益度が比較的高い文書を抽出し、理解度レベル別に推薦文書群を作成する。また、サーバは、各ユーザの既読文書に対する理解度に応じた推薦文書を、対応する理解度レベルの推薦文書群から検索し、検索された推薦文書の情報をユーザ端末に提示する。
従って、サーバは、全ユーザの文書に対する評価を基に理解度レベルに応じた推薦文書群を抽出でき、また、その中から各ユーザの既読文書の理解度に応じた文書を検索して推薦できる。そのため、ユーザの理解度レベル(知識レベル)に適合した文書を推薦することが可能となる。その結果、文書に対するコンバージョン(閲覧、購買等)を向上させることが可能となる。
また、サーバによる推薦文書の検索の際に、文書の特徴を表現する文書ベクトルによりユーザの既読文書の特徴を求め、その特徴に類似する推薦文書を決定できる。その結果ユーザの既読文書の傾向に応じた適切な文書を推薦できるようになる。
さらに、全ユーザの理解度を基準とする各ユーザの理解度を相対的に評価することが可能となり、ユーザの既読文書の傾向と、全体の中での個々のユーザの知識レベルとを解析して、ユーザに最適な文書を推薦することが可能となる。
また、前記提示手段は、前記検索手段により検索された推薦文書が複数ある場合は、更に有益度の高いものから順に前記ユーザ端末に提示することが望ましい。
これにより、検索された推薦文書が複数ある場合は、更に有益度の高いものから順にユーザ端末に提示することが可能となり、ユーザにとってより有益な文書推薦システムを提供できる。
の発明は、ネットワークを介してユーザ端末と通信接続され、ユーザ端末に対して文書の推薦情報を提示する文書推薦装置であって、複数のユーザ端末から、既読文書に対する評価として理解度及び有益度の付与を受け付ける評価受付手段と、前記評価受付手段によって評価の付与された文書全体から有益度が比較的高い文書を抽出し、理解度レベル別に推薦文書群を作成する推薦文書群抽出手段と、各ユーザの前記既読文書に対する前記理解度に応じた推薦文書を、対応する理解度レベルの前記推薦文書群から検索する検索手段と、前記検索手段により検索された推薦文書の情報を前記ユーザ端末に提示する提示手段と、を備え、前記推薦文書群抽出手段は、前記文書全体から少なくとも平易な有益文書群と、難解な有益文書群とを抽出し、前記検索手段は、ユーザの理解度の低い分野については前記平易な有益文書群から推薦文書を検索し、ユーザの理解度の高い分野については前記難解な有益文書群から推薦文書を検索することを特徴とする文書推薦装置である。
の発明によれば、文書推薦装置は、複数のユーザ端末から、既読文書に対する評価として理解度及び有益度の付与を受け付け、評価の付与された文書全体から有益度が比較的高い文書を抽出し、理解度レベル別に推薦文書群を作成する。また、各ユーザの既読文書に対する理解度に応じた推薦文書を、対応する理解度レベルの推薦文書群から検索し、ユーザ端末に提示する。
従って、文書推薦装置は、全ユーザの文書に対する評価を基に理解度レベルに応じた推薦文書群を抽出でき、また、その中から各ユーザの既読文書の理解度に応じた文書を検索して推薦できる。そのため、ユーザの理解度レベルに適合した文書を推薦することが可能となる。その結果、文書に対するコンバージョン(閲覧、購買等)を向上させることが可能となる。
また、ユーザの理解度に応じて、ユーザの苦手分野に対しては易しくて有益な文書を推薦でき、ユーザの得意分野に対しては難しいが有益な文書を推薦できるようになる。
の発明は、ユーザ端末とサーバとがネットワークを介して通信接続され、複数の前記ユーザ端末と前記サーバとの間で文書に関する情報を共有する文書推薦システムにおける文書推薦方法であって、前記ユーザ端末が、既読文書に対する評価として理解度及び有益度を付与し、サーバに登録するステップと、前記サーバにおいて、登録された文書全体から有益度が比較的高い文書を抽出し、理解度レベル別に推薦文書群を作成する推薦文書群抽出ステップと、前記サーバにおいて、各ユーザの前記既読文書に対する前記理解度に応じた推薦文書を、対応する理解度レベルの前記推薦文書群から検索する検索ステップと、前記サーバにおいて、検索された推薦文書の情報を前記ユーザ端末に提示する提示ステップと、を含み、前記推薦文書群抽出ステップは、前記文書全体から少なくとも平易な有益文書群と、難解な有益文書群とを抽出し、前記検索ステップは、ユーザの理解度の低い分野については前記平易な有益文書群から推薦文書を検索し、ユーザの理解度の高い分野については前記難解な有益文書群から推薦文書を検索することを特徴とする文書推薦方法である。
の発明の文書推薦方法によれば、複数のユーザ端末とサーバとの間で文書に関する情報を共有する文書推薦システムにおいて、ユーザ端末が、既読文書に対する評価として理解度及び有益度を付与し、サーバに登録すると、サーバは、登録されている文書全体から有益度が比較的高い文書を抽出し、理解度レベル別に推薦文書群を作成する。また、サーバは、各ユーザの既読文書に対する理解度に応じた推薦文書を、対応する理解度レベルの推薦文書群から検索し、検索された推薦文書の情報をユーザ端末に提示する。
従って、サーバは、全ユーザの文書に対する評価を基に理解度レベルに応じた推薦文書群を抽出でき、また、その中から各ユーザの既読文書の理解度に応じた文書を検索して推薦できる。そのため、ユーザの理解度レベルに適合した文書を推薦することが可能となる。その結果、文書に対するコンバージョン(閲覧、購買等)を向上させることが可能となる。
また、ユーザの理解度に応じて、ユーザの苦手分野に対しては易しくて有益な文書を推薦でき、ユーザの得意分野に対しては難しいが有益な文書を推薦できるようになる。
の発明は、コンピュータを第の発明の文書推薦装置として機能させるためのプログラムである。










本発明によれば、ユーザの知識レベルに応じた適切な文書を推薦する文書推薦装置等を提供できる。
本発明に係る文書推薦システム1の全体構成図 文書推薦システム1を利用した書棚共有コミュニティサービスの概念図 書誌データベース3が保持する書誌情報31の内容を示す図 文書推薦サーバ5が保持するユーザ情報51、文書評価記事情報52、ユーザプロファイル53の内容を示す図 文書推薦サーバ5及びユーザ端末2として利用されるコンピュータのハードウエア構成図 事前処理について説明するフローチャート 事前処理における文書の分類処理について説明する図 文書推薦処理の流れを説明するフローチャート ユーザによる文書リストの登録について説明する図 ユーザプロファイルの作成(苦手分野と得意分野の決定)について説明する図 ユーザの苦手分野検索クエリ53dについて説明する図 ユーザの得意分野検索クエリ53eについて説明する図 ユーザの「苦手分野」に適切な易しくて有益な文書の選定について説明する図 ユーザの「得意分野」に適切な難しいが有益な文書の選定について説明する図
以下、図面に基づいて本発明の好適な実施形態について詳細に説明する。
まず、図1〜図5を参照して本発明の構成について説明する。
図1は、本発明に係る文書推薦システム1のシステム構成を示す図である。
図1に示すように、文書推薦システム1は、複数のユーザ端末2、書誌データベース3、及び文書推薦サーバ5がネットワーク9を介して互いに通信接続されて構成される。
本実施の形態では、複数ユーザ間でネットワーク9を介して互いに既読文書に関する情報を共有する書棚共有コミュニティサービスにて本発明に係る文書推薦システム1を利用する例を示す。
書棚共有コミュニティサービスとは、ネットワーク9を介して各ユーザ端末2から文書推薦サーバ5に登録された既読文書に関する情報を仮想的な書棚として扱い、複数のユーザ間で各自の書棚、既読文書、及び文書の評価等を交換し合うものである。図2に示すように、文書推薦サーバ5は各ユーザ端末2に個別のユーザ専用の書棚画面21を提供したり、他ユーザの書棚画面21を閲覧可能に提供したりする。
なお、本発明において、文書とは、書籍、雑誌、記事、論文、その他の書類を含むが、紙媒体に限定されず、電子化された書籍、雑誌、記事、論文、その他、インターネットで公開される記事コンテンツのような電子媒体であってもよい。本実施の形態では、説明を簡略に行うための一例として、紙媒体で流通している書籍の推薦について例示する。
ユーザ端末2は、書棚共有コミュニティサービスの会員ユーザが使用するコンピュータであり、Webブラウザがインストールされている。ユーザ端末2はWebブラウザを介して書棚共有コミュニティサービスを提供するサイトのサーバ(文書推薦サーバ5)へのアクセスが可能となる。ユーザ端末2が文書推薦サーバ5へログインすると、各ユーザ専用の書棚画面21(図2参照)を受信し、ユーザ端末2の表示部に表示する。ユーザ端末2は、書棚画面21や後述する文書登録画面(図9参照)を利用して、文書推薦サーバ5との間で文書登録及び推薦文書の表示に関する種々の処理を実行する。
なお、ユーザ端末2は、汎用的なコンピュータに代えて、電子書籍閲覧端末、デジタルテレビ、携帯電話、モバイル端末、通信機能搭載のゲーム機などで実現することもできる。
書誌データベース3は、書誌情報31を蓄積して記憶するデータベースである。
図3に書誌データベース3にて取り扱う書誌情報31の例を示す。
図3に示すように、書誌情報31とは、各文書の「文書ID」、「タイトル」、「カテゴリ」、「内容」、「著者」等の情報を含むものである。書誌情報31の「内容」には、文書の本文、目次、または説明文等の情報が含まれる。
なお、本実施の形態では、現実に流通している書籍に関する書誌情報が登録されているものとするが、上述のように、より広い概念の各種文書(書籍、雑誌、記事、論文、記事コンテンツ等)の書誌情報が登録されているものとしてもよい。
文書推薦サーバ5は、書棚共有コミュニティサービスを提供するサイトのサーバ装置であり、書棚共有コミュニティサイトの会員ユーザに関するユーザ情報51や、各ユーザ端末2から登録された文書の評価記事情報52、全ユーザのユーザプロファイル53等を管理する。
図4に文書推薦サーバ5にて取り扱うデータの例を示す。
図4(a)に示すように、ユーザ情報51は、「ユーザID」、「ユーザ名」、「ユーザ属性情報」、「文書評価記事ID」等の情報が含まれる。
「ユーザ属性情報」とは、ユーザの年齢、性別、職業等のユーザ固有の情報であり、「文書評価記事ID」とは、当該ユーザの書棚に登録されている文書評価記事のリストである。文書評価記事とは、文書に対するユーザの評価であり、有益度、理解度、コメント等の情報が含まれる。
図4(b)に示すように、文書評価記事情報52は、各ユーザから登録された全ての文書評価記事情報を管理するものであり、「文書評価記事ID」、「文書ID」、「有益度」、「理解度」、「コメント」等の情報が含まれる。
「有益度」とは評価したユーザにとって文書が役に立った度合いを表現する指標であり、例えば、0〜5の数値等で表される。
「理解度」とは評価したユーザにとって文書の理解しやすさを表現する指標であり、例えば、0〜5の数値等で表される。
「コメント」とは評価対象(文書)に対する感想(文字列)である。
図4(c)に示すように、ユーザプロファイル53とは、各ユーザから登録された文書リストや文書評価記事情報と、それらの情報に基づいて文書推薦サーバ5が作成した個々のユーザについてのプロファイル情報とを含むものである。すなわち、文書推薦サーバ5は、ユーザから登録された既読文書を文書リスト53aとしてユーザプロファイル53に登録する。また、文書リスト53aやユーザ情報51の文書評価記事IDに基づいて、ユーザの既読文書を苦手分野文書53b、得意分野文書53cに分類し、苦手分野検索クエリ53d、得意分野検索クエリ53eを作成し、ユーザプロファイル53として記憶する。詳細は後述する。
次に、図5を参照して、ユーザ端末2、文書推薦サーバ5として利用されるコンピュータのハードウエア構成を説明する。
コンピュータは、図5に示すように、例えば、制御部11、記憶部12、メディア入出力部13、入力部14、表示部15、通信部16、周辺機器I/F部17等がバス18を介して接続されて構成される。
制御部11は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Accsess Memory)等により構成される。
CPUは、記憶部12、ROM、記録媒体等に格納されるプログラムをRAM上のワークメモリ領域に呼び出して実行し、バス18を介して接続された各部を駆動制御する。ROMは、コンピュータのブートプログラムやBIOS等のプログラム、データ等を恒久的に保持する。RAMは、ロードしたプログラムやデータを一時的に保持するとともに、制御部11が各種処理を行うために使用するワークエリアを備える。
記憶部12は、HDD(ハードディスクドライブ)であり、制御部11が実行するプログラムや、プログラム実行に必要なデータ、OS(オペレーティング・システム)等が格納されている。これらのプログラムコードは、制御部11により必要に応じて読み出されてRAMに移され、CPUに読み出されて実行される。
メディア入出力部13は、例えば、HD(ハードディスク)ドライブ、フロッピー(登録商標)ディスクドライブ、PDドライブ、CDドライブ、DVDドライブ、MOドライブ等のメディア入出力装置であり、データの入出力を行う。
入力部14は、例えば、キーボード、マウス等のポインティング・デバイス、テンキー等の入力装置であり、入力されたデータを制御部11へ出力する。
表示部15は、例えば液晶パネル、CRTモニタ等のディスプレイ装置と、ディスプレイ装置と連携して表示処理を実行するための論理回路(ビデオアダプタ等)で構成され、制御部11の制御により入力された表示情報をディスプレイ装置上に表示させる。
周辺機器I/F(インタフェース)部17は、コンピュータに周辺機器を接続させるためのポートであり、周辺機器I/F部17を介してコンピュータは周辺機器とのデータの送受信を行う。周辺機器I/F部17は、USBやIEEE1394やRS−232C等で構成されており、通常複数の周辺機器I/Fを有する。周辺機器との接続形態は有線、無線を問わない。
通信部16は、通信制御装置、通信ポート等を有し、ネットワーク9との通信を媒介する通信インタフェースであり、通信制御を行う。
バス18は、各装置間の制御信号、データ信号等の授受を媒介する経路である。
次に、文書推薦サーバ5により実行される事前処理、及び文書推薦処理の流れを、図6〜図14を参照して説明する。
文書推薦サーバ5には、書棚共有コミュニティサービスを利用する複数のユーザ端末2から、既読文書の登録、文書評価記事の登録が行われているものとする。文書推薦サーバ5は、ユーザ端末2から既読文書の登録、文書評価記事の登録が行われると、ユーザ情報51の「文書評価記事ID」を更新し、文書評価記事情報52に新規情報を追加する。また、ユーザプロファイル53の文書リスト53aを更新する。
文書推薦サーバ5の制御部11は、図6、図7に示す事前処理を行って、全ユーザから登録された全文書を整理する。
図6に示すように、事前処理において、文書推薦サーバ5の制御部11は、文書評価記事情報52に基づき、当該文書推薦サーバ5に登録されている文書から平易有益文書55と難解有益文書57とを抽出する(ステップS1)。
平易有益文書55とは、ユーザの「理解度」が所定の指標(例えば平均値)以上で、「有益度」が所定の指標(例えば平均値)以上の文書群である。
難解有益文書57とは、ユーザの「理解度」が所定の指標(例えば平均値)より小さく、「有益度」が所定の指標(例えば平均値)以上の文書群である。
図7を参照して、ステップS1の文書の分類について説明する。
図7(a)に示すように、文書推薦サーバ5の制御部11は、記憶部12に記憶されている文書評価記事情報52から全文書の「理解度」及び「有益度」を集約し、図7(b)に示すように、全文書の「理解度」及び「有益度」の指標値(例えば平均値)を算出する。図7(b)の例では、文書推薦サーバ5に登録されている文書の平均理解度は「2.8」、平均有益度は「2.5」が算出される。
次に、文書推薦サーバ5の制御部11は、登録されている文書の「理解度」が所定の指標(例えば平均値)以上で、「有益度」が所定の指標(例えば平均値)以上の文書を平易有益文書55として抽出する。また、文書推薦サーバ5の制御部11は、登録されている文書の「理解度」が所定の指標(例えば平均値)より小さく、「有益度」が所定の指標(例えば平均値)以上の文書を難解有益文書57として抽出する。平易有益文書55の一例を図7(c)に、難解有益文書57の一例を図7(d)に示す。
なお、「理解度」及び「有益度」の指標値は、ここでは一例として平均値を用いているがこれに限定されず、中央値としてもよいし、その他の統計的に算出可能な数値としてもよい。
平易有益文書55、難解有益文書57は、ユーザに推薦する文書を決定する際に参照される。
また、事前処理として、文書推薦サーバ5の制御部11は、平易有益文書55及び難解有益文書57に登録されている文書の内容の特徴を表す文書ベクトルを生成する(ステップS2)。文書ベクトルとは、文書から抽出されるキーワードをベクトルの次元(成分)とし、各次元の値をキーワードの特徴の程度を表現する数値(ここでは、TF−IDF)で表したものである。
具体的には、例えば、各文書の書誌情報51(タイトル、内容、著者)、及び文書評価記事情報53(コメント)の形態素解析を行い、抽出したキーワードのTF−IDF(Term Frequency−Inverse Document Frequency)を算出して文書ベクトルを生成する(ステップS2)。TF(Term Frequency)とは、ある文書にキーワードが出現する頻度であり、そのキーワードの文書における重要度を表すものである。DF(Document Frequency)とは、全文書中、キーワードが現れる文書数であり、多くの文書に含まれるキーワードは一般的な語で重要性が低いと考えるものである。TF−IDFにより、そのキーワードがある文書の特徴を表す程度を数値化できる。ここで算出したTF−IDFは、文書ベクトルの各成分の値となる。
次に、文書推薦サーバ5の実行する文書推薦処理の流れを図8〜図14を参照して説明する。
図8に示すように、まずユーザ端末2から文書推薦サーバ5に文書の登録が行われる(ステップS21)。
文書の登録について、図9を参照して説明する。
ユーザ端末2が文書推薦サーバ5にログインすると、文書推薦サーバ5は図9(a)に示すようなユーザ専用の書棚画面21を該当ユーザ端末2に送信する。書棚画面21にはユーザが登録した文書が書棚領域21aに一覧表示またはサムネイル表示される。また、書棚画面21には新規追加ボタン21bが設けられており、新規追加ボタン21bがクリック操作されると、文書推薦サーバ5は図9(b)に示す文書登録画面22をユーザ端末2に対して送信する。文書登録画面22には文書を検索するための検索ボタン22a、文書ID入力欄22b、理解度入力欄22c、有益度入力欄22d、コメント入力欄22e、登録ボタン22fが設けられる。ユーザ端末2にて各入力欄22b〜22eに対して文書ID、理解度、有益度、コメントが入力され、登録ボタン22fがクリック操作されると、入力された内容が文書推薦サーバ5に送信される。文書推薦サーバ5は受信した文書ID、理解度、有益度、コメントを文書評価記事情報53として新規登録すると共に、該当ユーザのユーザプロファイル53の書棚(文書リスト53a)、ユーザ情報51の文書評価記事情報IDを更新する。
検索ボタン22aがクリック操作された場合は、検索画面(不図示)に移行する。検索画面には、例えば文書のタイトル、著者等のキーワードを入力する入力欄が設けられるものとする。図9(c)に示すように、書誌データベース3に登録されている書誌情報31から書棚に登録する文書が検索されるものとするが、書誌データベース3に相当する別のデータベースから検索されるものとしてもよい。
次に、図8のステップS22に示すように、文書推薦サーバ5は各ユーザのユーザプロファイル53を作成する(ステップS22)。すなわち、文書推薦サーバ5は各ユーザの登録した文書リスト53aからユーザの苦手分野と得意分野とをそれぞれ表現する検索クエリを作成する。検索クエリは文書ベクトルの形式で算出するものとする。
まず、苦手分野文書、得意分野文書の抽出について、図10を参照して説明する。
図10(a)に示すように、文書推薦サーバ5は各ユーザが登録した文書リスト53a(既読文書)と文書の評価記事情報52とを取得する。文書評価記事情報には、文書IDとその文書の有益度、理解度、及びコメントが格納されている。
文書推薦サーバ5は、ユーザの既読文書の理解度と、その文書の全ユーザの平均理解度(図7(a)参照)とを比較する。
図10(a)の例では、ユーザ「User001」の文書リスト53aには文書ID「doc001」、「doc002」、「doc006」、「doc007」が含まれ、これらの各文書についてのユーザの理解度はそれぞれ「4.5」、「4.0」、「3.0」、「2.0」である。一方、事前処理にて算出された全ユーザを対象とした各文書「doc001」、「doc002」、「doc006」、「doc007」の平均理解度は、それぞれ「3.9」、「2.5」、「4.5」、「3.7」であるとする。
文書推薦サーバ5は、全ユーザを対象とした平均理解度と、ユーザ「User001」の理解度とを数値比較し、ユーザの理解度が平均理解度より小さいものを苦手分野文書53bとし、ユーザの理解度が平均理解度以上のものを得意分野文書53cとする。図10(b)に示すように、ユーザ「User001」の苦手分野文書53bは「doc006」、「doc007」となり、図10(c)に示すように、得意分野文書53cは「doc001」、「doc002」となる。
次に、文書推薦サーバ5は、ユーザの苦手分野文書53b及び得意分野文書53cから検索クエリを作成する。
図11を参照して、苦手分野検索クエリ53dの作成について説明する。
図11(a)に示すように、文書推薦サーバ5は、苦手分野文書53bに含まれる各文書からキーワードを抽出する。具体的には、例えば、書誌情報(タイトル、内容、著者)と文書評価情報(コメント)に対して形態素解析ソフトウエアであるChasen(茶筌;http://chasen-legacy.sourceforge.jp/)を用いて形態素解析を行う。この場合、文書推薦サーバ5は、名詞、未知語、記号−アルファベットを抽出し、品詞毎に設定したキーワード生成ルール(例えば、連続して出現した名詞、未知語、記号−アルファベットは連結する等)を適用してキーワードを抽出する。このとき、予め登録されている辞書が参照され、辞書の登録語句に基づいて名詞、未知語、記号−アルファベットが判断される。また、例えば、予め用意されたキーワード候補の辞書を用意し、書誌情報(タイトル、内容、著者)と文書評価情報(コメント)に対して、完全一致検索を行って、一致したキーワードを抽出してもよい。
次に、文書推薦サーバ5は、各文書から抽出されるキーワードについてTF−IDFを算出する。図11(b)に示す例では、苦手分野文書53bに分類された文書「doc006」について各キーワードを抽出し、TF−IDFを算出する。例えば、文書「doc006」からはキーワードとして、「投資」、「金融工学」、「為替」、「株式」、「決算」等が抽出され、そのTF−IDFはそれぞれ「0.5」、「0.4」、「0.33」、「0.33」、「0.2」であるとする。重要なキーワードほど、TF−IDFの値が大きな値となる。
更に、文書推薦サーバ5は、各文書についてユーザの理解度の重みを計算する。図11(c)に示すように、ユーザの理解度と全ユーザの平均理解度とから、理解度の重みを計算する。理解度の重みとは、全ユーザの理解度を基準に該当ユーザがどれだけ理解しているかを示すものであり、該当ユーザの理解度を相対的に表すものである。すなわち、理解度の重みによって、該当ユーザの全ユーザ内での知識レベルが表されることとなる。理解度の重みは以下の式(1)にて表される。
Figure 0005494126
文書推薦サーバ5は、図11(d)に示すように、各文書から抽出された各キーワードのTF−IDFに理解度の重みを乗じ、更に苦手分野文書53b内の全文書でそれらの和をとって各キーワードのスコアを算出する。このとき、苦手分野文書に登場するキーワードの数と同じ次元数の文書ベクトルを新たに作り、これを苦手分野検索クエリ53dとする。苦手分野検索クエリ53dの各次元のキーワードがそれぞれ上述のスコアをもつこととなる。
得意分野文書検索クエリ53eも図11に示す手順と同様に作成される(図12参照)。すなわち、文書推薦サーバ5は、得意分野文書53cからキーワードを抽出し、そのTF−IDFを算出する。図12(b)に示す例では、得意分野文書53cに分類された文書「doc001」から、キーワードとして、「C言語」、「プログラミング」、「サーバ」、「Web」、「開発」等が抽出され、そのTF−IDFはそれぞれ「0.5」、「0.4」、「0.33」、「0.33」、「0.2」であるとする。更に、図12(c)に示すように、文書推薦サーバ5は、各文書についてユーザの理解度の重みを計算し、図12(d)に示すように、各文書から抽出された各キーワードのTF−IDFに理解度の重みを乗じ、更に得意分野文書53c内の全文書でそれらの和をとって各キーワードのスコアを算出する。このとき、得意分野文書に登場するキーワードの数と同じ次元数の文書ベクトルを新たに作り、これを得意分野検索クエリ53eとする。得意分野検索クエリ53eの各次元のキーワードがそれぞれ上述のスコアをもつこととなる。
図8のステップS22のユーザプロファイル53の作成が完了すると、次に文書推薦サーバ5は、苦手分野検索クエリ53dを使用して平易有益文書55(図7(c))内を検索し、苦手分野対応文書53fを抽出する(ステップS23)。また、得意分野検索クエリ53eを使用して難解有益文書57(図7(d))内を検索し、得意分野対応文書53gを抽出する(ステップS24)。
図13、図14を参照して、苦手分野対応文書53fの抽出、得意分野対応文書53gの抽出について説明する。
図13に示すように、文書推薦サーバ5は、作成した苦手分野検索クエリ53dを使用して平易有益文書55を検索する。検索方法としては、例えばベクトル空間モデルを用いる。
ベクトル空間モデルを用いた検索とは、書誌データベース3に蓄積されている文書(書誌情報31)全体における各文書の文書ベクトルと、上述の苦手分野検索クエリ53dまたは得意分野検索クエリ53eとの類似度を算出するという意味である。
文書全体における各文書の文書ベクトルは、図6の事前処理のステップS2で算出される。
図13に示すように、文書推薦サーバ5は、苦手分野検索クエリ53dに対応する文書ベクトル(ユーザ苦手ベクトル)をd[i]、平易有益文書55内のある文書の文書ベクトルをd[j]とし、これらのベクトルd[i],d[j]の内積を算出して、類似度sim(d[i],d[j])を求める。
具体的には、d[i]とd[j]で共通する成分(キーワード)のスコアの積を計算し、その総和を算出するという手順で文書ベクトルd[i]とd[j]の内積の値を求めることができる。
類似度sim(d[i],d[j])は次式(2)で表現される。式(2)は、ベクトルd[i],d[j]の内積を正規化した形式としている。
Figure 0005494126
文書推薦サーバ5は、平易有益文書55内のある全ての文書と、苦手分野検索クエリ53dとの類似度を算出し、類似度の値が大きいものを苦手分野対応文書53fとする。図13では、文書「doc014」、文書「doc009」、文書「doc015」の3つの文書が、苦手分野対応文書53fとして検索されている。なお、苦手分野対応文書53fは何冊であってもよい。
また、得意分野対応文書53gについても図13と同様の手法で算出する。
図14に示すように、文書推薦サーバ5は、作成した得意分野検索クエリ53eを使用して難解有益文書57(図7(d))内をベクトル空間モデルを用いて検索する。
文書推薦サーバ5は、得意分野検索クエリ53eに対応する文書ベクトル(ユーザ得意ベクトル)をd[i]、難解有益文書57内のある文書の文書ベクトルをd[j]とし、これらのベクトルd[i],d[j]の内積を算出して、上述の式(2)で表現される類似度sim(d[i],d[j])を求める。具体的には、d[i]とd[j]で共通する成分(キーワード)のスコアの積を計算し、その総和を算出するという手順で文書ベクトルd[i]とd[j]の内積の値を求めることができる。
文書推薦サーバ5は、難解有益文書57内のある全ての文書と、得意分野検索クエリ53eとの類似度を算出し、類似度の値が大きいものを得意分野対応文書53gとする。図14では、文書「doc012」、文書「doc003」、文書「doc005」の3つの文書が、得意分野対応文書53gとして検索されている。なお、得意分野対応文書53gは何冊であってもよい。
ステップS23、ステップS24によって苦手分野対応文書53f、得意分野対応文書53gが検索されると、文書推薦サーバ5は、検索した苦手分野対応文書53f及び得意分野対応文書53gを推薦文書29として、該当するユーザ端末2に送信する。このとき、更に、文書推薦サーバ5は、有益度を用いて降順にソートし、上位のものを推薦文書29としてもよい。
ユーザ端末2は、文書推薦サーバ5から送信された苦手分野対応文書53f及び得意分野対応文書53gを書棚画面21内に提示する(ステップS25)。
図2(b)に推薦文書29が提示された書棚画面21の一例を示す。図2(b)に示すように、ユーザ「User001」の書棚画面21の一部に、ユーザの苦手分野に対する推薦文書29と得意分野に対する推薦文書29とが一覧表示またはサムネイル表示される。
以上説明したように、文書推薦システム1は、ユーザ端末2と文書推薦サーバ5とがネットワーク9を介して通信接続され、複数のユーザ端末2と文書推薦サーバ5との間で文書に関する情報を共有する。ユーザ端末2が、既読文書に対して理解度及び有益度の評価を付与して文書推薦サーバ5の各自の書棚(文書リスト53a)に登録すると、文書推薦サーバ5は、全ユーザから登録された文書リスト53aから有益度が比較的高い文書を抽出するとともに、理解度レベル別に推薦文書を分類する。例えば平易有益文書55と難解有益文書57として推薦すべき文書を分類する。また、文書推薦サーバ5は、各ユーザの文書リスト53aからユーザ別のユーザプロファイル53bを作成する。すなわち、個々のユーザの既読文書の理解度に応じた検索クエリを作成する。そして、文書推薦サーバ5は、苦手分野文書検索クエリ53dを用いて平易有益文書55を検索し、苦手分野に対して推薦すべき文書(苦手分野対応文書53f)を決定して、ユーザ端末2に提示する。同様に、文書推薦サーバ5は、得意分野文書検索クエリ53eを用いて難解有益文書57を検索し、得意分野に対して推薦すべき文書(得意分野対応文書53g)を決定してユーザ端末2に提示する。
従って、ユーザの理解度に応じて、苦手分野に対しては易しくて有益な文書を推薦でき、得意分野に対しては難しいが有益な文書を推薦できるようになる。その結果、ユーザの知識レベルに適合した文書を提示でき、文書に対するコンバージョン(閲覧、購買等)を向上させることが可能となる。
なお、上述の実施の形態では、文書に対する理解度をユーザ自身が評価して数値入力するものとしたが、より客観的に文書の理解度を判定するため、ユーザ端末2または文書推薦サーバ5のいずれかに理解度判定手段を更に備えるようにしてもよい。
例えば、電子書籍の場合であれば、書籍の頁を読み進める速さをユーザ端末2の電子書籍ブラウザにて計測し、速さが速いものは理解度が高く、遅いものは理解度が低いとみなす。具体的には、電子書籍ブラウザは閲覧頁数と閲覧時間とを記録し、1頁当たりの読む速度を計測する。速度が速ければ理解度が高いとみなし、速度が遅ければ理解度が低いとみなす。例えば、ビジネス書の場合は、速度が1頁/分であれば、理解度「5.00」、1頁/分未満〜0.5頁/分以上であれば、理解度「4.50」、・・・0.01頁/分以下であれば、理解度「0.50」のように理解度を決定する。また、書籍のジャンル毎に速度の基準値を設け、基準値とユーザの速度とを比較することにより理解度を決定してもよい。
また、電子書籍の場合は、書籍閲覧中にユーザ端末2の電子書籍ブラウザの辞書機能を利用した回数を計測して理解度を算出するようにしてもよい。辞書機能を利用しない書籍は理解度が高く、辞書機能を多く利用した書籍は理解度が低いものとする。
具体的には、電子書籍ブラウザはユーザが書籍を閲覧中に、何回辞書機能を起動したかを計測する。辞書機能を起動した回数について、ジャンル毎に基準値を設け、基準値と比較して理解度を算出する。例えば、ビジネス書の場合は、基準値よりも起動回数が少なければ理解度「5.00」、基準値との差が1回以上〜5回未満であれば理解度「4.50」、・・・100回以上であれば理解度「0.50」のように理解度を決定する。
また、文書推薦サーバ5はユーザが入力したコメントを評価し、コメント内の専門語の質及び数に基づいてユーザの理解度を算出するようにしてもよい。コメント中の語彙の数が多く語彙が専門的である場合は理解度が高いと判定し、コメント中の語彙の数が少なく語彙が専門的でない場合は理解度が低いと判定する。
具体的には、書籍のジャンル毎にキーワードとキーワードの重み(ポイント)を設定する。例えば、技術書の場合、キーワード「C言語」の重みは「+1」、キーワード「参照渡し」の重みは「+3」、キーワード「ポインタ」の重みは「+2」、・・・のように予めキーワードとキーワードの重み(ポイント)を決定しておき、文書推薦サーバ5はユーザのコメントについて、上述のキーワードが含まれるかをカウントし、ポイントの合計を算出する。更に、文書のジャンル毎に基準を設けて基準に対するポイントの値から理解度を算出する。例えば、技術書の場合は、基準に対するポイントの値が100ポイントの場合は理解度「5.00」、90ポイントの場合は理解度「4.50」、・・・、0ポイントの場合は理解度「0.50」のように決定する。
また、文書推薦サーバ5が、ユーザから登録された文書の本文データを使用して文書に関する問題を作成し、ユーザに問題の回答を入力させ、回答結果に応じて理解度を判定してもよい。正解が多い場合は理解度が高いと判定し、不正解が多い場合は理解度が低いと判定する。
具体的には、文書推薦サーバ5は、文書の本文のデータに基づいて問題(例えば穴埋め問題や多肢選択問題)を作成し、元の文書に紐付けて記憶しておく。ユーザが書籍を閲覧した後、文書推薦サーバ5は、ユーザ端末2に対し、文書に対応する問題を送信し、ユーザ端末2にて回答を入力させ、ユーザ端末2から回答を受信して点数(ポイント)を算出する。更に文書推薦サーバ5は、文書のジャンル毎に基準を設け、基準に対するポイントの値から理解度を算出する。例えば、ビジネス書の場合は、基準に対するポイントの値が100点の場合は理解度「5.00」、90点の場合は理解度「4.50」、・・・、0点の場合は理解度「0.50」のように決定する。
以上のように、文書に対する理解度の判定をユーザ端末2または文書推薦サーバ5のいずれかで行なうことにより、ユーザの理解度を文書推薦サーバ5にて客観的に収集することが可能となり、より公正に文書の難易度を求めることができるようになる。
また、上述の実施の形態では、ユーザの理解度レベルに応じて文書を苦手分野文書53bと得意分野文書53cとに分類したが、分類は得意と苦手の2種類に限定されず、更に細かく理解度レベルを設定し、分類してもよい。この場合は、全ユーザの書棚の分類も、平易有益文書55と難解有益文書57の2種類に限定されず、対応する理解度レベルに分類しておき、ユーザの理解度レベルに対応した推薦文書を、対応する理解度レベルの推薦文書群から検索すればよい。また、ユーザの既読文書が苦手分野文書53bまたは得意分野文書53cのいずれか一方のみに該当することとなってもよい。
また、上述の実施の形態では、各文書の文書ベクトルを算出する際、書誌情報31や文書評価記事情報52のコメントからキーワードを抽出するものとしたが、書誌情報31の蓄積されていない例えばインターネットに公開されている文書等の文書ベクトルを生成する場合は、文書の本文そのものからキーワードを抽出するようにしてもよい。
その他、当業者であれば、本願で開示した技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
1・・・文書推薦システム
2・・・ユーザ端末
3・・・書誌データベース
5・・・文書推薦サーバ
9・・・ネットワーク
21・・・書棚画面
22・・・文書登録画面
29・・・推薦文書
31・・・書誌情報
51・・・ユーザ情報
52・・・文書評価記事情報
53・・・ユーザプロファイル
53a・・・書棚(文書リスト)
53b・・・苦手分野文書
53c・・・得意分野文書
53d・・・苦手分野検索クエリ
53e・・・得意分野検索クエリ
53f・・・苦手分野対応文書
53g・・・得意分野対応文書
55・・・平易有益文書
57・・・難解有益文書

Claims (7)

  1. ユーザ端末とサーバとがネットワークを介して通信接続され、複数の前記ユーザ端末と前記サーバとの間で文書に関する情報を共有する文書推薦システムであって、
    前記ユーザ端末が、既読文書に対する評価として理解度及び有益度を付与し、サーバに登録する登録手段と、
    前記サーバにおいて、前記登録手段により登録された文書全体から有益度が比較的高い文書を抽出し、理解度レベル別に推薦文書群を作成する推薦文書群抽出手段と、
    前記サーバにおいて、各ユーザの前記既読文書に対する前記理解度に応じた推薦文書を、対応する理解度レベルの前記推薦文書群から検索する検索手段と、
    前記サーバにおいて、前記検索手段により検索された推薦文書の情報を前記ユーザ端末に提示する提示手段と、を備え
    前記推薦文書群抽出手段は、前記文書全体から少なくとも平易な有益文書群と、難解な有益文書群とを抽出し、
    前記検索手段は、ユーザの理解度の低い分野については前記平易な有益文書群から推薦文書を検索し、ユーザの理解度の高い分野については前記難解な有益文書群から推薦文書を検索することを特徴とする文書推薦システム。
  2. 前記検索手段は、
    前記推薦文書群の各文書の特徴を表現する文書ベクトルを生成する文書ベクトル生成手段と、
    前記既読文書の特徴を文書ベクトルの形式で表現する検索クエリを生成する検索クエリ生成手段と、
    前記文書ベクトル生成手段によって生成された前記推薦文書群の各文書の文書ベクトルと、前記検索クエリ生成手段により生成された検索クエリとの類似度を算出する類似度算出手段と、
    前記類似度算出手段によって算出された類似度に基づいて、推薦文書を決定する推薦文書決定手段と、
    を備えることを特徴とする請求項1に記載の文書推薦システム。
  3. ユーザ端末とサーバとがネットワークを介して通信接続され、複数の前記ユーザ端末と前記サーバとの間で文書に関する情報を共有する文書推薦システムであって、
    前記ユーザ端末が、既読文書に対する評価として理解度及び有益度を付与し、サーバに登録する登録手段と、
    前記サーバにおいて、前記登録手段により登録された文書全体から有益度が比較的高い文書を抽出し、理解度レベル別に推薦文書群を作成する推薦文書群抽出手段と、
    前記サーバにおいて、各ユーザの前記既読文書に対する前記理解度に応じた推薦文書を、対応する理解度レベルの前記推薦文書群から検索する検索手段と、
    前記サーバにおいて、前記検索手段により検索された推薦文書の情報を前記ユーザ端末に提示する提示手段と、を備え、
    前記検索手段は、
    前記推薦文書群の各文書の特徴を表現する文書ベクトルを生成する文書ベクトル生成手段と、
    前記既読文書の特徴を文書ベクトルの形式で表現する検索クエリを生成する検索クエリ生成手段と、
    前記文書ベクトル生成手段によって生成された前記推薦文書群の各文書の文書ベクトルと、前記検索クエリ生成手段により生成された検索クエリとの類似度を算出する類似度算出手段と、
    前記類似度算出手段によって算出された類似度に基づいて、推薦文書を決定する推薦文書決定手段と、を備え、
    前記検索クエリ生成手段は、全ユーザが前記文書に対して付与した理解度から
    該文書の理解度の基準値を求め、該基準値に対する相対的なユーザの理解度を重みとして算出する理解度重み算出手段を更に備え、
    前記理解度重み算出手段により算出された重みを、前記既読文書の特徴を表現する文書ベクトルに乗じて、前記検索クエリを生成することを特徴とする文書推薦システム。
  4. 前記提示手段は、前記検索手段により検索された推薦文書が複数ある場合は、更に有益度の高いものから順に前記ユーザ端末に提示することを特徴とする請求項1から請求項3のいずれかに記載の文書推薦システム。
  5. ネットワークを介してユーザ端末と通信接続され、ユーザ端末に対して文書の推薦情報を提示する文書推薦装置であって、
    複数のユーザ端末から、既読文書に対する評価として理解度及び有益度の付与を受け付ける評価受付手段と、
    前記評価受付手段によって評価の付与された文書全体から有益度が比較的高い文書を抽出し、理解度レベル別に推薦文書群を作成する推薦文書群抽出手段と、
    各ユーザの前記既読文書に対する前記理解度に応じた推薦文書を、対応する理解度レベルの前記推薦文書群から検索する検索手段と、
    前記検索手段により検索された推薦文書の情報を前記ユーザ端末に提示する提示手段と、を備え
    前記推薦文書群抽出手段は、前記文書全体から少なくとも平易な有益文書群と、難解な有益文書群とを抽出し、
    前記検索手段は、ユーザの理解度の低い分野については前記平易な有益文書群から推薦文書を検索し、ユーザの理解度の高い分野については前記難解な有益文書群から推薦文書を検索することを特徴とする文書推薦装置。
  6. ユーザ端末とサーバとがネットワークを介して通信接続され、複数の前記ユーザ端末と前記サーバとの間で文書に関する情報を共有する文書推薦システムにおける文書推薦方法であって、
    前記ユーザ端末が、既読文書に対する評価として理解度及び有益度を付与し、サーバに登録するステップと、
    前記サーバにおいて、登録された文書全体から有益度が比較的高い文書を抽出し、理解度レベル別に推薦文書群を作成する推薦文書群抽出ステップと、
    前記サーバにおいて、各ユーザの前記既読文書に対する前記理解度に応じた推薦文書を、対応する理解度レベルの前記推薦文書群から検索する検索ステップと、
    前記サーバにおいて、検索された推薦文書の情報を前記ユーザ端末に提示する提示ステップと、を含み、
    前記推薦文書群抽出ステップは、前記文書全体から少なくとも平易な有益文書群と、難解な有益文書群とを抽出し、
    前記検索ステップは、ユーザの理解度の低い分野については前記平易な有益文書群から推薦文書を検索し、ユーザの理解度の高い分野については前記難解な有益文書群から推薦文書を検索することを特徴とする文書推薦方法。
  7. コンピュータを請求項に記載の文書推薦装置として機能させるためのプログラム。
JP2010080217A 2010-03-31 2010-03-31 文書推薦システム、文書推薦装置、文書推薦方法、及びプログラム Expired - Fee Related JP5494126B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010080217A JP5494126B2 (ja) 2010-03-31 2010-03-31 文書推薦システム、文書推薦装置、文書推薦方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010080217A JP5494126B2 (ja) 2010-03-31 2010-03-31 文書推薦システム、文書推薦装置、文書推薦方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2011215679A JP2011215679A (ja) 2011-10-27
JP5494126B2 true JP5494126B2 (ja) 2014-05-14

Family

ID=44945369

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010080217A Expired - Fee Related JP5494126B2 (ja) 2010-03-31 2010-03-31 文書推薦システム、文書推薦装置、文書推薦方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5494126B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5831187B2 (ja) * 2011-12-08 2015-12-09 大日本印刷株式会社 コンテンツ情報配信装置及びコンテンツ情報配信方法
JP2014170438A (ja) * 2013-03-05 2014-09-18 Yahoo Japan Corp 情報処理装置及び方法
JP6295577B2 (ja) * 2013-09-30 2018-03-20 大日本印刷株式会社 サーバ装置、プログラム、及び、情報提供方法
WO2015182391A1 (ja) * 2014-05-26 2015-12-03 ソニー株式会社 情報処理装置、情報処理方法、及び、プログラム
US20170091838A1 (en) 2015-09-30 2017-03-30 International Business Machines Corporation Product recommendation using sentiment and semantic analysis
JP6734088B2 (ja) * 2016-03-25 2020-08-05 国立大学法人 東京大学 萌芽論文予測システム
KR101955244B1 (ko) * 2017-05-22 2019-05-30 주식회사 제오시스 논문 평가 방법 및 전문가 추천 방법
CN113793199A (zh) * 2021-09-14 2021-12-14 北京捷风数据技术有限公司 一种招中标信息推荐方法、系统及存储介质
CN117076658B (zh) * 2023-08-22 2024-05-03 南京朗拓科技投资有限公司 基于信息熵的引文推荐方法、装置及终端

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005062987A (ja) * 2003-08-08 2005-03-10 Shingakusha Co Ltd 教科書関連情報検索システム
JP2008071303A (ja) * 2006-09-15 2008-03-27 Ricoh Co Ltd ネットワークサービスシステム、ネットワークサーバ、ネットワーク処理方法、プログラムおよび記録媒体

Also Published As

Publication number Publication date
JP2011215679A (ja) 2011-10-27

Similar Documents

Publication Publication Date Title
JP5494126B2 (ja) 文書推薦システム、文書推薦装置、文書推薦方法、及びプログラム
Kang et al. based measurement of customer satisfaction in mobile service: Sentiment analysis and VIKOR approach
US8380727B2 (en) Information processing device and method, program, and recording medium
EP3575984A1 (en) Artificial intelligence based-document processing
WO2017013667A1 (en) Method for product search using the user-weighted, attribute-based, sort-ordering and system thereof
JP4538760B2 (ja) 情報処理装置および方法、プログラム、並びに記録媒体
JP6529133B2 (ja) 複数地域でのトピックの評価を分析する装置、プログラム及び方法
JP6390139B2 (ja) 文書検索装置、文書検索方法、プログラム、及び、文書検索システム
JP2007018285A (ja) 情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラム
Niu et al. Understanding faceted search from data science and human factor perspectives
JP5048852B2 (ja) 検索装置、検索方法、検索プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体
Anh et al. Extracting user requirements from online reviews for product design: A supportive framework for designers
JP2013033376A (ja) 情報処理装置、情報処理方法、および、プログラム
JP5138621B2 (ja) 情報処理装置及び不満解決商品発見方法及びプログラム
JP4883644B2 (ja) リコメンド装置、リコメンドシステム、リコメンド装置の制御方法、およびリコメンドシステムの制御方法
JP2020091539A (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP4538758B2 (ja) 情報処理装置および方法、プログラム、並びに記録媒体
JP2015125594A (ja) 情報処理装置、情報処理方法、プログラム
US20230161949A1 (en) Intelligent content identification and transformation
Wolff et al. Overview of LiLAS 2021–Living Labs for Academic Search
Panayotov Ein visuelles Erkundungstool zur zeitlichen Analyse von Kundenbewertungen
Nurkholis et al. Web Scraping for Summarization of Freelance Job Website Using Vector Space Model
Muttaqin et al. Implementation of Word Recommendation System Using Hybrid Method for Speed Typing Website
Kanjanawattana et al. Semantic-based search engine system for graph images in academic literature
JP5782489B2 (ja) 関連行動推薦方法及び装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130118

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140217

R150 Certificate of patent or registration of utility model

Ref document number: 5494126

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees