JP2011165024A - 文書配信装置 - Google Patents

文書配信装置 Download PDF

Info

Publication number
JP2011165024A
JP2011165024A JP2010028502A JP2010028502A JP2011165024A JP 2011165024 A JP2011165024 A JP 2011165024A JP 2010028502 A JP2010028502 A JP 2010028502A JP 2010028502 A JP2010028502 A JP 2010028502A JP 2011165024 A JP2011165024 A JP 2011165024A
Authority
JP
Japan
Prior art keywords
browsing
user
page
document
tendency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010028502A
Other languages
English (en)
Other versions
JP5428918B2 (ja
Inventor
Yuya Furuoka
佑也 古岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2010028502A priority Critical patent/JP5428918B2/ja
Publication of JP2011165024A publication Critical patent/JP2011165024A/ja
Application granted granted Critical
Publication of JP5428918B2 publication Critical patent/JP5428918B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】文書構造自体から正確な予測が行えない場合や閲覧傾向が相違するユーザが存在する場合には次に閲覧される可能性の高いページを精度良く予測できないためにレスポンスが低下する。
【解決手段】文書配信装置10は、閲覧要求元のユーザから要求された文書のページを所定の形式に変換して配信するとともに、ユーザから後に閲覧要求されることが予測されるページを、文書を構成するページごとの閲覧傾向とユーザの閲覧傾向とを比較して決定し、この決定したページを、そのページに対する閲覧要求に先行して所定の形式に変換して記憶手段に保持する。
【選択図】図1

Description

本発明は、閲覧要求元から要求された文書のページを所定の形式に変換して配信する文書配信装置に関する。
PC用アプリケーションで作成された文書を高速かつセキュアに閲覧したいという需要に応えるために、文書ファイルを画像などの所定の形式に変換してPC(パーソナルコンピュータ)や携帯電話に配信する文書配信装置が提案ないし実用化されている。
例えば特許文献1には、ワープロソフト用ファイル、表計算ソフト用ファイル、プレゼンテーションソフト用ファイルなどのファイル形式で作成された電子文書を、配信サーバ側が画像に変換して、PCや携帯電話機などの閲覧要求元にネットワークを通じて配信する文書配信装置が記載されている。
また、特許文献2には、MPEG2形式などで保存された自宅内の映像コンテンツをコーデック(例えば3GPP)に変換して携帯電話で視聴できるようにするコンテンツ視聴装置が記載されている。また、この特許文献2では、取得中のコンテンツの先読み箇所を予測し、この予測結果に基づいてコンテンツデータを先読みしてコード変換を事前に行っておくことにより、操作のレスポンスを早めてユーザの使い勝手を向上させる技術が提案されている。具体的には以下のような方法で先読み箇所を予測する。
(1)一定期間後または一定期間前へのスキップ操作が行われると予測して、現在再生している地点の常に一定期間後もしくは一定期間前を先読み地点とする。
(2)コンテンツ中からシーン検出を行い、シーンの切り替わり位置までスキップが行われると予測する。
(3)コンテンツにタグやメタデータが付与された位置までスキップが行われると予測する。
(4)コンテンツに対して何れかのユーザが行った操作とその操作が行われた地点との履歴に基づいて先読み地点を予測する。
特開2009−134651号公報 特開2008−206039号公報
文書ファイルを画像などの所定の形式に変換してPCや携帯電話に配信する文書配信装置において、閲覧要求を受け付けてからページを所定の形式に変換する処理を開始すると、閲覧要求元にデータを送信するまでに時間がかかり、レスポンスが低下する。これを防止するために、文書配信装置において、閲覧要求元から文書の閲覧要求があった時点で、その文書の全てのページを所定の形式に変換して保持する処理をバックグラウンドで開始する構成では、処理コストの著しい増大を招く。
一方、特許文献1に記載の文書配信装置に特許文献2に記載の予測方法を適用すれば、文書の全てのページを前もって所定の形式に変換して保持する方法に比べて、少ない処理コストでレスポンスの改善が期待できる。しかし、特許文献2に記載の予測方法は、コンテンツの構造自体から予測を行う予測手法(1〜3)、あるいは個々のユーザは他のユーザと同様な操作を行うとの前提で成り立つ予測手法(4)である。従って、文書構造自体から正確な予測が行えない場合や、他のユーザとは異なる閲覧傾向を持つユーザが存在する場合には、予測精度が低下し、レスポンスの改善が困難になる。
本発明の目的は、上述したような課題、すなわち文書構造自体から正確な予測が行えない場合や閲覧傾向が相違するユーザが存在する場合には次に閲覧される可能性の高いページを精度良く予測できないためにレスポンスが低下する、という課題を解決する文書配信装置を提供することにある。
本発明の一形態にかかる文書配信装置は、閲覧要求元のユーザごとの閲覧傾向と文書を構成するページごとの閲覧傾向とを記憶するユーザ・文書データ記憶手段と、上記閲覧要求元のユーザから後に閲覧要求されることが予測されるページを、上記文書を構成するページごとの閲覧傾向と上記ユーザの閲覧傾向とを比較して決定する変換予測手段と、上記変換予測手段により予測されたページを該ページに対する閲覧要求より先行して上記所定の形式に変換して上記変換データ記憶手段に記憶し、上記閲覧要求元のユーザから要求された文書のページの変換データが上記変換データ記憶手段に存在する時は上記変換データを読み出して上記閲覧要求元へ送信し、存在しない時には上記ページを上記所定の形式に変換して上記閲覧要求元へ送信する配信制御手段とを備える。
本発明は上述したように構成されているため、文書構造自体から正確な予測が行えない場合や閲覧傾向が相違するユーザが存在する場合であっても、次に閲覧される可能性の高いページを精度良く予測することができ、閲覧時のレスポンスを改善することが可能である。
本発明の第1の実施形態のブロック図である。 本発明の第2の実施形態のブロック図である。 ユーザ・文書データ記憶DBのER図である。 ユーザ情報テーブルの構成例を示す図である。 ブック情報テーブルの構成例を示す図である。 ユーザ閲覧情報テーブルの構成例を示す図である。 ブック閲覧情報テーブルの構成例を示す図である。 ユーザ閲覧情報(付属)テーブルの構成例を示す図である。 ブック閲覧情報(付属)テーブルの構成例を示す図である。 ページポイント情報テーブルの構成例を示す図である。 本発明の第2の実施形態の動作の流れを説明する図である。 変換予測手段の動作の流れを示すフローチャートである。
次に本発明の実施の形態について図面を参照して詳細に説明する。
[第1の実施形態]
図1を参照すると、本発明の第1の実施形態にかかる文書配信装置10は、閲覧要求元に対して、ワープロソフト用ファイル、表計算ソフト用ファイル、プレゼンテーションソフト用ファイルなどのファイル形式で作成された文書を、JPEG、GIF、SVG(Scalable Vector Graphics)等の画像として配信するサーバ装置である。この文書配信装置10は、配信制御手段101と、変換予測手段102と、ユーザ・文書データ記憶手段103と、変換データ記憶手段104とを備えている。
ユーザ・文書データ記憶手段103は、閲覧要求元のユーザを一意に識別するユーザ識別子に対応してそのユーザの閲覧傾向を記憶し、また、文書を構成するページを一意に識別するページ識別子に対応してそのページの閲覧傾向を記憶する機能を有する。
或るユーザの閲覧傾向とは、そのユーザが文書を閲覧する仕方の偏りを意味する。例えば、閲覧に使用できる機器としてPCと携帯電話機との2種類の機器が存在するとして、或るユーザが専ら携帯電話機を使って閲覧するならば、そのユーザは携帯電話機を使って閲覧する傾向がある。また、そのユーザが1日の内で専ら午前中に文書を閲覧するならば、そのユーザは午前に閲覧する傾向がある。
また或るページの閲覧傾向とは、そのページが閲覧される仕方の偏りを意味する。例えば、閲覧に使用できる機器としてPCと携帯電話機との2種類の機器が存在するとして、或るページが専ら携帯電話機を使って閲覧されるならば、そのページは携帯電話機を使って閲覧される傾向がある。また、そのページが1日の内で専ら午前中に閲覧されるならば、そのページは午前に閲覧される傾向がある。また、そのページが専らマネージャという属性を持つユーザによって閲覧されるならば、そのページはマネージャに閲覧される傾向がある。
変換予測手段102は、閲覧要求元のユーザから後に閲覧要求されることが予測されるページを、その文書を構成するページごとの閲覧傾向とそのユーザの閲覧傾向とを比較して決定する機能を有する。変換予測手段102は、例えば、その文書を構成するページごとに、そのページの閲覧傾向とユーザの閲覧傾向とを比較し、ユーザの閲覧傾向と同じ或いは類似する閲覧傾向を持つページには所定値のポイントを与え、ユーザの閲覧傾向と相違する閲覧傾向を持つページには所定値より低いポイントを与え、合計ポイントが高い上位所定個数のページ、または合計ポイントが所定値を超えるページを、そのユーザから後に閲覧要求されることが予測されるページとして決定する。
変換データ記憶手段104は、ページの画像をページ識別子に対応付けて記憶する機能を有する。各文書の各ページは、文書配信装置10内の図示しない記憶部に保存されていても良いし、文書配信装置10と通信可能な外部のサーバに保存されていても良い。
配信制御手段101は、変換予測手段102により予測されたページを当該ページに対する閲覧要求より先行して画像に変換して変換データ記憶手段104に記憶する機能と、閲覧要求元のユーザから要求された文書のページの画像が変換データ記憶手段104に存在する時は、その画像を読み出して閲覧要求元へ送信し、存在しない時には、そのページを画像に変換して閲覧要求元へ送信する機能とを有する。
また、配信制御手段101は、閲覧要求元のユーザごとの閲覧履歴と文書を構成するページごとの閲覧履歴とをユーザ・文書データ記憶手段103に記録する機能を有していても良い。閲覧履歴の記録は、1ページの閲覧が行われるごとに行っても良いし、数ページの閲覧ごとにまとめて行っても良い。また、ユーザが文書配信装置に接続してから切断するまでに閲覧した全ページの単位でまとめて行っても良い。記録する閲覧履歴は、閲覧傾向を算出する元データになるため、閲覧傾向の算出に必要なデータを含む。例えば、ユーザの閲覧履歴には、閲覧に使用した機器の種類(例えばPC、携帯電話機等の種別)、閲覧した時刻、ユーザの属性(例えば役職)を含む。また、ページの閲覧履歴には、閲覧に使用された機器の種類(例えばPC、携帯電話機等の種別)、閲覧された時刻、閲覧したユーザの属性(例えば役職)を含む。これらの閲覧履歴は、次回のユーザによる閲覧要求時に閲覧傾向を算出する際に参照される。配信制御手段101は、閲覧に使用した機器が何であるかや、ユーザの属性が何であるかは、例えば閲覧要求中に含まれる機器の種別、ユーザの属性を識別することで認識することができる。
また、変換予測手段102は、最新の傾向による予測を行うために、閲覧要求元のユーザに関して変換予測手段102による予測を行う前に、ユーザ・文書データ記憶手段103に記録された閲覧履歴に基づいて、閲覧要求元のユーザの閲覧傾向とページごとの閲覧傾向とを算出して、ユーザ・文書データ記憶手段103に保存する機能を有していても良い。
次に本実施形態にかかる文書配信装置10の動作を説明する。
文書配信装置10の配信制御手段101は、閲覧要求元のユーザが自装置10に接続し、接続後初めて文書の閲覧を要求すると、ユーザから指定されたページあるいはデフォルトで定まるページの画像が変換データ記憶手段104に記憶されていれば、その画像を変換データ記憶手段104から読み出して閲覧要求元のユーザへ送信する。また、その画像が記憶されていなければ、そのページの画像を生成し、閲覧要求元のユーザへ送信する。
配信制御手段101は、上記のような動作に続いて、変換予測手段102に対して閲覧要求元のユーザと閲覧要求された文書とを通知して予測を要求する。変換予測手段102は、ユーザ・文書データ記憶手段103から、閲覧要求元のユーザごとの閲覧履歴と文書を構成するページごとの閲覧履歴とを読み出し、この読み出した閲覧履歴に基づいて、閲覧要求元のユーザの閲覧傾向とページごとの閲覧傾向とを算出する。次に変換予測手段102は、その文書のページごとに、そのページの閲覧傾向とユーザの閲覧傾向とを比較して、双方の閲覧傾向の類似度に応じたポイントを算出する。次に変換予測手段102は、ポイントが高い上位所定個数のページ、またはポイントが所定値を超えるページを、そのユーザから後に閲覧要求されることが予測されるページとして決定する。次に、変換予測手段102は、決定したページのページ識別子を配信制御手段101に通知する。
配信制御手段101は、変換予測手段102から通知されたページ識別子で特定される文書のページを画像に変換し、変換データ記憶手段104に記憶する。
文書配信装置10から最初の文書の画像を受信した閲覧要求元のユーザが、同じ文書の別のページの閲覧を要求すると、配信制御手段101は、要求されたページの画像が変換データ記憶手段104に記憶されていれば、その画像を変換データ記憶手段104から読み出して閲覧要求元のユーザへ送信する。また、その画像が記憶されていなければ、指定されたページを画像に変換し、閲覧要求元のユーザへ送信する。
以上の説明では、ワープロソフト用ファイルなどのファイル形式で作成された文書のページを画像として配信したが、ページの変換データは画像だけに限定されず、その他の形式でも良い。
このように本実施形態によれば、文書構造自体から正確な予測が行えない場合や閲覧傾向が相違するユーザが存在する場合であっても、次に閲覧される可能性の高いページを精度良く予測することができ、閲覧時のレスポンスを改善することができる。
その理由は、閲覧要求元のユーザから後に閲覧要求されることが予測されるページを、その文書を構成するページごとの閲覧傾向とそのユーザの閲覧傾向とを比較して決定するためである。すなわち、閲覧傾向の類似するユーザは似たようなページを閲覧する傾向にあり、閲覧傾向の類似するユーザからの閲覧頻度が高く、他のユーザからの閲覧頻度が低いページは、上記閲覧傾向の類似するユーザの閲覧傾向と類似した閲覧傾向になる。従って、閲覧要求元のユーザの閲覧傾向に類似する閲覧傾向を持つページは、当該ユーザに閲覧される可能性の高いページとなる。
[第2の実施形態]
図2を参照すると、本発明の第2の実施形態にかかる文書配信装置である配信サーバ11は、LAN等のネットワーク2を介して1以上のクライアント端末1に接続されている。また配信サーバ11は、送受信手段111と、変換制御手段112と、文書変換手段113と、変換データ記憶データベース(以下、変換データ記憶DBと言う)114と、変換予測手段115と、ユーザ・文書データ記憶データベース(以下、ユーザ・文書データ記憶データベースと言う)116とを備えている。
[概要]
クライアント端末1から閲覧要求があると、配信サーバ11の変換制御手段112は、送受信手段111経由で要求内容を受け取り、文書変換手段113に対し、要求された文書データをクライアント端末1で閲覧可能な形式に変換するように指示する。そして、その結果返却された変換データを送受信手段111経由でクライアント端末1に配信する。このとき、変換制御手段112は、文書変換手段113へ変換要求を行うのと並行して、変換予測手段115に対して変換予測要求を行う。
変換予測手段115は、閲覧ユーザと文書ファイルの閲覧傾向のデータをユーザ・文書データ記憶DB116から検索し、データの比較を行う。そして、比較結果を基に予測を行い、結果を変換制御手段112に返却する。
変換制御手段112は、最初に要求されたページに続いて、変換予測手段115が予測した閲覧される可能性が高いページを順に変換するように文書変換手段113に対して変換要求を行い、バックエンドで変換を開始しておく。
開始ページの閲覧後、クライアント端末1から他のページに対する閲覧要求を行われた場合、文書変換手段113は、対象ページが上記予測によって既に変換済みの場合には即時に対象データを返却する。対象データが存在しない場合には、開始ページと同様に対象ページの変換と返却を行う。このとき、前回の閲覧要求時と比べて閲覧傾向が変化している可能性があるので、最新の閲覧傾向に基づいて再び予測変換を行うようにしても良い。
このようにして文書配信システムを実現することで、ユーザに合わせた予測を行うことができ、文書構造による静的な予測と比べて、変換データの蓄積に必要なディスク容量を増加させることなく、複数ページの閲覧要求に対するレスポンス時間を短縮することができる。
以下、本実施形態の構成と動作をより詳細に説明する。
[構成]
送受信手段111は、クライアント端末1とデータの送受信を行う機能を有する。送受信手段111は、クライアント端末1から閲覧要求を受信すると、受信した閲覧要求を変換制御手段112に渡す。また、送受信手段111は、変換制御手段112から処理結果として文書ページの画像を受け取り、閲覧要求元のクライアント端末1へ送信する。
変換制御手段112は、送受信手段111から受け取った閲覧要求に従って配信サーバの主たる制御を行う機能を有する。変換制御手段112は、文書変換手段113を用いて要求された文書の変換を行う。変換処理は多重要求を受ける可能性があるため、キュー制御を行う。
文書変換手段113は、変換制御手段112から受け取った要求内容を基に、配信サーバ内あるいは外部サーバから文書のページの内容など必要な情報を入手し、文書ファイルをクライアント端末で閲覧可能な形式(例えば、ページ単位の画像)に変換する機能である。本実施形態では、対象ページを指定して変換可能とする。
変換データ記憶DB114は、文書変換手段113で変換された後のデータを記憶する手段であり、変換制御手段112から削除指示があるまでデータを保持する。
変換予測手段115は、変換する対象(ページ)を予測し、決定する機能である。ユーザ・文書データ記憶DB116に保持されているユーザと文書の閲覧データを利用して予測を行う。具体的にはユーザの閲覧データと文書の閲覧データに類似点が多いほど、そのページは閲覧される可能性が高いと予測する(比較方法は後述)。
なお、ユーザと文書ファイルに持たせるデータ項目は以下のものを用いる。
(i)ユーザ属性(どの属性に属すか、どの属性によく閲覧されるか)
(ii)閲覧日時(どの時間帯によく閲覧するか、どの時間帯によく閲覧されるか)
(iii)閲覧環境(どの環境でよく閲覧するか、どの環境でよく閲覧されるか)
ユーザ・文書データ記憶DB116は、変換予測手段115が分析した各ユーザと各文書の閲覧傾向を保存する。本実施形態では、配信サーバ11内に配置した構成だが、DB単体として配信サーバ11外に配置しても良い。
クライアント端末1は、ユーザが文書を閲覧する端末であり、PCや携帯電話機など汎用的な端末を想定している。ユーザの要求を受けて、ネットワーク2を介して配信サーバ11にアクセスし、受信した文書を画面に表示する。
[ユーザ・文書データ記憶DB116の詳細]
ユーザ・文書データ記憶DB116のER図を図3に示す。ユーザ情報エンティティ、ブック情報エンティティ、ユーザ閲覧情報エンティティ、ブック閲覧情報エンティティ、ユーザ閲覧情報(付属)エンティティ、ブック閲覧情報(付属)エンティティ、およびページポイント情報エンティティから構成される。
ユーザ情報エンティティは、ユーザを一意に識別するユーザID(PK(主キー))、ユーザ名が設定される。図4は、ユーザ情報エンティティの定義から作成されたユーザ情報テーブルの構成例である。
ブック情報エンティティは、文書を一意に識別するブックID(PK)、総ページ数、文書名が設定される。図5は、ブック情報エンティティの定義から作成されたブック情報テーブルの構成例である。
ユーザ閲覧情報エンティティは、ユーザID(PK)、ユーザ属性、閲覧環境、閲覧時間が設定される。後ろの3つがユーザの閲覧傾向を示す。図6は、ユーザ閲覧情報エンティティの定義から作成されたユーザ閲覧情報テーブルの構成例である。
ブック閲覧情報エンティティは、ブックID(PK)、ページ番号、ユーザ属性、閲覧環境、閲覧時間が設定される。後ろの3つがページの閲覧傾向を示す。図7は、ブック閲覧情報エンティティの定義から作成されたブック閲覧情報テーブルの構成例である。
ユーザ閲覧情報(付属)エンティティは、ユーザID(PK)、PC閲覧回数、携帯閲覧回数、午前閲覧回数、午後閲覧回数が設定される。後ろの4つがユーザの閲覧履歴に相当する。図8は、ユーザ閲覧情報(付属)エンティティの定義から作成されたユーザ閲覧情報(付属)テーブルの構成例である。
ブック閲覧情報(付属)エンティティは、ブックID(PK)、ページ番号、ユーザ属性カウント、PC閲覧回数、携帯閲覧回数、午前閲覧回数、午後閲覧回数が設定される。後ろの5つがページの閲覧履歴に相当する。図9は、ブック閲覧情報(付属)エンティティの定義から作成されたブック閲覧情報(付属)テーブルの構成例である。
ページポイント情報エンティティは、ユーザID(PK)、ブックID(PK)、ページ番号(PK)、閲覧ポイントが設定される。閲覧ポイントは、当該ユーザの閲覧傾向と当該ページの閲覧傾向との類似度を示す値に相当する。図10は、ページポイント情報エンティティの定義から作成されたページポイント情報テーブルの構成例である。
[動作の説明]
図11を参照して、本実施形態の動作を説明する。クライアント端末のユーザが閲覧文書を指定すると、クライアント端末1からユーザIDと指定した文書のブックIDがネットワーク2に送信される(1)。なお、ユーザがページを指定した場合には、ページ番号がクライアント端末1からネットワーク2に送信される。
ネットワーク2を介して送受信手段111は、ユーザIDとブックIDとページ番号とを受信する(2)。次に、送受信手段111から変換制御手段112に、ユーザIDとブックIDとページ番号とが渡される(3)。
次に、以下の流れで文書変換手段113に変換する文書のページ番号が渡される。まず、変換制御手段112は、ユーザが指定した文書のページ番号を文書変換手段113に渡す(4−1)。それと並行して変換制御手段112は、変換予測手段115に対してユーザIDとブックIDとを渡して予測を行うよう指示する(4−2)。変換予測手段115は、ユーザ・文書データ記憶DB116からそのユーザの閲覧履歴とその文書の各ページの閲覧履歴とを検索して取り出す(4−3)。次に、変換予測手段115は、取り出したデータを用いて、ユーザの閲覧傾向と各ページの閲覧傾向とを算出して変換予測を行い、予測したページ番号を変換制御手段112に返却する(4−5)。変換制御手段112は、この予測されたページ番号を文書変換手段113に渡す。
文書変換手段113は、渡されたページ番号のページを画像に変換し、変換制御手段112に返却する(5)。
次に、以下の流れで変換された画像の返却とDBの更新が行われる。変換制御手段112は、変換予測手段115で予測されたページの画像は、次回以降の閲覧で利用するために変換データ記憶DB114に保存する(6−1)。また変換制御手段112は、今回の閲覧要求に関するユーザとページの閲覧履歴をユーザ・文書データ記憶DB116に記録する(6−2)。このとき、変換制御手段112は、次回の予測に備えて当該ユーザと当該文書との閲覧傾向を分析するように変換予測手段115に指示するようにしても良い。次に変換制御手段112は、クライアントから指定された閲覧ページの画像を送受信手段111に渡す(6−3)。
送受信手段111は、ネットワーク2を通じて画像を送信する(7)。クライアント端末1は、指定したページの画像をネットワーク2を介して受信し、端末画面に表示する(8)。
クライアント端末1から2回目以降の閲覧要求があった場合、ユーザに指定されたページ番号の画像が変換データ記憶DB114に存在すれば、変換制御手段112はその画像を即座にクライアント端末1に返却する(図11の※)。
続いて、変換予測手段115の動作を中心に、本実施形態の動作例を説明する。図12は変換予測手段115の動作例を示すフローチャートである。以下の説明とあわせて参照されたい。
ユーザが閲覧のためにシステムにアクセスして文書を指定すると、変換制御手段112は、ネットワーク2を介して送受信手段111が受け取ったユーザIDと文書IDを変換予測手段115に通知する。なお、変換制御手段112は、事前に、そのIDを持つユーザのデータがユーザ・文書データ記憶DB116に存在するか否かを確認し、若し存在しない場合はそのIDのユーザをユーザ・文書データ記憶DB116に新規登録する。
変換予測手段115は、ユーザと文書の閲覧履歴データをユーザ・文書データ記憶DB116から取得し、予測を行う。比較を用いた予測は以下の手順で行う。
(i)DB内のユーザ閲覧情報テーブルからユーザIDを参照して閲覧ユーザの閲覧傾向をDBより抜き出す。
(ii)DB内のブック閲覧情報テーブルからブックIDを参照して各ページの閲覧傾向をDBより抜き出す。
(iii)抜き出した閲覧ユーザの閲覧傾向と各ページごとの閲覧傾向との比較を行う。具体的には、閲覧ユーザの閲覧傾向の列の値と、ページの閲覧傾向の対応する列の値との比較を、各ページごとに行う。
比較する際に対応するのは、それぞれ以下の列となる。
<ユーザの閲覧傾向> <文書データ(ページ毎)>
ユーザ属性 ⇔ (閲覧)ユーザ属性
閲覧環境 ⇔ 閲覧環境
閲覧日時 ⇔ 閲覧日時
閲覧傾向の比較の結果、類似度が高いページにはポイントを加算する。比較方法とポイントの付け方については以下の方法を用いる。
○ユーザ属性の比較
ユーザ属性の比較を説明する前に、まず、ユーザとページの閲覧傾向におけるユーザ属性について説明する。
ユーザの閲覧傾向は、単一もしくは複数のユーザ属性を持つ。或るユーザUの閲覧傾向におけるユーザ属性は、そのユーザUが所属するグループによって決定される。複数のグループに所属するユーザUの場合には、所属する全てのグループにおけるユーザ属性を持たせる(複数のユーザ属性を持つのはこの場合のみ)。
ページの閲覧傾向は、単一もしくは複数のユーザ属性を持つ。或るページPの閲覧傾向におけるユーザ属性は、そのページPを閲覧したユーザのユーザ属性をカウントし、最も閲覧回数の多いユーザ属性を持つ方式を取る。最も閲覧回数の多いユーザ属性が複数存在する場合は、その全てのユーザ属性をそのページPのユーザ属性として持たせる(複数のユーザ属性を持つのはこの場合のみ)。
ユーザUとページPのユーザ属性の比較は次のように行う。まず、ユーザUの閲覧傾向におけるユーザ属性とページPの閲覧傾向におけるユーザ属性を比較し、完全一致、部分一致、一致せずの3つに分類する。完全一致の場合は2ポイント、部分一致の場合は1ポイント、一致せずの場合はポイントなしとして計算する。
比較例1
ユーザ閲覧傾向のユーザ属性:マネージャ・主任
ページ閲覧傾向のユーザ属性:マネージャ・主任
比較結果→完全一致
比較例2
ユーザ閲覧傾向のユーザ属性:マネージャ・担当
ページ閲覧傾向のユーザ属性:マネージャ・主任
比較結果→部分一致
比較例3
ユーザ閲覧傾向のユーザ属性:マネージャ
ページ閲覧傾向のユーザ属性:主任・担当
比較結果→一致せず
○閲覧環境の比較
閲覧環境の比較を説明する前に、まず、ユーザとページの閲覧傾向における閲覧環境について説明する。
ユーザの閲覧傾向は、単一の閲覧環境データを持つ。具体的には、「PC」、「携帯」、「両者」の何れかを持つ。或るユーザUの閲覧傾向における閲覧環境データは、以下のようにして決定される。
ユーザUが、現在までに、何れかの文書の何れかのページを合計a+b回だけ閲覧しており、そのうちPCを使って閲覧した回数がa回、携帯を使って閲覧した回数がb回とすると、
Max(a、b)/(a+b)=xとして、
x>=0.66のとき、Max(a、b)で決まる機器(PC或いは携帯)、
x<=0.66のとき、PCおよび携帯、
をそのユーザUの閲覧環境データとする。
ページの閲覧傾向は、単一の閲覧環境データを持つ。具体的には、「PC」、「携帯」、「両者」の何れかを持つ。或るページPの閲覧傾向における閲覧環境データは、以下のようにして決定される。
ページPが、現在までに、任意のユーザから合計a+b回だけ閲覧されており、そのうちPCを使って閲覧された回数がa回、携帯を使って閲覧された回数がb回とすると、
Max(a、b)/(a+b)=xとして、
x>=0.66のとき、Max(a、b)で決まる機器(PC或いは携帯)、
x<=0.66のとき、PCおよび携帯、
をそのページPの閲覧環境データとする。
計算例1
・PC閲覧回数=10回、携帯閲覧回数=1回の場合
x=Max(10、1)/(10+1)≒0.91>0.66
よって閲覧環境データは「PC」
計算例2
・PC閲覧回数=10回、携帯閲覧回数=10回の場合
x=Max(10、10)/(10+10)=0.50<0.66
よってデータは「両者」
ユーザUとページPの閲覧環境データの比較は次のように行う。ユーザUの閲覧環境データとページPの閲覧環境データとを比較し、一致した場合は1ポイント、一致しなかった場合はポイントなしとして計算する。
○閲覧日時の比較
閲覧日時の比較を説明する前に、まず、ユーザとページの閲覧傾向における閲覧日時について説明する。
ユーザの閲覧日時は、単一の閲覧日時データを持つ。具体的には、「AM」、「PM」、「両者」の何れかを持つ。或るユーザUの閲覧傾向における閲覧日時データは、以下のようにして決定される。
ユーザUが、現在までに、何れかの文書の何れかのページを合計a+b回だけ閲覧しており、そのうち午前に閲覧した回数がa回、午後に閲覧した回数がb回とすると、
Max(a、b)/(a+b)=xとして、
x>=0.66のとき、Max(a、b)で決まる時間帯(AM或いはPM)、
x<=0.66のとき、AMおよびPM、
をそのユーザUの閲覧日時データとする。
ページの閲覧日時は、単一の閲覧日時データを持つ。具体的には、「AM」、「PM」、「両者」の何れかを持つ。或るページPの閲覧傾向における閲覧日時データは、以下のようにして決定される。
ページPが、現在までに、任意のユーザによって合計a+b回だけ閲覧されており、そのうち午前に閲覧された回数がa回、午後に閲覧された回数がb回とすると、
Max(a、b)/(a+b)=xとして、
x>=0.66のとき、Max(a、b)で決まる時間帯(AM或いはPM)、
x<=0.66のとき、AMおよびPM、
をそのページPの閲覧日時データとする。
ユーザUとページPの閲覧日時データの比較は次のように行う。ユーザUの閲覧日時データとページPの閲覧日時データとを比較し、一致した場合は1ポイント、一致しなかった場合はポイントなしとして計算する。
次に変換予測手段115は、ユーザ属性、閲覧環境、閲覧日時のそれぞれで計算したポイントを加算し、合計ポイントがある一定の値(閾値)以上(例:3ポイント以上など)のページを予測結果として変換制御手段112に返却する。なお、予測決定のための上記閾値は設定で変更できる仕様とする。また、計算した各ページのポイントは、次回閲覧時には動的に変化する可能性があるので閲覧終了時に削除し、毎閲覧時に計算するのが望ましい。
変換制御手段112は、予測結果(ページ番号)を基に文書変換手段113に変換要求を行う。文書変換手段113は、受け取った予測結果を基に変換処理を行い、変換したデータを返却する。変換制御手段112は、受け取ったデータを変換データ記憶DB114に一時的に保存しておく。そして、ユーザに閲覧要求された文書のページを配信後、ユーザから同一文書内の別のページの閲覧要求があった場合、変換制御手段112は、閲覧指定されたページが変換データ記憶DB114に存在するか確認する。予測によって変換済みであれば、データを即座に返却しユーザに配信する。存在しない場合は、変換要求→変換→履歴更新→配信を行う。このとき、履歴の更新によって、閲覧傾向に変化が生じる可能性があるので、再び閲覧傾向の算出と保存、予測変換を行うようにしても良い。以上のような動作を閲覧要求ごとに繰り返し行う。
なお、変換制御手段112は、送受信手段111を通じてクライアント端末1が閲覧を終了したことを受け取ると、変換データ記憶DB114とユーザ・文書データ記憶DB116から不要になったデータを削除する。閲覧の終了が判断できない場合には、一定期間経過後に削除する方法でも構わない。
[効果の説明]
本実施の形態によれば、以下に記載するような効果を奏する。
第1の効果は、ユーザとページの閲覧傾向を用いた予測を取り入れたことによって、文書の構造を用いた予測では予測困難な場合でも予測が可能になり、レスポンス時間を短縮できることである。すなわち、ユーザと文書の実際の閲覧傾向を予測に反映させることでより正確な予測を行うことができ、効率的にバックエンドで文書を変換しておくことが可能となる。
第2の効果は、予測の精度が向上することによるリソースの削減である。すなわち、予測の精度が悪いとそれを見越してより多くのページの変換を行う必要があるために変換データを保存するDBなどのリソースを無駄に使用することになるが、予測の精度が向上すると、そのような無駄が少なくなる。
なお、本実施の形態の説明においては、ユーザ属性と閲覧時刻と閲覧環境の3つに着目した閲覧傾向を用いて予測を行ったが、その内の何れか1つまたは2つに着目した閲覧傾向を用いて予測を行う実施の形態も考えられる。また、他の方式、例えば文書構造などの要素に着目した予測と組み合わせることも可能である。
以上本発明の実施の形態について説明したが、本発明は以上の実施の形態にのみ限定されず、その他各種の付加変更が可能である。また、本発明の文書配信装置は、その有する機能をハードウェア的に実現することは勿論、コンピュータとプログラムとで実現することができる。プログラムは、磁気ディスクや半導体メモリ等のコンピュータ可読記録媒体に記録されて提供され、コンピュータの立ち上げ時などにコンピュータに読み取られ、そのコンピュータの動作を制御することにより、そのコンピュータを前述した各実施の形態における文書配信装置として機能させる。
1 クライアント端末
2 ネットワーク
10 文書配信装置
11 配信サーバ
101 配信制御手段
102 変換予測手段
103 ユーザ・文書データ記憶手段
104 変換データ記憶手段
111 送受信手段
112 変換制御手段
113 文書変換手段
114 変換データ記憶DB
115 変換予測手段
116 ユーザ・文書データ記憶DB

Claims (10)

  1. 閲覧要求元のユーザごとの閲覧傾向と文書を構成するページごとの閲覧傾向とを記憶するユーザ・文書データ記憶手段と、
    前記閲覧要求元のユーザから後に閲覧要求されることが予測されるページを、前記文書を構成するページごとの閲覧傾向と前記ユーザの閲覧傾向とを比較して決定する変換予測手段と、
    前記ページを所定の形式に変換した変換データを記憶する変換データ記憶手段と、
    前記変換予測手段により予測されたページを該ページに対する閲覧要求より先行して前記所定の形式に変換して前記変換データ記憶手段に記憶し、前記閲覧要求元のユーザから要求された文書のページの変換データが前記変換データ記憶手段に存在する時は前記変換データを読み出して前記閲覧要求元へ送信し、存在しない時には前記ページを前記所定の形式に変換して前記閲覧要求元へ送信する配信制御手段と
    を備えることを特徴とする文書配信装置。
  2. 前記閲覧要求元のユーザごとの閲覧傾向の一つとして閲覧に使用する機器の傾向を使用し、前記ページごとの閲覧傾向の一つとして閲覧に使用される機器の傾向を使用する
    ことを特徴とする請求項1に記載の文書配信装置。
  3. 前記閲覧要求元のユーザごとの閲覧傾向の一つとして閲覧に使用する機器の傾向を使用し、前記ページごとの閲覧傾向の一つとして閲覧に使用される機器の傾向を使用し、
    或るユーザの閲覧に使用する機器の傾向は、そのユーザが過去に閲覧した回数に占める割合が過半数以上の閾値を超える特定の種類の機器が存在すればその特定の種類の機器によって表現され、
    或るページの閲覧に使用される機器の傾向は、そのページが過去に閲覧された回数に占める割合が過半数以上の閾値を超える特定の種類の機器が存在すればその特定の種類の機器によって表現される
    ことを特徴とする請求項1または2に記載の文書配信装置。
  4. 前記閲覧要求元のユーザごとの閲覧傾向の一つとして閲覧した時間帯の傾向を使用し、前記ページごとの閲覧傾向の一つとして閲覧された時間帯の傾向を使用する
    ことを特徴とする請求項1乃至3の何れか1項に記載の文書配信装置。
  5. 前記閲覧要求元のユーザごとの閲覧傾向の一つとして閲覧した時間帯の傾向を使用し、前記ページごとの閲覧傾向の一つとして閲覧された時間帯の傾向を使用し、
    或るユーザの閲覧した時間帯の傾向は、そのユーザが過去に閲覧した回数に占める割合が過半数以上の閾値を超える特定の時間帯が存在すればその特定の時間帯によって表現され、
    或るページの閲覧された時間帯の傾向は、そのページが過去に閲覧された回数に占める割合が過半数以上の閾値を超える特定の時間帯が存在すればその特定の時間帯によって表現される
    ことを特徴とする請求項1乃至4の何れか1項に記載の文書配信装置。
  6. 前記ユーザ・文書データ記憶手段は、前記閲覧要求元のユーザごとの閲覧傾向の一つとしてユーザの属性を使用し、前記ページごとの閲覧傾向の一つとして閲覧したユーザの属性の傾向を使用する
    ことを特徴とする請求項1乃至5の何れか1項に記載の文書配信装置。
  7. 前記配信制御手段は、前記閲覧要求元のユーザごとの閲覧履歴と前記文書を構成するページごとの閲覧履歴とを前記ユーザ・文書データ記憶手段に記録し、
    前記予測変換手段は、前記ユーザ・文書データ記憶手段に記録された閲覧履歴に基づいて前記閲覧要求元のユーザの閲覧傾向と前記ページごとの閲覧傾向とを算出して前記ユーザ・文書データ記憶手段に保存する
    ことを特徴とする請求項1乃至6の何れか1項に記載の文書配信装置。
  8. 前記所定の形式が画像である
    ことを特徴とする請求項1乃至7の何れか1項に記載の文書配信装置。
  9. 閲覧要求元のユーザから後に閲覧要求されることが予測される文書のページを、前記文書を構成するページごとの閲覧傾向と前記ユーザの閲覧傾向とを比較して決定し、
    前記決定したページを該ページに対する閲覧要求に先行して所定の形式に変換して記憶手段に記憶し、
    前記ユーザから閲覧要求された文書のページの変換データが前記記憶手段に存在する時は前記変換データを読み出して前記ユーザへ送信し、存在しない時には前記ページを前記所定の形式に変換して前記ユーザへ送信する
    ことを特徴とする文書配信方法。
  10. 閲覧要求元のユーザごとの閲覧傾向と文書を構成するページごとの閲覧傾向とを記憶するユーザ・文書データ記憶手段と、前記ページを所定の形式に変換した変換データを記憶する変換データ記憶手段とを有するコンピュータを、
    前記閲覧要求元のユーザから後に閲覧要求されることが予測されるページを、前記文書を構成するページごとの閲覧傾向と前記ユーザの閲覧傾向とを比較して決定する変換予測手段と、
    前記変換予測手段により予測されたページを該ページに対する閲覧要求より先行して前記所定の形式に変換して前記変換データ記憶手段に記憶し、前記閲覧要求元のユーザから要求された文書のページの変換データが前記変換データ記憶手段に存在する時は前記変換データを読み出して前記閲覧要求元へ送信し、存在しない時には前記ページを前記所定の形式に変換して前記閲覧要求元へ送信する配信制御手段と
    して機能させるためのプログラム。
JP2010028502A 2010-02-12 2010-02-12 文書配信装置 Expired - Fee Related JP5428918B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010028502A JP5428918B2 (ja) 2010-02-12 2010-02-12 文書配信装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010028502A JP5428918B2 (ja) 2010-02-12 2010-02-12 文書配信装置

Publications (2)

Publication Number Publication Date
JP2011165024A true JP2011165024A (ja) 2011-08-25
JP5428918B2 JP5428918B2 (ja) 2014-02-26

Family

ID=44595618

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010028502A Expired - Fee Related JP5428918B2 (ja) 2010-02-12 2010-02-12 文書配信装置

Country Status (1)

Country Link
JP (1) JP5428918B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013182396A (ja) * 2012-03-01 2013-09-12 Nec Corp リバースプロキシ装置、及びその装置におけるリバースプロキシ処理方法とプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09198296A (ja) * 1996-01-16 1997-07-31 Matsushita Graphic Commun Syst Inc 画像情報処理システム
JP2004171539A (ja) * 2002-10-31 2004-06-17 Hewlett-Packard Development Co Lp ウェブページの利用パターンを特定する方法および装置
JP2005173876A (ja) * 2003-12-10 2005-06-30 Hitachi Ltd キャッシュサーバ
JP2008217381A (ja) * 2007-03-05 2008-09-18 Fujifilm Corp ウェブ・サーバならびにその動作制御方法および制御プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09198296A (ja) * 1996-01-16 1997-07-31 Matsushita Graphic Commun Syst Inc 画像情報処理システム
JP2004171539A (ja) * 2002-10-31 2004-06-17 Hewlett-Packard Development Co Lp ウェブページの利用パターンを特定する方法および装置
JP2005173876A (ja) * 2003-12-10 2005-06-30 Hitachi Ltd キャッシュサーバ
JP2008217381A (ja) * 2007-03-05 2008-09-18 Fujifilm Corp ウェブ・サーバならびにその動作制御方法および制御プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013182396A (ja) * 2012-03-01 2013-09-12 Nec Corp リバースプロキシ装置、及びその装置におけるリバースプロキシ処理方法とプログラム

Also Published As

Publication number Publication date
JP5428918B2 (ja) 2014-02-26

Similar Documents

Publication Publication Date Title
US10331863B2 (en) User-generated content permissions status analysis system and method
JP4812747B2 (ja) 情報を取り込み抽出する方法及びシステム
KR102003011B1 (ko) 제로-클릭 사진 업로드
US9396209B2 (en) Selecting storage cloud for storage of entity files from plurality of storage clouds
US10437907B2 (en) Link expansion service
AU2005231112B2 (en) Methods and systems for structuring event data in a database for location and retrieval
US7580568B1 (en) Methods and systems for identifying an image as a representative image for an article
CN108055302B (zh) 一种图片缓存处理方法、系统和服务器
US20170206379A1 (en) User-generated content permissions status analysis system and method
US9374427B2 (en) Geographical location based cloud storage
KR20160105395A (ko) 가이드형 사용자 동작들을 위한 시스템들 및 방법들
US7412708B1 (en) Methods and systems for capturing information
KR20120095861A (ko) 사회적 거리에 기초한 콘텐츠 항목의 사전 인출
KR20170054407A (ko) 콘텐츠를 현재 애플리케이션에 삽입하기 위한 개인화된 문맥 메뉴 제공 기법
KR20140009175A (ko) 서버로부터의 문서의 부분 로딩 및 편집
US8924657B2 (en) Information processing apparatus, data access system, and control method for the same
JP2018506791A (ja) メッセンジャーの会話内容を管理する方法と装置、およびコンピュータプログラム
JP5264813B2 (ja) 評価装置、評価方法及び評価プログラム
KR20170040148A (ko) 네트워크를 통한 컨텐츠 제공 방법 및 장치, 컨텐츠 수신 방법 및 장치
JP5428918B2 (ja) 文書配信装置
JP6376124B2 (ja) 情報処理装置、情報処理方法およびプログラム
US10496937B2 (en) Travel service information display system, travel service information display method, travel service information display program, and information recording medium
KR20220042930A (ko) 컨텐츠 목록 제공 방법, 장치 및 컴퓨터 프로그램
JP2004139210A (ja) 画像検索装置
JP3982969B2 (ja) 文書管理装置

Legal Events

Date Code Title Description
RD07 Notification of extinguishment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7427

Effective date: 20120717

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130828

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130903

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131017

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131118

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5428918

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees