JP2010020703A - 文書管理装置、文書管理方法及びプログラム - Google Patents

文書管理装置、文書管理方法及びプログラム Download PDF

Info

Publication number
JP2010020703A
JP2010020703A JP2008182905A JP2008182905A JP2010020703A JP 2010020703 A JP2010020703 A JP 2010020703A JP 2008182905 A JP2008182905 A JP 2008182905A JP 2008182905 A JP2008182905 A JP 2008182905A JP 2010020703 A JP2010020703 A JP 2010020703A
Authority
JP
Japan
Prior art keywords
document
information
degree
association
objects
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008182905A
Other languages
English (en)
Other versions
JP5354981B2 (ja
JP2010020703A5 (ja
Inventor
Koya Okabe
康矢 岡部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008182905A priority Critical patent/JP5354981B2/ja
Priority to US12/502,155 priority patent/US20100007919A1/en
Publication of JP2010020703A publication Critical patent/JP2010020703A/ja
Publication of JP2010020703A5 publication Critical patent/JP2010020703A5/ja
Application granted granted Critical
Publication of JP5354981B2 publication Critical patent/JP5354981B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Processing Or Creating Images (AREA)

Abstract

【課題】 ユーザが選択する情報に関連した情報を集約した検索結果を提示することである。
【解決手段】 文書検索部403は、メイン制御部200からの指示に従い、文書の実体、及びオブジェクトを、該文書情報操作部400を介して該文書情報記憶部401より検索して取得する。関連度算出部406は、メイン制御部200より指示を受け、文書情報記憶部401に保存されているオブジェクトについて、オブジェクト間の関連度を算出し、関連度情報操作部404を介して関連度情報記憶部405に登録する。関連度情報検索部407は、メイン制御部200からの指示に従い、オブジェクト間の関連度情報を、該関連度情報操作部404を介して該関連度情報記憶部405より検索して取得することを特徴とする。
【選択図】 図3

Description

本発明は、ユーザによって選択された文書の内容を提示する文書管理システムに関するものである。
近年、オフィス業務の効率化を目的として、文書を表示する際にユーザにとって見やすい形で文書を再構成する技術が提案されている。例えば数百ページに渡る技術文書やマニュアルから所望の情報を探す場合、通常、ユーザは索引を利用して文書内でキーワード検索を行う。
しかしながら、所望の情報が文書内の複数の箇所に散らばっていたり、或いは検索キーワードが思い浮かばなかったり、索引からも判断できないといった状況に陥ることも少なくない。
その場合、ユーザは何度も検索を繰り返して、検索にひっかかった箇所の周辺をくまなく読む必要があり、労力のかかる作業となっていた。
これを解決するために、下記特許文献1に記載されるように、複数の文書から所定のパターンによって抽出された領域を再構成して表示する文書編集システムが提案されている。
この特許文献1によれば、汎用的な開始パターン及び終了パターンからなるパターンの組と文書の構造情報を用いて、複数の文書からパターンの組に該当する箇所の間の領域をそれぞれ抽出している。そして、その結果を文書構造情報とレイアウト情報に従って集約して再構成している。
特開平11-272666号公報
上述した従来技術では、文書の構造が予め定まった文書においてユーザがその定義情報をシステムに与えることにより領域の抽出・再構成が行われる。そのため、文書の構造、及び構造に対応する内容が定まっていない文書に対しては適用しにくいことが考えられる。よって、様々な文書に対してユーザにとって見やすい形で文書を再構成して提示するといった点を鑑みると、更なる改良が望まれる。
そこで本発明は、文書中でユーザが選択する情報に関連した情報を集約した検索結果を、柔軟に提示できる仕組みを提供することを目的とする。
上記目的を達成する本発明の文書管理装置は以下に示す構成を備える。
文書情報に含まれる部分領域をオブジェクトとして、抽出する抽出手段と、前記抽出手段により抽出された複数のオブジェクトにおいて、オブジェクト間の関連の度合いを示す関連度を算出する算出手段と、前記抽出手段により抽出された複数のオブジェクトと、前記算出手段により算出されたオブジェクト間の関連度とを記憶する記憶手段と、ユーザによる文書情報に含まれるオブジェクトのいずれかの指定に応じて、当該文書情報に含まれる当該指定されたオブジェクトと、前記記憶手段に記憶された当該指定されたオブジェクトとの関連度が閾値以上のオブジェクトとを、提示する情報を生成する生成手段とを備えることを特徴とする。
本発明によれば、文書中でユーザが選択するオブジェクトに関連したオブジェクトを集約した結果に基づき、ユーザにとって見やすいであろう情報を柔軟に提示できる。
次に本発明を実施するための最良の形態について図面を参照して説明する。
<システム構成の説明>
〔第1実施形態〕
[システム構成]
図1は、本実施形態を示す文書管理システムの構成を説明する図である。本例は、ネットワークを介して、情報処理装置として機能するClientPC10、及びモバイル端末11と、WebアプリケーションサーバPC20と、ユーザ管理サーバPC30と、文書を保存/管理する機能を有する文書管理サーバPC40がネットワークを介して、相互に通信可能に接続されるシステム例である。
図1において、10はクライアントPC(ClientPC)で、文書管理システムにユーザA、及びBがブラウザを介してアクセス可能に構成されている。また、クライアントPC10は、図2に示すハードウエア資源と、後述するソフトウエア資源とを備える。11はモバイル端末で、有線、無線のインタフェースを介して、ネットワークに接続可能に構成されている。
20はWebアプリケーションサーバPCで、Webアプリケーションを提供して、クライアントPC10又はモバイル端末11に文書処理に必要な操作画面を提供する。
30はユーザ管理サーバで、本システムにアクセスするユーザの情報を管理する。40は文書管理サーバで、文書を保存/管理する機能を有する。
ここで、該WebアプリケーションサーバPC20、該ユーザ管理サーバPC30、及び該文書管理サーバPC40は、別々に配置されている構成としているが、一つのPCにおいて構成されても構わない。また、ユーザA、及びBがClientPC10、及びモバイル端末11を操作する構成としているが、2つの端末のいずれかと同じ端末で操作しても構わなく、またもちろん複数の種類の端末が混在していないといけないわけではない。
更に、本実施形態に係る文書管理システムは、ユーザA、及びBがブラウザを介してアクセスする構成としているが、図示しない専用のクライアントアプリケーションを該ClientPC10、及びモバイル端末11に配置し、それを操作する構成であっても構わない。
この場合、該WebアプリケーションサーバPC20ではなく、該文書管理サーバPC40と該専用クライアントアプリケーションが通信する構成でも構わない。
[ハードウエア構成]
図2は、本実施形態に係る文書管理システムを構成する各PCのハードウエア構成を説明するブロック図である。なお、図2に示されるハードウエア構成は、一般的な情報処理装置のハードウエアの構成に相当する。したがって、本実施形態の各PCには一般的な情報処理装置のハードウエア構成を適用することができる。
図2において、CPU100は、ROM102のプログラム用ROMに記憶された、或いはハードディスク等の外部メモリ109からRAM101にロードされたOSやアプリケーション等のプログラムを実行する。
ここでOSとはコンピュータ上で稼動するオペレーティングシステムの略語であり、以下OSと呼ぶ。後述する各フローチャートの処理はこのプログラムの実行により実現できる。
RAM101は、CPU100の主メモリ、ワークエリア等として機能する。キーボードコントローラ103は、キーボード107や図示しないポインティングデバイスからのキー入力を制御する。ディスプレイコントローラ104は、各種ディスプレイ108の表示を制御する。ディスクコントローラ105は、各種データを記憶するハードディスク(HD)やフロッピー(登録商標)ディスク(FD)等の外部メモリ109におけるデータアクセスを制御する。
ネットワークコントローラ(NC)106はネットワークに接続されて、ネットワークに接続された他の機器との通信制御処理を実行する。なお、上記101〜109はシステムバスに接続され、CPU100によりそのアクセスが制御されている。
[ソフトウエア構成]
図3は、図1に示した文書管理システムのモジュール構成を説明するブロック図である。本文書管理システムは、WebアプリケーションサーバPC20、及び該文書管理サーバPC40内のソフトウエア構成を示している。なお、後述するメイン制御部200は、本発明の実施形態に係る文書管理システムの全体を制御し、後述する各部に対する指示、管理を行う。
図3に示すWebアプリケーションサーバ20において、データ送受信部201は、前記ClientPC10などにおいてユーザがブラウザを介して出した命令を受け取り、該メイン制御部200より指示を受けた結果を、該ClientPC10に返答する。
セッション記憶部202は、該ClientPC10においてユーザがブラウザを介して本文書管理システムにアクセスしてから、同一ユーザからのアクセスであることを示すためのセッション情報を生成する。更に、ユーザが本文書管理システムへのアクセスをやめる(ログアウト)、もしくは自動タイムアウトなどでセッションが切れるまでの間、繰り返し使用する各種情報をセッション情報と関連付けて保持する。
WebUI生成部203は、該メイン制御部200より指示を受け、状況に応じたWebUI(HTML)を生成する。
ここで、該WebUI生成部203が生成するWebUIは、HTMLだけに限定するものではなく、Java(登録商標)Scriptなどのスクリプト言語が埋まっていても構わない。
図3に示す文書管理サーバ40において、400は文書情報操作部で、該メイン制御部200からの指示に従い、文書の実体、文書のページ内の領域分割されたオブジェクト、及びオブジェクトのメタデータを文書情報記憶部401に登録する。さらに、文書情報操作部400は、文書情報記憶部401に保存されている該文書の実体、文書のページ内の領域分割されたオブジェクト、及びオブジェクトのメタデータの抽出、編集などの操作を行う。
文書分析部402は、メイン制御部200からの指示に従い、文書のページ内を解析し、領域分割を行い、該領域分割して得られたオブジェクトにメタデータを付加して、文書情報操作部400を介して該文書情報記憶部401に登録する。
文書検索部403は、メイン制御部200からの指示に従い、文書の実体、及びオブジェクトを、該文書情報操作部400を介して該文書情報記憶部401より検索して取得する。
関連度算出部406は、メイン制御部200より指示を受け、文書情報記憶部401に保存されているオブジェクトについて、オブジェクト間の関連度を算出し、関連度情報操作部404を介して関連度情報記憶部405に登録する。
関連度情報検索部407は、メイン制御部200からの指示に従い、オブジェクト間の関連度情報を、該関連度情報操作部404を介して該関連度情報記憶部405より検索して取得する。
以下、本発明の第1実施形態に係る文書管理システムにおけるオブジェクト分割、識別処理を具体的に説明する。
なお、文書管理サーバ40内の文書は領域分割され、オブジェクトとして保存される。
[オブジェクト分割、及び識別処理]
図4は、本実施形態を示す文書管理装置におけるデータ処理手順の一例を示すフローチャートである。本例は、オブジェクト分割、及び識別処理例である。なお、S100〜S110は各ステップを示す。また、各ステップは、文書管理サーバ40のCPUが図3に示すモジュールを実行することで実現される。
S100で、文書情報操作部400は、文書情報記憶部401内でまだオブジェクト分割処理がなされていない文書があるかどうか判断する。ここで、未処理の文書があると文書情報操作部400が判断した場合、S101へ進み、文書情報操作部400は、文書を1つ取得し、S102で、文書分析部402は、取得された文書の領域分割を行い、オブジェクト抽出を行う。このとき、文書情報操作部400は、オブジェクトの位置情報も抽出し、抽出されたオブジェクトに関連付けて文書情報記憶部401へ登録する。
なお、オブジェクト抽出とは、アプリケーションを実行して、文書を解析し、領域を分割する等の既知の技術で実現可能である。
例えば、テキストの固まりが段落毎に分離されたり、画像、図、表の部分が分離されたりしても良い。
また、領域の分割の粒度は、自動的に決定されても構わないし、ユーザが範囲指定する、もしくは自動的に領域分離した結果をユーザに提示して、ユーザが修正してもかまわない。
次に、S103で、文書情報操作部400は、文書内のすべての領域、すなわちオブジェクトが処理されたかどうか判断する。ここで、未処理のオブジェクトがあると文書情報操作部400が判断した場合、S104において、文書情報操作部400はオブジェクトを1つ取得する。
そして、S105で、文書分析部402はオブジェクト内のキーワードを抽出し、オブジェクトのメタデータとしてオブジェクトに関連付け、文書情報操作部400を介して文書情報記憶部401へ登録する。
さらに、S105において、文書検索部403は文書情報操作部400を介して同じキーワード群を持つオブジェクトが他に存在しないか検索し調査する。このときキーワードがすべて一致することを条件としても良いが、複数現れる同一のキーワードをカウントアップし、その上位いくつかを対象としても良い。また、その閾値はシステムで定まっていても良いし、ユーザが設定可能としても良い。
さらに、キーワード抽出はオブジェクトがテキストの場合は一般的な形態素解析等の技術を用いれば良い。
次に、S106において、処理中のオブジェクトは同じキーワード群を持つ既存のオブジェクトが存在するかどうかを文書情報操作部400が判断する。ここで、既存のオブジェクトが存在すると文書情報操作部400が判断した場合、S107で、文書情報操作部400は処理中のオブジェクトに既存のオブジェクトと同じ識別子を付与する。
一方、S106において、処理中のオブジェクトは同じキーワード群を持つ既存のオブジェクトが存在しないと文書情報操作部400が判断した場合、S108で、文書情報操作部400は処理中のオブジェクトに新規に識別子を付与する。
次に、S109で、文書情報操作部400は次の領域を取得し、S103へ戻る。
一方、S103において文書情報操作部400が文書内のすべての領域、すなわちオブジェクトが処理されたと判断した場合、S110において、文書情報操作部400は次の文書を取得し、S100へ戻る。
そして、S100において、文書情報操作部400が文書情報記憶部401内のすべての文書が処理されたと判断した場合、本処理を終了する。
なお、本実施形態では、未処理の文書が文書情報記憶部401内に存在するという前提で詳述したが、或いはユーザが文書を文書管理サーバ40へ登録するたびにその文書について処理するようにしても良い。
また、オブジェクトを識別する手段として、オブジェクトが画像などの場合は特徴量を抽出し、他のオブジェクトの特徴量を比較しても良い。
図5は、図3に示した文書分析部402による文書の領域分割処理を説明する図である。
図5において、500は文書で、文書情報記憶部401内に保存されている。501〜507はオブジェクトで、文書分析部402によって領域分割される。ここで、オブジェクト501とオブジェクト507は文書分析部402がキーワードを抽出した結果同じキーワード群を持つと判断した場合、同じオブジェクトであると判断して、図4に示したS107において同じ識別子が付与される。オブジェクト502とオブジェクト506も同様である。オブジェクト内の内容が類似するものを同じ識別子を付与して識別できる。
[オブジェクト間関連度算出処理]
本実施形態において、前述のようにして識別されたオブジェクトは、オブジェクト同士の関連度を算出し、文書管理サーバ40の関連度情報記憶部405に保存しておく必要がある。
図6は、本実施形態を示す文書管理装置におけるデータ処理手順の一例を示すフローチャートである。本例は、図1に示した文書管理サーバ40の関連度算出部406によるデータ処理例である。より具体的には、データオブジェクト間の関連度を算出し、関連度をまとめたテーブルを作成する処理例である。なお、S200〜S208は各ステップを示す。また、各ステップは、文書管理サーバ40のCPUが関連度算出部406を実行することで実現される。
まず、S200において、関連度算出部406は、文書情報操作部400を介して、文書情報記憶部401内で関連度算出がまだ処理されていないオブジェクトがあるかどうか判断する。ここで、未処理のオブジェクトがあると関連度算出部406が判断した場合、S201において、文書情報操作部400はオブジェクトを1つ取得する。そして、該オブジェクトを仮にオブジェクト1とする。
次に、S202において、関連度算出部406は文書検索部403、及び文書情報操作部400を介してオブジェクト1と文書内の位置的に隣接するオブジェクトを検索する。
そして、S203において関連度算出部406は、前記検索した隣接するオブジェクトでまだ処理されていないオブジェクトがあるかどうか判断する。ここで、未処理の隣接オブジェクトがあると関連度算出部406が判断した場合、S204において文書情報操作部400は隣接オブジェクトを1つ取得する。ここで、該オブジェクトを仮にオブジェクト2とする。
次に、S205において、関連度算出部406は、上記オブジェクト1とオブジェクト2が同じ識別子を持つオブジェクトかどうか調べる。ここで、同じ識別子を持たないと関連度算出部406が判断した場合、S206において関連度算出部406はオブジェクト1とオブジェクト2の関連度をカウントアップし、関連度情報操作部404を介して関連度情報記憶部405へ登録する。個々での処理は、異なる識別子で識別されるオブジェクト間の関連を管理するための処理になる。
そして、S207において、関連度算出部406は次の隣接するオブジェクトを取得し、S203へ戻る。
一方、S203において、関連度算出部406がすべての隣接オブジェクトが処理されたと判断した場合、S208において、関連度算出部406は文書情報操作部400を介して次のオブジェクトを取得し、S200へ戻る。
一方、S200において、関連度算出部406が文書情報記憶部401内のすべてのオブジェクトが処理されたと判断した場合、本処理を終了する。
なお、本実施形態では、説明の便宜上、前記オブジェクト抽出、及び識別処理と、関連度算出処理を分離して記載したが、これらは同時に処理してももちろん構わない。
図7は、図3に示した文書情報記憶部401に記憶されている文書のオブジェクト同士の関連度を説明する図である。
図7において、700、701は文書で、文書情報記憶部401に保存されている、なお、説明の便宜上、文書の数を2つに限定している。702は文書内で切り出されたオブジェクトである。ここで、オブジェクト702は識別子の例として「A」が割り当てられている。703はオブジェクトが文書上で隣接していることをイメージ的に表した線である。
図8は、図7に示したオブジェクトの関連度を説明する概念図である。本例は、2つの文書700,701から同一のオブジェクト、及び関連度を1つにまとめた状態を示している。
図8において、800はオブジェクトであり、識別子は「A」である。801はオブジェクト間の関連を表す線である。802は関連度の強さを示す値であり、この例では、線703が引かれるごとに、+1している。ここで、識別子「X」で識別されるオブジェクトを、以下“オブジェクトX”と表現する。
この図では、よく文書中で隣接した状態で存在するオブジェクト同士を概念的に表していることになる。すなわち、この場合、オブジェクトAはオブジェクトB、C、Dと関連度が高いと判断することができる。
この例では単純に関連度を+1しているが、もちろんそれに限定しているわけではなく、他に考え得る処理については後述する。
図9は、図8に示した関連度を数値化した関連度テーブルの一例を示す図である。なお、本テーブルは、関連度情報記憶部405に保持されて管理される。
図9において、900はオブジェクトの関連度を表すテーブルであり、図8に示した関連度を数値化してテーブルに置き換えたものである。
[文書再構成処理]
ユーザがClientPC10、及びモバイル端末11上で文書を閲覧中に任意の箇所をマウスなどの機器で選択したとする。そのとき文書管理サーバ40は選択された領域、すなわちオブジェクトに関連のあるオブジェクト群を再構成してユーザに提示する。以下、文書の再構成処理について図10等を参照して詳述する。
図10は、本実施形態を示す本文書管理システムにおける文書再構成処理の概要を説明する図である。
図11は、本実施形態を示す文書管理システムにおけるデータ処理手順の一例を示すフローチャートである。本例は、本文書管理システムにおける文書再構成処理例である。なお、S300〜S306は各ステップを示す。また、各ステップのうち、S300、S306はWebアプリケーションサーバ20のメイン制御部200のステップに対応し、S301〜S305は、文書管理サーバPC40のCPUが実行するステップに対応する。
図12は、図8に示した関連度を数値化した関連度テーブルの一例を示す図である。なお、本テーブルは、S301において再算出された後のテーブルに対応し、関連度情報記憶部405に保持されて管理される。
図12において、例としてユーザが図7に示した文書700のオブジェクトBを選択したとする。このとき、文書701においてオブジェクトBと隣接しているオブジェクトはオブジェクトAとオブジェクトHである。よって図12に示すテーブルは図9に示すテーブルと比較して、項目1201と項目1202の数値がUPしている。この例では+1しているが、増加の仕方としてはもちろんこれに限定するものではなく、倍数にしても良い。結果としてこの場合、オブジェクトBに関連するオブジェクトとしてオブジェクトA、オブジェクトH、オブジェクトCが得られる。
以下、図11に示すフローチャートで文書の再構成処理を説明する。
S300において、メイン制御部200は、データ送受信部201を介して、表示中の文書におけてユーザが選択したオブジェクト情報を受け取る。S301において、関連度算出部406は、ユーザ選択オブジェクトと、表示中の文書においてユーザ選択オブジェクトに隣接するオブジェクト間の関連度を増加させ、一時的に関連度テーブルを更新する。更新したテーブルについては後述する。
そして、S302において、関連度情報検索部407は、ユーザ選択オブジェクトと関連度の高いオブジェクトを文書情報記憶部401の中から検索し、その情報を文書検索部403へ渡す。
次に、S303において、文書検索部403はS302で関連度情報検索部407から渡された情報を用いてオブジェクトを検索する。そして、その検索の結果、表示中の文書に含まれないオブジェクトが存在するかどうかを文書検索部403が判断する。ここで、表示中の文書に含まれないオブジェクトが存在すると文書検索部403が判断した場合は、S304で、文書情報操作部400は、それらのオブジェクトを再構成の対象から除外する。そして、S305において、文書情報操作部400は、検索されたオブジェクトで文書を再構成する。このとき、検索されたオブジェクトのうち、ある閾値以上のオブジェクトはすべて見せても良いし、ある閾値に満たないオブジェクトは再構成の対象から削除しても良い。閾値で切る場合は、その閾値はユーザが設定可能としても良い。
また、再構成時のオブジェクトの順序は例えば表示中の文書のオブジェクト順にしても良いし、或いは関連度の高い順にしても良く、これらの設定をユーザが切り替え可能としても良い。
次に、S306において、文書情報操作部400はWebUI生成部203へ再構成した情報を渡す。そしてWebUI生成部203は、ClientPC10、又はモバイル端末11を操作するユーザへ再構成したページを表示するための情報を生成し、転送して本処理を終了する。これにより、ユーザは、文書に含まれるオブジェクトの関係に基づき、その文書の内容が集約された状態をClientPC10、又はモバイル端末11上でブラウザを介して確認できる。
図13は、本実施形態を示す文書管理装置における文書処理状態を説明する図である。
図13において、1300は再構成前の文書であり、1301は再構成後にユーザに提示する文書である。この例では図12の例に引き続き、文書1300でオブジェクトBをユーザが選択したとする。
図12によれば、オブジェクトBに関連するオブジェクトとしてオブジェクトA、オブジェクトH、オブジェクトCであるから、文書1301ではオブジェクトA、オブジェクトB、オブジェクトH、オブジェクトCからページを作成している。
なお、オブジェクトの順番は前述したように元の文書の順でも良いし、関連度の高い順としても良い。また前述したように例えばオブジェクトCの関連度は低いため、これは表示しないとしても良い。
なお、第1実施形態では関連度の算出の対象は文書管理サーバ40内の文書すべてとしてきたが、この範囲は運用によって変更しても構わない。
最小の単位は文書1ページであり、さらに文書単位、キャビネット単位(データベース内部でいくつかに分割された範囲)などが存在すると考えられ、最大はデータベース単位となる。
この範囲は一般的には広げれば広げるほど集合知(Collective Intelligence)が適用されるが、もし文書のジャンルが定まっている範囲があり、その範囲を超える範囲を関連度算出の対象とすると、逆に雑音が混ざる可能性がある。必要に応じて検索対象の文書の範囲を広げれば良く、適切な範囲をユーザが指定できても良い。
また、本実施形態では再構成に用いるオブジェクトはあくまでユーザに表示中の文書に含まれるオブジェクトを対象としていたが、別の文書のオブジェクトも同時に表示しても良い。またその場合は、別の文書に存在するオブジェクトであることを明示しても良い。
〔第2実施形態〕
以下、第2実施形態に基づき説明するが、第1の実施形態に係る文書管理システムと異なるのは、関連度算出部406において、オブジェクトの位置関係などによって関連度の重み付けが異なる点である。
[オブジェクト間関連度算出処理]
図6に示したS206において、前述した第1実施形態では隣接していれば+1するなどといったような単純な算出しかしていなかった。本実施形態は、オブジェクト間の関連度算出において、上記算出処理に対して拡張した処理を図14に示す手順で実行する。
図14は、本実施形態を示す文書管理装置におけるデータ処理手順の一例を示すフローチャートである。本例は、関連度算出部406による関連度算出処理例である。なお、S400〜S415は各ステップを示す。また、各ステップは、文書管理サーバ40のCPUが関連度算出部406を実行することで実現される。なお、図6に示した処理と同様の処理については、同様の処理として説明を行う。
S400とS401の処理は、図6に示したS200、201と同一の処理である。
次に、S402において、関連度算出部406は文書検索部403を介してオブジェクト1と同一の文書に存在するすべてのオブジェクトを検索する。そして、S403において、関連度算出部406は、S402で検索されたオブジェクトすべてについて、関連度を増加させる。このとき増加させる割合は、S206のそれと比較して割合を低くすることが望ましい。例えばS206で+1しているとすれば、S403では+0.1するなどである。
次に、S404からS408の処理はS202からS206と同一の処理である。また、S407でNOと判断された場合は、S414に遷移する。
次に、S409において、文書検索部403はS404で検索したオブジェクトのさらに隣接するオブジェクトを検索する。以下、S410、S411、及びS413は、図6に示したS203、S204、及びS207と比較して隣接の度合いが1つ先か、2つ先かの違いである。
次に、S412において、関連度算出部406はオブジェクト1と、オブジェクト1から2つ先のオブジェクトとの関連度を増加させる。このとき増加させる割合は、S206のそれと比較して割合を低くすることが望ましい。例えばS206で+1しているとすれば、S412では+0.5するなどである。
なお、S414、S415の処理は、図6に示したS207、S208と同一の処理である。
なお、上記処理では、オブジェクトの隣接の隣接までを詳述したが、もちろん2段階までに限定するものではなく拡張しても構わない。その際は対象のオブジェクトから遠くなるにつれて関連度を増加する度合いが小さくなることが考えられる。
図15は、図3に示した関連度情報記憶部405に保持される関連度テーブルの一例を示す図である。なお、本テーブルは、図14に示した処理を実行した後の状態に対応する。
図15に示す例では、上記図14に示したS403での増加率は+0.1、S412の増加率は+0.5としている。
図15において、縦の列のオブジェクト1502に対する横の行のオブジェクト1502に対する関連度が格納されている。なお、本例では、図14に示したS403の処理を加えることによって、関連度が2つのオブジェクトの双方向で等しくならない場合がある。
例えばオブジェクトAに対するオブジェクトCの関連度は4.3だが、オブジェクトCに対するオブジェクトAの関連度は4.5となる。
さらに、図14に示すS408において、オブジェクト同士の接合面積から関連度の増加率の割合を変えても良い。
例えば図7に示したオブジェクトHに注目してみると、オブジェクトBは、オブジェクトIやオブジェクトJよりも隣接している面積が大きい。よってオブジェクトBはオブジェクトIやオブジェクトJよりもオブジェクトHと関連度が高いと判断しても良い。このときの算出式としては、例えば以下の式に基づくものとする。
関連度=通常の関連度*(隣接面の短い辺長/隣接面の長い辺長)

〔第3実施形態〕
本発明の第3の実施形態を図16に説明する。本実施形態と、第1実施形態に係る文書管理システムと異なるのは、WebUI生成部203における文書の見せ方、及びさらにユーザの選択を受け付けて文書の再構成を行う点である。
第3実施形態に示す文書管理システムでは、再構成したオブジェクトのみではなく元の文書のオブジェクトも何らかの記号などに変換し残しておき、ユーザがその記号を選択するとその中身を表示し、さらには前回の選択と今回の選択の両オブジェクトを使用して再度文書の構成を行う。
[文書再構成処理]
図16は、本実施形態を示す文書管理システムにおける文書再構成の例を説明する図である。
図16において、1600は再構成前の文書であり、1601は再構成後の表示例である。第1実施形態における図13では、ユーザによって選択されたオブジェクトに関連するオブジェクトのみを表示していた。
これに対して、図16に示す例では関連しないと判断したオブジェクトについても、オブジェクトの中身こそ表示しないものの、図16に一例を示す(×)等のマーク1602を用いて表示している。もちろん、記号は(×)マークに限るものではなく、記号の代わりにそのオブジェクトのキーワードや要約を表示しても良い。或いは「テキスト」、「グラフ」、「画像」のように種類の情報を表示しても良い。
ここで、(×)マークは、元のオブジェクトの内容そのものではなく、そこにオブジェクトが存在していることを示すオブジェクトであって、その表示サイズは、元のオブジェクトのサイズよりも縮小したサイズであれば(×)マーク等に限定されるものではない。また、この(×)マークを含むオブジェクトは、後述するようにClient PC10に提示された場合に、ユーザの操作で選択されると文書管理サーバ40側のプログラムが実行されるように構成されている。
また、図16に示す例では、(×)マークの領域を元の文書のオブジェクト領域と同じだけ確保しているが、短縮してしまっても構わない。また、このとき、図16において、オブジェクトAは2つ存在するが、2つ目のオブジェクトAはその内容を表示しても良いし、或いは「このオブジェクトはオブジェクトAと同じまたは類似した内容である」ということがわかるようにしておいても良い。
このとき、図16に示す(×)マークのいずれかがユーザの操作に従って指示された場合、メイン制御部200は文書検索部403を介して該当するオブジェクトを検索し、文書情報操作部400を介して取得する。WebUI生成部203は取得した元のオブジェクトを再度表示するための情報を生成する。ここで、ユーザの操作に従う指示の一例として、ポインティングデバイスのクリック操作が一般的であるが、他の指示、領域指示等であってもよい。
図17は、本実施形態を示す文書管理装置から送信されるコードの一例を示す図である。本例は、図1に示した文書管理サーバ40からClient PC10やモバイル端末11へ送られるコード群1900の抜粋の一例である。
図17において、1901はコード部で、図16に示したマーク1602の部分を表示するためのコード群に対応している。この例では(×)マークの画像がユーザにより操作するポインティングデバイス等でクリックされたら文書管理サーバ40側のプログラムが実行される構成となっている。
文書管理サーバ40側では文書検索部403が文書情報記憶部401から図16に示したオブジェクトGに該当するオブジェクト1604を検索し、WebUI生成部203はページを再構成する。
また、1902はコード部で、図16に示したオブジェクトAに該当するオブジェクト1603を表示するためのコード群に対応する。
なお、コード群1900は一例であり、本発明と直接的に関係のない部分は例示しない。また、本例ではHTML(HyperText Markup Language)からPHP(Hypertext Preprocessor)を呼ぶ形式となっているが、類似した動作が実現可能な言語であればもちろんこれらの言語に限定されるものではない。
さらに、前述したように(×)マークを選択したときに単純にその内容を再表示するだけでなく、前回の選択と今回の選択の両方で文書の再構成を再度行っても良い。
なお、処理としては今回選択されたオブジェクトを対象として図11に示したフローを再度行い、関連度テーブルの再算出を行うことになる。よって、図11を参照して本実施形態の処理を説明する。
S302において、前回選択したオブジェクトと今回選択したオブジェクトの両方で関連度の検索を行い、オブジェクトを取得する。例えば図16に示す文書1600において、オブジェクトIがあった位置の(×)マークをユーザが選択したとする。その場合、図12に示す関連度テーブルは、図18に示すテーブル1700となる。すなわち、オブジェクトIが選択されたことによって、1701、1702、1703の関連度が+1されている。
そして、図11に示したS302において、関連度情報検索部407は前回選択されたオブジェクトに加えて今回選択されたオブジェクトについても関連度の検索を行う。結果としてオブジェクトIを選択したことにより新たにオブジェクトJが関連していると判断し、結果としてユーザに提示する文書は、図19に示す文書1800となる。
以下、図20に示すメモリマップを参照して本発明に係る文書管理装置で読み取り可能なデータ処理プログラムの構成について説明する。
図20は、本発明に係る文書管理装置で読み取り可能な各種データ処理プログラムを格納する記憶媒体のメモリマップを説明する図である。
なお、特に図示しないが、記憶媒体に記憶されるプログラム群を管理する情報、例えばバージョン情報,作成者等も記憶され、かつ、プログラム読み出し側のOS等に依存する情報、例えばプログラムを識別表示するアイコン等も記憶される場合もある。
さらに、各種プログラムに従属するデータも上記ディレクトリに管理されている。また、各種プログラムをコンピュータにインストールするためのプログラムや、インストールするプログラムが圧縮されている場合に、解凍するプログラム等も記憶される場合もある。
本実施形態における図4、図6、図11、図14に示す機能が外部からインストールされるプログラムによって、ホストコンピュータにより遂行されていてもよい。そして、その場合、CD−ROMやフラッシュメモリやFD等の記憶媒体により、あるいはネットワークを介して外部の記憶媒体から、プログラムを含む情報群を出力装置に供給される場合でも本発明は適用されるものである。
以上のように、前述した実施形態の機能を実現するソフトウエアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給する。そして、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、本発明の目的が達成されることは言うまでもない。
この場合、記憶媒体から読み出されたプログラムコード自体が本発明の新規な機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
従って、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等、プログラムの形態を問わない。
プログラムを供給するための記憶媒体としては、例えばフレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVDなどを用いることができる。
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続する。そして、該ホームページから本発明のコンピュータプログラムそのもの、もしくは、圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバやftpサーバ等も本発明の請求項に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけではない。例えばそのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行う。そして、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込ませる。その後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
本発明は上記実施形態に限定されるものではなく、本発明の趣旨に基づき種々の変形(各実施形態の有機的な組合せを含む)が可能であり、それらを本発明の範囲から除外するものではない。
本発明の様々な例と実施形態を示して説明したが、当業者であれば、本発明の趣旨と範囲は、本明細書内の特定の説明に限定されるのではない。
本実施形態を示す文書管理システムの構成を説明する図である。 本実施形態に係る文書管理システムを構成する各PCのハードウエア構成を説明するブロック図である。 図1に示した文書管理システムのモジュール構成を説明するブロック図である。 本実施形態を示す文書管理装置におけるデータ処理手順の一例を示すフローチャートである。 図3に示した文書分析部402による文書の領域分割処理を説明する図である。 本実施形態を示す文書管理装置におけるデータ処理手順の一例を示すフローチャートである。 図3に示した文書情報記憶部に記憶されている文書のオブジェクト同士の関連度を説明する図である。 図7に示したオブジェクトの関連度を説明する概念図である。 図8に示した関連度を数値化した関連度テーブルの一例を示す図である。 本実施形態を示す本文書管理システムにおける文書再構成処理の概要を説明する図である。 本実施形態を示す文書管理システムにおけるデータ処理手順の一例を示すフローチャートである。 図8に示した関連度を数値化した関連度テーブルの一例を示す図である。 本実施形態を示す文書管理装置における文書処理状態を説明する図である。 本実施形態を示す文書管理装置におけるデータ処理手順の一例を示すフローチャートである。 図3に示した関連度情報記憶部405に保持される関連度テーブルの一例を示す図である。 本実施形態を示す文書管理システムにおける文書再構成の例を説明する図である。 本実施形態を示す文書管理装置から送信されるコードの一例を示す図である。 図3に示した関連度情報記憶部405に保持される関連度テーブルの一例を示す図である。 本実施形態を示す文書管理システムにおける文書再構成の例を説明する図である。 本発明に係る文書管理装置で読み取り可能な各種データ処理プログラムを格納する記憶媒体のメモリマップを説明する図である。
符号の説明
10 ClientPC
11 モバイル端末
20 Webアプリケーションサーバ
30 ユーザ管理サーバ
40 文書管理サーバ

Claims (15)

  1. 文書情報に含まれる部分領域をオブジェクトとして、抽出する抽出手段と、
    前記抽出手段により抽出された複数のオブジェクトにおいて、オブジェクト間の関連の度合いを示す関連度を算出する算出手段と、
    前記抽出手段により抽出された複数のオブジェクトと、前記算出手段により算出されたオブジェクト間の関連度とを記憶する記憶手段と、
    ユーザによる文書情報に含まれるオブジェクトのいずれかの指定に応じて、当該文書情報に含まれる当該指定されたオブジェクトと、前記記憶手段に記憶された当該指定されたオブジェクトとの関連度が閾値以上のオブジェクトとを、提示する情報を生成する生成手段と、
    を備えることを特徴とする文書管理装置。
  2. 前記生成手段は、当該文書情報に含まれる前記記憶手段に記憶された前記ユーザにより指定されたオブジェクトとの関連度が閾値に満たないオブジェクトを削除することで情報を生成することを特徴とする請求項1に記載の文書管理装置。
  3. 前記生成手段は、当該文書情報に含まれる前記記憶手段に記憶された前記ユーザにより指定されたオブジェクトとの関連度が閾値に満たないオブジェクトを縮小して表示するための情報を生成することを特徴とする請求項1に記載の文書管理装置。
  4. 前記生成手段は、縮小して表示されるオブジェクトがユーザにより選択されたことに応じて、前記記憶手段に記憶されている元のオブジェクトを参照し、更に当該選択されたオブジェクトを提示する情報を再生成することを特徴とする請求項3記載の文書管理装置。
  5. 前記算出手段は、文書情報における各オブジェクトの位置情報に基づいて関連度を算出することを特徴とする請求項1乃至3のいずれか1項に記載の文書管理装置。
  6. 前記算出手段は、範囲指定される文書情報について各オブジェクトの関連度を算出することを特徴とする請求項1又は5に記載の文書管理装置。
  7. 前記オブジェクトは、類似または同じオブジェクトを識別するための識別子を含み、前記オブジェクトに対応する部分領域に基づき識別子が設定され、
    前記算出手段は、異なる識別子を含むオブジェクト間の関連度を算出し、
    前記生成手段は、ユーザによる文書情報に含まれるオブジェクトのいずれかの指定に応じて、当該文書情報に含まれる当該指定されたオブジェクトと同じ識別子を含むオブジェクトと、前記記憶手段に記憶された当該指定されたオブジェクトとの関連度が閾値以上の識別子を含むオブジェクトとを、提示する情報を生成することを特徴とする請求項1に記載の文書管理装置。
  8. 文書情報に含まれる部分領域をオブジェクトとして、抽出する抽出ステップと、
    前記抽出ステップにより抽出された複数のオブジェクトにおいて、オブジェクト間の関連の度合いを示す関連度を算出する算出ステップと、
    前記抽出ステップにより抽出された複数のオブジェクトと、前記算出ステップにより算出されたオブジェクト間の関連度とを記憶する記憶ステップと、
    ユーザによる文書情報に含まれるオブジェクトのいずれかの指定に応じて、当該文書情報に含まれる当該指定されたオブジェクトと、前記記憶ステップにより記憶された当該指定されたオブジェクトとの関連度が閾値以上のオブジェクトとを、提示する情報を生成する生成ステップと、
    を備えることを特徴とする文書管理方法。
  9. 前記生成ステップは、当該文書情報に含まれる前記記憶ステップにより記憶された前記ユーザにより指定されたオブジェクトとの関連度が閾値に満たないオブジェクトを削除することで情報を生成することを特徴とする請求項8に記載の文書管理方法。
  10. 前記生成ステップは、当該文書情報に含まれる前記記憶ステップによりに記憶された前記ユーザにより指定されたオブジェクトとの関連度が閾値に満たないオブジェクトを縮小して表示するための情報を生成することを特徴とする請求項8に記載の文書管理方法。
  11. 前記生成ステップは、縮小して表示されるオブジェクトがユーザにより選択されたことに応じて、前記記憶ステップにより記憶されている元のオブジェクトを参照し、更に当該選択されたオブジェクトを提示する情報を再生成することを特徴とする請求項10記載の文書管理方法。
  12. 前記算出ステップは、文書情報における各オブジェクトの位置情報に基づいて関連度を算出することを特徴とする請求項8乃至10のいずれか1項に記載の文書管理方法。
  13. 前記算出ステップは、範囲指定される文書情報について各オブジェクトの関連度を算出することを特徴とする請求項8又は12に記載の文書管理方法。
  14. 前記オブジェクトは、類似または同じオブジェクトを識別するための識別子を含み、前記オブジェクトに対応する部分領域に基づき識別子が設定され、
    前記算出ステップは、異なる識別子を含むオブジェクト間の関連度を算出し、
    前記生成ステップは、ユーザによる文書情報に含まれるオブジェクトのいずれかの指定に応じて、当該文書情報に含まれる当該指定されたオブジェクトと同じ識別子を含むオブジェクトと、前記記憶ステップにより記憶された当該指定されたオブジェクトとの関連度が閾値以上の識別子を含むオブジェクトとを、提示する情報を生成することを特徴とする請求項8に記載の文書管理方法。
  15. 請求項8〜14のいずれか1項に記載の文書管理方法をコンピュータに実行させることを特徴とするプログラム。
JP2008182905A 2008-07-14 2008-07-14 文書管理装置、文書管理方法及びプログラム Expired - Fee Related JP5354981B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008182905A JP5354981B2 (ja) 2008-07-14 2008-07-14 文書管理装置、文書管理方法及びプログラム
US12/502,155 US20100007919A1 (en) 2008-07-14 2009-07-13 Document management apparatus, document management method, and document management program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008182905A JP5354981B2 (ja) 2008-07-14 2008-07-14 文書管理装置、文書管理方法及びプログラム

Publications (3)

Publication Number Publication Date
JP2010020703A true JP2010020703A (ja) 2010-01-28
JP2010020703A5 JP2010020703A5 (ja) 2011-08-11
JP5354981B2 JP5354981B2 (ja) 2013-11-27

Family

ID=41504888

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008182905A Expired - Fee Related JP5354981B2 (ja) 2008-07-14 2008-07-14 文書管理装置、文書管理方法及びプログラム

Country Status (2)

Country Link
US (1) US20100007919A1 (ja)
JP (1) JP5354981B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012146275A (ja) * 2010-12-20 2012-08-02 Profield Co Ltd 電子ブック処理装置、電子ブック処理方法、およびプログラム
CN102737027A (zh) * 2011-04-01 2012-10-17 腾讯科技(深圳)有限公司 个性化搜索方法及系统

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2938638C (en) * 2013-09-09 2020-10-06 UnitedLex Corp. Interactive case management system
CN107182200B (zh) * 2015-12-24 2019-12-06 中国科学院深圳先进技术研究院 微创手术导航系统
EP4156057A1 (en) * 2021-09-28 2023-03-29 Ricoh Company, Ltd. Information processing apparatus, data management method, and carrier medium

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09167164A (ja) * 1995-12-14 1997-06-24 Toshiba Corp 情報フィルタリング方法および情報フィルタリング装置
JPH10134002A (ja) * 1996-10-28 1998-05-22 Hitachi Ltd 共同作業支援システム、計算機、表示情報作成者連絡方法および記憶媒体
JPH11259521A (ja) * 1998-03-13 1999-09-24 Fujitsu Ltd 文書理解支援装置、要約文生成方法、並びに文書理解支援プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000222416A (ja) * 1999-01-29 2000-08-11 Canon Inc 情報検索装置及びその方法、及びそのプログラムを記憶した記憶媒体
JP2001167096A (ja) * 1999-12-06 2001-06-22 Ricoh Co Ltd 文書検索システム、文書検索方法及びその方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2005202766A (ja) * 2004-01-16 2005-07-28 National Institute Of Information & Communication Technology 類似コンテンツの同時提示システム
JP2006350867A (ja) * 2005-06-17 2006-12-28 Ricoh Co Ltd 文書処理装置、文書処理方法、プログラム及び情報記録媒体
JP2008035063A (ja) * 2006-07-27 2008-02-14 Sharp Corp 情報表示装置、映像表示システムおよび制御プログラム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2951792B2 (ja) * 1992-03-31 1999-09-20 シャープ株式会社 対象指定方法
JP3547069B2 (ja) * 1997-05-22 2004-07-28 日本電信電話株式会社 情報関連づけ装置およびその方法
JP2001052011A (ja) * 1999-08-06 2001-02-23 Canon Inc 画像検索装置およびその方法
US7315866B2 (en) * 2003-10-02 2008-01-01 Agency For Science, Technology And Research Method for incremental authentication of documents
JP2005122295A (ja) * 2003-10-14 2005-05-12 Fujitsu Ltd 関係図作成プログラム、関係図作成方法、および関係図作成装置
JP4183185B2 (ja) * 2004-03-10 2008-11-19 インターナショナル・ビジネス・マシーンズ・コーポレーション 診断装置、検出装置、制御方法、検出方法、プログラム、及び記録媒体
JP4605763B2 (ja) * 2004-11-26 2011-01-05 京セラ株式会社 端末装置及びその条件確認方法並びに条件確認プログラム
US7480648B2 (en) * 2004-12-06 2009-01-20 International Business Machines Corporation Research rapidity and efficiency improvement by analysis of research artifact similarity
US7330608B2 (en) * 2004-12-22 2008-02-12 Ricoh Co., Ltd. Semantic document smartnails
JP5170961B2 (ja) * 2006-02-01 2013-03-27 ソニー株式会社 画像処理システム、画像処理装置および方法、プログラム、並びに記録媒体
US7827184B2 (en) * 2007-04-10 2010-11-02 Yahoo! Inc. System and method for modeling user selection feedback in a search result page
JP4904218B2 (ja) * 2007-07-19 2012-03-28 キヤノン株式会社 画像処理サーバ、画像処理方法、コンピュータプログラム、および記憶媒体

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09167164A (ja) * 1995-12-14 1997-06-24 Toshiba Corp 情報フィルタリング方法および情報フィルタリング装置
JPH10134002A (ja) * 1996-10-28 1998-05-22 Hitachi Ltd 共同作業支援システム、計算機、表示情報作成者連絡方法および記憶媒体
JPH11259521A (ja) * 1998-03-13 1999-09-24 Fujitsu Ltd 文書理解支援装置、要約文生成方法、並びに文書理解支援プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000222416A (ja) * 1999-01-29 2000-08-11 Canon Inc 情報検索装置及びその方法、及びそのプログラムを記憶した記憶媒体
JP2001167096A (ja) * 1999-12-06 2001-06-22 Ricoh Co Ltd 文書検索システム、文書検索方法及びその方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2005202766A (ja) * 2004-01-16 2005-07-28 National Institute Of Information & Communication Technology 類似コンテンツの同時提示システム
JP2006350867A (ja) * 2005-06-17 2006-12-28 Ricoh Co Ltd 文書処理装置、文書処理方法、プログラム及び情報記録媒体
JP2008035063A (ja) * 2006-07-27 2008-02-14 Sharp Corp 情報表示装置、映像表示システムおよび制御プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012146275A (ja) * 2010-12-20 2012-08-02 Profield Co Ltd 電子ブック処理装置、電子ブック処理方法、およびプログラム
CN102737027A (zh) * 2011-04-01 2012-10-17 腾讯科技(深圳)有限公司 个性化搜索方法及系统
CN102737027B (zh) * 2011-04-01 2016-08-31 深圳市世纪光速信息技术有限公司 个性化搜索方法及系统

Also Published As

Publication number Publication date
US20100007919A1 (en) 2010-01-14
JP5354981B2 (ja) 2013-11-27

Similar Documents

Publication Publication Date Title
US20130019189A1 (en) Augmented editing of an online document
EP3547145A2 (en) Systems and methods for reducing storage required for code coverage results
JP2008226061A (ja) 画像のタグ指定装置および画像検索装置ならびにそれらの動作制御方法およびそれらのコンピュータを制御するプログラム
JP2004054631A (ja) 情報検索システム、情報検索方法、html文書の構造解析方法及びプログラム
US10055098B2 (en) Method for automatically applying page labels using extracted label contents from selected pages
JPWO2007032095A1 (ja) ドキュメントデータの管理方法、管理システム及びコンピュータソフトウェア
JP5354981B2 (ja) 文書管理装置、文書管理方法及びプログラム
US11314757B2 (en) Search results modulator
JP5089482B2 (ja) 情報処理装置、データ処理方法およびプログラム
JP6910494B1 (ja) 情報処理プログラム、情報処理装置及び情報処理方法
US20090300001A1 (en) Server apparatus, catalog processing method, and computer-readable storage medium
JP2009080806A (ja) Webページにリンクを挿入する方法
KR20130126459A (ko) 서브셋 폰트를 제공하는 웹 폰트 서버 및 이를 포함하는 웹 폰트 시스템
JP4796527B2 (ja) ドキュメント絞り込み検索装置、方法及びプログラム
JP5669638B2 (ja) 文書管理装置、文書管理方法、プログラム。
JP5162215B2 (ja) データ処理装置、データ処理方法、および、プログラム
JP2007156898A (ja) 情報処理装置及びその制御方法、プログラム、記憶媒体
JP2014207019A (ja) 情報処理装置、その制御方法、及びプログラム、並びに情報処理システム、その制御方法、及びプログラム
JP6124640B2 (ja) 文書管理装置、情報処理方法及びプログラム
JP6413597B2 (ja) 分析プログラム、分析方法及び分析装置
JP5276903B2 (ja) 閲覧システム、プラグインプログラム、ならびに、紹介プログラム
JP2005182342A (ja) スクリプト付き文書処理装置、文書取得装置、スクリプト付き文書処理システム、スクリプト付き文書処理方法およびその方法をコンピュータに実行させるためのプログラム
KR101020306B1 (ko) 검색서비스 제공방법 및 그 장치
JP2008117363A (ja) バイオインフォマティクス解析プログラムの実行方法及びバイオインフォマティクス解析プラットフォーム
JP2004088454A (ja) 画像情報表示システム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110629

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110629

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121113

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130730

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130827

R151 Written notification of patent or utility model registration

Ref document number: 5354981

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees