JP2010267062A - 文書管理システム、文書管理方法及びコンピュータプログラム - Google Patents

文書管理システム、文書管理方法及びコンピュータプログラム Download PDF

Info

Publication number
JP2010267062A
JP2010267062A JP2009117572A JP2009117572A JP2010267062A JP 2010267062 A JP2010267062 A JP 2010267062A JP 2009117572 A JP2009117572 A JP 2009117572A JP 2009117572 A JP2009117572 A JP 2009117572A JP 2010267062 A JP2010267062 A JP 2010267062A
Authority
JP
Japan
Prior art keywords
keyword
divided
registered
document data
color information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009117572A
Other languages
English (en)
Other versions
JP5288617B2 (ja
Inventor
Isao Kondo
功 近藤
Kazuya Konishi
一也 小西
Otoya Shirotsuka
音也 城塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Group Corp
Original Assignee
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Corp filed Critical NTT Data Corp
Priority to JP2009117572A priority Critical patent/JP5288617B2/ja
Publication of JP2010267062A publication Critical patent/JP2010267062A/ja
Application granted granted Critical
Publication of JP5288617B2 publication Critical patent/JP5288617B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】文書データの閲覧性を高めるとともに、複数の文書データの対比のための把握作業の時間を短縮するインタフェースを持つ文書管理システムを提供する。
【解決手段】文書管理システム1は、所定順に並べられた複数のキーワード毎に、色情報を関連付けてキーワードテーブル21に登録する。また、各文書データを所定領域毎に分割した後、分割領域中に、登録されたキーワードが存在する場合は登録されている色情報、存在しない場合は未登録の色情報を並べたスペクトルパターンを分割領域毎に生成し、分割IDと関連付けてスペクトルテーブル24に登録する。そして、登録された各色情報のパターンと分割ID毎のスペクトルパターンとの類似度を判別し、最も類似度の高い分割IDの分割領域のキーワードと、その分割領域の全体の相対位置を強調表示させる。
【選択図】図1

Description

本発明は、文書データの中から注目するキーワード群が記述されている領域を容易に把握できるようにするためのインタフェース技術に関する。
文書データの中からユーザが指定したキーワードを強調表示することにより、その文書データの記述内容の理解を支援するインタフェース技術が提案されている(例えば特許文献1,2)。また、従来のこの種のインタフェース技術を拡張して、複数のキーワードの各々に異なる色を指定し、文書データに存在する複数のキーワードをそれぞれ指定した色で着色して表示する技術も知られている。
特開2003−44517号公報 特開2003−22241号公報
従来のインタフェース技術は、指定したキーワードが文書データ中に存在するかどうか、存在する場合は文書データのどこに存在するかを把握するには役に立つものの、文書データ中でキーワードが強調表示されるだけなので、文書データの注目したい記述内容がどこに存在するかまで特定することはできない。
また、複数の文書データが存在する場合において、一方の文書データに記述された内容が他方の文書データのどの部分に対応するのかを把握することもできない。これは、2つの文書データは、多くの場合、異なる筆者により作成されるので、意味としては同様な内容を記載していたとしても、別々の語句で記載されていた場合は、対応箇所を的確に把握することが難しいためである。別々の語句を網羅的に把握できるようにするためには、指定するキーワードの類義語をできるだけ詳細に指定する必要があり、文書対比時間は、利用者のスキルに依存することになる。
本発明は、文書データの閲覧性を高めるとともに、複数の文書データの対比のための把握作業の時間を短縮することができる文書管理のインタフェース技術を提供することを、主たる課題とするものである。
本発明は、色情報の組み合わせであるスペクトルパターンを用いた文書管理システム、スペクトルパターンによる文書管理方法及びコンピュータプログラムにより、上記課題の解決を図る。
本発明の文書管理システムは、所定順に並ぶ複数のキーワード及び各キーワードに関連付けられた色情報の入力を受け付け、受け付けたキーワード毎に、当該キーワードを識別するためのキーワードID(IDはIdentificationの略、以下同じ)と前記色情報とを関連付けて第1テーブルに登録するキーワード管理手段と、指定された文書データを所定領域毎に分割するとともに、分割領域中に、前記第1テーブルに登録されたキーワードが存在するかどうかをサーチし、存在する場合は当該キーワードについて前記第1テーブルに登録されている色情報、存在しない場合は未登録の色情報を前記所定順に並べたスペクトルパターンを分割領域毎に生成し、生成したスペクトルパターンを、当該分割領域を識別するための分割IDと関連付けて第2テーブルに登録するスペクトル管理手段と、前記文書データを所定の表示装置に表示する際に、当該文書データのうち前記第1テーブルに登録されたキーワードを当該キーワードに固有となる色情報で強調表示するとともに、前記第2テーブルに前記分割IDと関連付けて登録されているスペクトルパターンを、当該分割IDにより識別される分割領域の相対位置情報と共に表示する表示制御手段と、を備える。
ある実施の態様では、前記第1テーブルに登録されたキーワードの類義語を当該キーワードについてのキーワードIDと関連付けて第3テーブルに登録する類義語管理手段をさらに備えており、前記スペクトル管理手段は、前記第1テーブルに登録されたキーワードは存在しないが前記第3テーブルに当該キーワードのキーワードIDに関連付けられた類義語が存在する分割領域のスペクトルパターンを当該キーワードに固有の色情報に基づいて作成する。
また、ある実施の態様では、前記第1テーブルに登録された各色情報のパターンと、前記第2テーブルに登録されているすべてのスペクトルパターンとの類似度を判別し、最も類似度の高いスペクトルパターンに関連付けられている分割IDの分割領域を特定する類似領域検索手段をさらに備えるようにする。
本発明の文書管理方法は、表示装置に接続される文書管理システムが実行する方法であって、前記表示装置に、第1文書データ及び第2文書データを表示させる段階と、表示された第1文書データの記述内容を特徴付けるために所定順に並べられた複数のキーワード及び各キーワードに関連付けられた色情報の入力を受け付け、受け付けたキーワード毎に、当該キーワードを識別するためのキーワードIDと前記色情報とを関連付けて第1テーブルに登録する段階と、前記第2文書データを所定領域毎に分割するとともに、分割領域中に、前記第1テーブルに登録されたキーワードが存在するかどうかをサーチし、存在する場合は当該キーワードについて前記第1テーブルに登録されている色情報、存在しない場合は未登録の色情報を前記所定順に並べたスペクトルパターンを分割領域毎に生成し、生成したスペクトルパターンを、当該分割領域を識別するための分割IDと関連付けて第2テーブルに登録する段階と、前記第1テーブルに登録された各色情報のパターンと、前記第2テーブルに登録されているすべてのスペクトルパターンとの類似度を判別し、最も類似度の高いスペクトルパターンに関連付けられている分割IDの分割領域を特定する段階と、特定した分割領域の文書データのうち前記第1テーブルに登録されたキーワードを当該キーワードに固有となる色情報で強調表示するとともに、前記第2テーブルに前記分割IDと関連付けて登録されているスペクトルパターンを、当該分割IDにより識別される分割領域の相対位置情報と共に前記表示装置に表示させる段階とを有する、スペクトルパターンによる文書管理方法である。
本発明のコンピュータプログラムは、第1テーブル及び第2テーブルを有するコンピュータを、所定順に並ぶ複数のキーワード及び各キーワードに関連付けられた色情報の入力を受け付け、受け付けたキーワード毎に、当該キーワードを識別するためのキーワードIDと前記色情報とを関連付けて前記第1テーブルに登録するキーワード管理手段;指定された文書データを所定領域毎に分割するとともに、分割領域中に、前記第1テーブルに登録されたキーワードが存在するかどうかをサーチし、存在する場合は当該キーワードについて前記第1テーブルに登録されている色情報、存在しない場合は未登録の色情報を前記所定順に並べたスペクトルパターンを分割領域毎に生成し、生成したスペクトルパターンを、当該分割領域を識別するための分割IDと関連付けて前記第2テーブルに登録するスペクトル管理手段;及び、前記文書データを所定の表示装置に表示する際に、当該文書データのうち前記第1テーブルに登録されたキーワードを当該キーワードに固有となる色情報で強調表示するとともに、前記第2テーブルに前記分割IDと関連付けて登録されているスペクトルパターンを、当該分割IDにより識別される分割領域の相対位置情報と共に表示する表示制御手段;として機能させるコンピュータプログラムである。
本発明によれば、キーワードに関連した領域の有無と当該領域の相対位置を視覚的に把握できるので閲覧性が高まるとともに、複数の文書データを対比した場合には、関連領域の有無も容易に把握できるので、文書データ間のの対比や記述内容の把握作業に要する時間を短縮することができるという効果が得られる。
本発明を適用した文書管理システムの構成図。 キーワードテーブルの登録例を示す図。 類義語テーブルの登録例を示す図。 元文書データの説明図。 分割文書テーブルの登録例を示す図。 スペクトル表示パターンを生成する処理の手順説明図。 キーワード(類義語を含む)の抽出前及び抽出後の状態を示した図。 スペクトルテーブルの登録例を示す図。 本実施形態による文書管理方法の手順説明図。 表示装置における画面表示例を示す図。
以下、図面を参照して、本発明の実施の形態例を説明する。
図1は、本実施形態における文書管理システムの構成図である。この文書管理システム1は、コンピュータ本体10と、ハードディスク等の外部記憶装置20と、キーボード等から成る入力装置30と、例えばOCRやUSBメモリ等からの読取機構等から成る文書データ取込装置40と、液晶ディスプレイ等の表示装置50とを備えて構成される。
コンピュータ本体10は、外部記憶装置20にインストールされた本発明のコンピュータプログラムを実行することにより、コンピュータ本体を、入出力(I/O)制御部11、キーワード管理部12、類義語管理部13、文書管理部14、スペクトル管理部15、表示制御部16、スペクトル評価部17として機能させる。
外部記憶装置20には、上記のコンピュータプログラム及び必要なデータのほか、キーワードテーブル21、類義語テーブル22、分割済文書テーブル23、スペクトルテーブル24、文書データベース(以下、データベースを「DB」と称する。)25、及び、類義語辞書26が格納される。
キーワードテーブル21は、「キーワードID」毎に、「キーワード」及び「表示色」を関連付けて記憶する。キーワードIDは、例えば受付番号(通し番号)やキーワード名などである。類義語テーブル22は、「キーワードID」毎に、類義語辞書から取得した類義語を関連付けて記憶する。分割済文書テーブル23は、「文書ID」、「分割ID」及び「分割文書データ」を相互に関連付けて記憶する。スペクトルテーブル24は、「文書ID」、「分割ID」、「スペクトル表示パターン」を相互に関連付けて記憶する。
コンピュータ本体10において実現される機能は、以下のようなものである。
[入出力制御部]
入出力(I/O)制御部11は、入力装置30からの処理の指示や検索語等の入力の受付、文書データ取込装置40からの文書データの取込、表示装置50への処理内容又は処理結果の出力、外部記憶装置20へのデータ登録及びその読み出しを制御する。
[キーワード管理部]
キーワード管理部12は、対象となる文書データ中に出現するキーワードとそのキーワードを色によって強調表示させるための色情報とを関連付けてキーワードテーブル21に登録する。この処理は、ユーザから1つ以上のキーワードとそのキーワードを着色するための色情報とを受け付けることにより行う。受け付けたキーワード毎に、「01」、「02」・・・のような連続番号でキーワードIDを割り当て、受け付けた色情報をキーワードIDと関連付けて登録する。
このようにして登録されたキーワードテーブル21の登録例を図2に示す。図2の例では、キーワードID「01」で識別されるキーワード「認識」については「赤」で着色表示することを表している。同様に、キーワードID「02」で識別されるキーワード「画像」については「黄」、キーワードID「03」で識別されるキーワード「障害」については「緑」、キーワードID「04」で識別されるキーワード「センサ」については「紫」で着色表示することを表している。
[類義語管理部]
類義語管理部13は、キーワードテーブル21に登録された全キーワードを対象として、それぞれ類義語辞書26の検索により類義語を取得し、取得した類義語毎に、検索元キーワードのキーワードIDとの組にして、類義語テーブル22に登録する。
類義語テーブル22の登録例を図3に示す。図3の例では、キーワードID「01」つまり検索元キーワードが「認識」であり、類義語辞書26から「識別」及び「特定」という類義語が検索により得られたため、キーワードID「01」と類義語「識別」、及びキーワードID「01」と類義語「特定」を類義語テーブル22に登録されている。
同様に、検索元キーワードが「画像」であり、類義語辞書26から「イメージ」、「静止画」、「フレーム」という類義語が検索により得られたため、それぞれ、検索元キーワード「画像」のキーワードID「02」との組として類義語テーブル22に登録されている。他の検索元キーワードについても同様の手順で類義語テーブル22に類義語が登録される。
[文書管理部]
文書管理部14は、文書データの取込、分割、編集、保存及び読み出しを行う。
すなわち、文書データを文書データ取込装置40より取り込み、文書IDと共に、文書DB25に格納する。取り込んだ文書データを、便宜上「元文書データ」と称する。文書IDには、通し番号を用いる。
文書管理部14は、また、元文書データを所定のルールに基づいて分割する。分割された文書データを、便宜上「分割文書データ」と称する。分割のルールは、例えばパターン抽出により行う。パターン抽出は、例えば特許文書であれば、段落番号の墨付き開き括弧を起点とし、数字、墨付き閉じ括弧、文書、次の段落番号の墨付き開き括弧の直前を終点とするパターンを検出することにより行う。これにより得られる分割文書データは、当該段落番号で識別される領域の文書データとなる。なお、人手により意味のある範囲に分割するようにしても良い。
文書管理部14は、上記のようにして得られた分割文書データ毎に分割ID(例えば通し番号)を割り当て、分割元の文書データの文書ID及び分割文書データと共に、分割文書テーブル23に登録する。
例えば文書ID「001」で識別される文書データが、図4のようなものであったとすると、文書分割部14で分割された分割文書データについての分割文書テーブルの内容は、図5のようになる。図5の例では、文書ID「001」の文書データから分割した分割文書データに分割ID「1」、「2」・・・が割り当てられ、文書ID及び各分割IDの組で識別される領域に、分割文書データの内容が関連付けられて記憶されている。
文書管理部14は、また、元文書データにおける各分割文書データの先頭に位置情報を追加するとともに、その位置情報を識別するための位置情報IDを分割IDと関連付けて分割文書テーブル23に登録する。位置情報はHTML文書を例にとれば、アンカータグであり、位置情報IDは、アンカータグの名前属性、例えば、文書IDと分割IDを連結した文字列を用いることができる。
文書管理部14は、さらに、元文書データ及び分割文書データにおいて出現する文字列をキーワードテーブル21に登録されている色情報で着色した改変文書データを作成する。この機能については、後述する。
[スペクトル管理部]
スペクトル管理部15は、分割文書データ毎に、キーワードが存在するかどうかを所定の順序(例えばキーワード登録順)で調べる。具体的には、図6に示す手順で、スペクトル表示パターンを出力し、スペクトルテーブル24に登録する。
すなわち、全分割文書データを対象として、それぞれ、キーワードテーブル21に登録されたキーワードが存在するかどうかを調べる(ステップS101)。キーワードが存在する場合(ステップS101:Yes)、あるいはキーワードは存在しないが、当該キーワードのキーワードIDに対する類義語が類義語テーブル22に存在する場合(ステップS101:No、S102:Yes)は、キーワードテーブル21においてそのキーワードIDに関連付けられた色情報を出力する(ステップS103)。
一方、キーワードも類義語も存在しない場合(ステップS101:No、S102:No)は、未使用色を出力する(ステップS104)。未使用色は、キーワードテーブル21において指定しない色であればどのような色であっても良いが、本例では説明の都合上、「黒」とした。すべての分割文書データにおいてキーワードが残存する場合はステップS101の処理に戻り(ステップS105:No)、全キーワードの探索が終了した時点で処理を終える(ステップS105:Yes)。
これにより、分割文書データ毎に、キーワードテーブル21に登録された色情報の並びで、スペクトル表示パターンが生成される。スペクトル管理部15は、スペクトル表示パターンを、文書ID、分割文書IDと共に、スペクトルテーブル24に登録する。
図7は、図4に示した分割文書データについて、キーワード(類義語を含む)の抽出前及び抽出後の状態を示した図である。図示の例において、分割IDが1の分割文書データ(段落0015)では、最初に、キーワードテーブル21に登録された5種類のキーワードのうち、最初のキーワード「認識」411が出現するので、出力される色は「赤」となる。キーワードテーブル21に2番目に登録された「画像」は出現しないので、出力される色は「黒」となる。3番目のキーワード「障害」は出現しないが、類義語「トラブル」413が出現するので、出力される色は、「障害」について割り当てられた「緑」となる。4番目に登録されたキーワード「センサ」及び5番目に登録されたキーワード「ICチップ」は当該分割文書データには存在しないので、出力される色は、共に「黒」となる。
同じ元文書データで分割IDが2の分割文書データ(段落0015)についても、最初に、登録されたキーワード「認識」411が出現し、次いで、2番目に登録されたキーワード「画像」415も出現するが、その他のキーワードは存在しないので、出力される色はいずれも「黒」となる。
その結果、スペクトルテーブル24には、図8に示すように、分割ID「1」の分割文書データについては「赤、黒、緑、黒、黒」のスペクトル表示パターンが登録され、分割ID「2」の分割文書データについては「赤、黄、黒、黒、黒」のスペクトル表示パターンが登録される。
なお、キーワードに代えて類義語を用いた場合、本例のようにキーワードとその類義語のスペクトル表示パターンにおける位置を同じとしても良いが、両者を区別しても良い。
[表示制御部]
表示制御部16は、文書データ(元文書データ及び分割文書データ)とスペクトル表示パターンを表示装置50に表示させるための制御を行う。具体的には、キーワードテーブル21に登録されたキーワード、スペクトルテーブル24に登録されたスペクトル表示パターン、文書DB25に格納された文書データを取得し、指定したキーワードの強調表示に加え、文書データ、及び、その文書データにおけるスペクトル表示パターンを1つの組として、1又は複数の文書データを表示装置50に並列に表示できるようにする。
[スペクトル評価部]
スペクトル評価部17は、キーワードテーブル21に登録されているキーワードの類義語を並べたスペクトル表示パターンと、各分割文書データのスペクトルテーブル24のスペクトル表示パターンとの距離を算出し、各分割文書データ毎に最も距離が短いスペクトル表示パターンを与える分割文書データの分割IDを特定する。
距離尺度の例としては、例えば、等しい文字数を持つ二つの文字列に対して、対応する位置にある文字同士が、異なった場合の個数を距離として与えるハミング距離を用いても良い。図2を例にとると、赤黄緑紫青のスペクトル表示パターンとの距離が最も短いスペクトル表示パターンを与える分割文書の分割IDを特定する。特定された分割IDは、対応するスペクトル表示位置と共に表示制御部17に伝達される。
なお、指定キーワードに最も類似したスペクトル位置をユーザに通知する形態を採用しても良い。
[動作]
次に、本実施形態における文書管理システム1の動作を説明する。
ここでは、表示装置50に、二つの特許文献を同時に表示させ、一方の特許文献(第1文書データ)の記述内容に類似する内容が記述された他方の特許文献(第2文書データ)の領域を表示装置50上で強調表示させることにより、特許文献間の関連度を視覚的に把握できるようにしたインタフェースの例を示す。
図9は、この場合に文書管理システム1が実行する処理の手順説明図、図10は、表示装置50における画面表示例である。
文書管理システム1は、2つの特許文献名とキーワードとを入力するための画面を表示装置50に表示させる。図10の左側は、これらの情報のエントリ領域510であり、特許文献1のファイル名1の入力領域52、他の特許文献のファイル名2の入力領域54、及び複数(図示の例では5つ)のキーワードの入力領域511〜515が形成されている。各キーワードの入力領域511〜515には、予め固有の色情報が割り当てられている。
操作者により2つの特許文献が指定されると、文書管理システム1は、指定された各特許文献を取り込み、それぞれ文書IDを付与して文書DB25に格納する(ステップS1)。
その後、特許文献1を図10の第1文書領域520、特許文献2を第2文書領域540にそれぞれ表示させる(ステップS2)。
操作者が、表示された特許文献の特許請求の範囲欄521の記述内容を参考にして、当該特許文献1の記述内容を特徴付ける度合いの高い順に、5つのキーワードをエントリ領域511〜515に入力すると、文書管理システム1は、これらのキーワードと、エントリ領域511〜515に割り当てられた色情報とを受け付け、キーワード毎に、当該キーワードを識別するためのキーワードIDと色情報とを関連付けてキーワードテーブル21に登録する(ステップ3)。
取り込んだ特許文献1,2をそれぞれ所定ルールで分割するとともに、各分割領域中に、キーワードテーブル21に登録されたキーワードが存在するかどうかをサーチする。存在する場合は当該キーワードについてキーワードテーブル21又は類義語テーブル22に登録されている色情報、存在しない場合は未登録の色情報(黒)を上記の順に並べたスペクトル表示パターンを生成し、生成したスペクトル表示パターンを分割IDと関連付けてスペクトルテーブル24に登録する(ステップS4)。
各特許文献の分割及びスペクトルテーブル24への登録後、文書管理システム1は、特許文献1,2をそれぞれの分割文書データの相対位置情報と共に並列に並べて表示装置50に表示させる(ステップS5)。
「特許文献1,2をそれぞれの分割文書データの相対位置情報と共に並列に並べる」とは、図10の例では、第1文書領域520の隣の領域を、特許文献1の1つの分割文書データについて1列となるスペクトル表示パターンを分割文書データの数だけ表示するための第1スペクトル領域530とし、その隣を第2文書領域540とし、さらにその隣を、特許文献2について1つの分割文書データについて1列となるスペクトル表示パターンを分割文書データの数だけ表示するための表示するための第2スペクトル領域550として並べることをいう。第1スペクトル領域530にはスペクトル表示パターンのエレメント531〜535が形成されており、第2スペクトル領域550にも同じ数のエレメント551〜555が形成されている。
各スペクトル領域530,550におけるスペクトル表示パターンの配列は、分割文書データにおけるキーワードの存在位置がわかるように、分割IDと指定したキーワードの出現順序に対応する並びとが交差するようにする。例えば、表示装置50の縦軸に分割文書データの相対位置情報、横軸にスペクトル表示パターンのエレメント531〜535,551〜555が2次元配列されるようにする。その際、分割ID毎に、対応する分割文書データの位置情報へのパスを設定する。HTML文書を例にとれば、分割IDに対応した分割文書データへのハイパーリンク(例えばアンカータグ)を張る。
その後、キーワードテーブル21に登録された各色情報のパターンとスペクトルテーブル24に登録されているすべてのスペクトル表示パターンとの類似度をスペクトル評価部17で判別し、最も類似度の高いスペクトル表示パターンに関連付けられている分割IDの分割領域を特定する。そして、特定した分割領域の分割文書データのうち、キーワードテーブル21に登録されたキーワードを当該キーワードに固有となる色情報で強調表示するとともに、スペクトルテーブル24に分割IDと関連付けて登録されているスペクトル表示パターンを、当該分割IDにより識別される分割領域の相対位置情報と共に表示装置50に強調表示させる(ステップS6)。
キーワードの強調表示は、例えばHTML文書であればフォントの属性値で色情報を指定することにより、着色することにより行う。他方、分割領域の相対位置情報の強調表示は、例えば図10において矩形線で区切られた位置536,556が特定できるように他の色で着色したり、あるいはカーソルを重畳表示することにより行う。
これにより、例えば、5つのキーワードによって特徴付けられる、第1スペクトル領域530によれば3つめの分割領域536に存在することがわかる特許文献1の特定領域521の記述内容に関連性が高いと思われる特許文献2の記述箇所は、第2スペクトル領域550によれば全体のやや前半領域に位置することがわかる特許文献2の特定領域541であり、その特定領域541のスペクトル表示パターンは分割領域556により確認することができる。
そのため、特許文献1、2の関係の対比を、視覚的に、迅速に把握することができるため、文献対比に要する時間を著しく短縮化することできる。
なお、図10の画面例において、特定のスペクトル表示パターン又はエレメントを選択すると、対応する分割文書データが表示されるようにしても良い。例えば文書ID「001」、分割ID「1」に対応するスペクトルをマウス等で選択すると、文書ID「001」を表示する際に、文書表示位置を分割ID「1」に合わせて表示されるようにしても良い。
さらに、表示装置50に所定のキーワード毎に対応する色情報として、スペクトルが表示された特許文献1、2の分割文書データに対し、利用者から指示があると、文書管理部14は、当該分割文書データの各キーワードを、対応付けられた色で着色したHTMLファイルなどのファイルとして、外部記憶装置20に出力し、図示しない領域に記憶するよにしても良い。これにより、キーワードテーブル21に記憶されている色情報で着色した改変データを作成することで、対比の結果を後に容易に参照することができる。
このように、本実施形態の文書管理システム1によれば、対比したい複数の文書データの注目領域のみならず、文書データ間の関連箇所をスペクトル表示により容易に把握可能な、閲覧性に優れたインタフェースを実現することができる。
本実施形態の文書管理システム1は、また、指定したキーワードが対比先の文書データに存在しない場合は、類義語辞書26を用いた類義語展開を行うようにしたので、指定キーワードに対応した意味区間の所在を容易に把握することもできるようになる。
[変形例]
以上の説明では、第1文書データ及び第2文書データの双方を分割して、スペクトル領域も文書データ数にあわせて2つ形成した場合の例について説明したが、分割は第2文書データのみについて行うようにしても良い。
また、図9の説明では、キーワード群及び固有の色情報をキーワードテーブル21に登録した後に、文書データを分割するようにしたが、この処理は、逆であっても良い。
また、本実施形態では、スペクトル表示パターンを5つの色の組み合わせで説明したが、これは指定されたキーワードを5つにしたためなので、色の組み合わせ数は、キーワードの数に応じて任意に変更が可能なものである。
また、以上の説明では、各キーワードの入力領域511〜515に対する表示色を予め定められたものとしたが、利用者が表示色を画面上で設定するようにしても良い。
さらに、指定したキーワードに対する類義語についても、利用者が画面上で設定できるようにし、指定した類義語だけが強調表示されるようにしても良い。
1・・・文書管理システム、10・・・・コンピュータ本体、11・・・入出力(I/O)制御部、12・・・キーワード管理部、13・・・類義語管理部、14・・・文書管理部、15・・・スペクトル管理部、16・・・表示制御部、17・・・スペクトル評価部、20・・・外部記憶装置、21・・・キーワードテーブル、22・・・類義語テーブル、23・・・分割済文書テーブル、24・・・スペクトルテーブル、25・・・文書DB、26・・・類義語辞書、30・・・入力装置、40・・・文書データ取込装置、50・・・表示装置、52・・・ファイル名1の入力領域、54・・・ファイル名2の入力領域、510・・・エントリ領域、511〜515・・・キーワードの入力領域、520・・・第1文書領域、530・・・第1スペクトル領域、540・・・第2文書領域、550・・・第2スペクトル領域、531〜535,551〜555・・・スペクトル表示パターンのエレメント、536,556・・・分割文書データの相対位置を表す情報。

Claims (5)

  1. 所定順に並ぶ複数のキーワード及び各キーワードに関連付けられた色情報の入力を受け付け、受け付けたキーワード毎に、当該キーワードを識別するためのキーワードIDと前記色情報とを関連付けて第1テーブルに登録するキーワード管理手段と、
    指定された文書データを所定領域毎に分割するとともに、分割領域中に、前記第1テーブルに登録されたキーワードが存在するかどうかをサーチし、存在する場合は当該キーワードについて前記第1テーブルに登録されている色情報、存在しない場合は未登録の色情報を前記所定順に並べたスペクトルパターンを分割領域毎に生成し、生成したスペクトルパターンを、当該分割領域を識別するための分割IDと関連付けて第2テーブルに登録するスペクトル管理手段と、
    前記文書データを所定の表示装置に表示する際に、当該文書データのうち前記第1テーブルに登録されたキーワードを当該キーワードに固有となる色情報で強調表示するとともに、前記第2テーブルに前記分割IDと関連付けて登録されているスペクトルパターンを、当該分割IDにより識別される分割領域の相対位置情報と共に表示させる制御手段と、
    を備えて成る、文書管理システム。
  2. 前記第1テーブルに登録されたキーワードの類義語を当該キーワードについてのキーワードIDと関連付けて第3テーブルに登録する類義語管理手段をさらに備えており、
    前記スペクトル管理手段は、
    前記第1テーブルに登録されたキーワードは存在しないが前記第3テーブルに当該キーワードのキーワードIDに関連付けられた類義語が存在する分割領域のスペクトルパターンを当該キーワードに固有の色情報に基づいて作成する、
    請求項1記載の文書管理システム。
  3. 前記第1テーブルに登録された各色情報のパターンと、前記第2テーブルに登録されているすべてのスペクトルパターンとの類似度を判別し、最も類似度の高いスペクトルパターンに関連付けられている分割IDの分割領域を特定する類似領域検索手段をさらに備えてなる、
    請求項2記載の文書管理システム。
  4. 表示装置に接続される文書管理システムが実行する方法であって、
    前記表示装置に、第1文書データ及び第2文書データを表示させる段階と、
    表示された第1文書データの記述内容を特徴付けるために所定順に並べられた複数のキーワード及び各キーワードに関連付けられた色情報の入力を受け付け、受け付けたキーワード毎に、当該キーワードを識別するためのキーワードIDと前記色情報とを関連付けて第1テーブルに登録する段階と、
    前記第2文書データを所定領域毎に分割するとともに、分割領域中に、前記第1テーブルに登録されたキーワードが存在するかどうかをサーチし、存在する場合は当該キーワードについて前記第1テーブルに登録されている色情報、存在しない場合は未登録の色情報を前記所定順に並べたスペクトルパターンを分割領域毎に生成し、生成したスペクトルパターンを、当該分割領域を識別するための分割IDと関連付けて第2テーブルに登録する段階と、
    前記第1テーブルに登録された各色情報のパターンと、前記2第テーブルに登録されているすべてのスペクトルパターンとの類似度を判別し、最も類似度の高いスペクトルパターンに関連付けられている分割IDの分割領域を特定する段階と、
    特定した分割領域の文書データのうち前記第1テーブルに登録されたキーワードを当該キーワードに固有となる色情報で強調表示するとともに、前記第2テーブルに前記分割IDと関連付けて登録されているスペクトルパターンを、当該分割IDにより識別される分割領域の相対位置情報と共に前記表示装置に表示させる段階とを有する、
    スペクトルパターンによる文書管理方法。
  5. 第1テーブル及び第2テーブルを有するコンピュータを、
    所定順に並ぶ複数のキーワード及び各キーワードに関連付けられた色情報の入力を受け付け、受け付けたキーワード毎に、当該キーワードを識別するためのキーワードIDと前記色情報とを関連付けて前記第1テーブルに登録するキーワード管理手段、
    指定された文書データを所定領域毎に分割するとともに、分割領域中に、前記第1テーブルに登録されたキーワードが存在するかどうかをサーチし、存在する場合は当該キーワードについて前記第1テーブルに登録されている色情報、存在しない場合は未登録の色情報を前記所定順に並べたスペクトルパターンを分割領域毎に生成し、生成したスペクトルパターンを、当該分割領域を識別するための分割IDと関連付けて前記第2テーブルに登録するスペクトル管理手段、及び、
    前記文書データを所定の表示装置に表示する際に、当該文書データのうち前記第1テーブルに登録されたキーワードを当該キーワードに固有となる色情報で強調表示するとともに、前記第2テーブルに前記分割IDと関連付けて登録されているスペクトルパターンを、当該分割IDにより識別される分割領域の相対位置情報と共に表示する表示制御手段、として機能させる、コンピュータプログラム。
JP2009117572A 2009-05-14 2009-05-14 文書管理システム、文書管理方法及びコンピュータプログラム Expired - Fee Related JP5288617B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009117572A JP5288617B2 (ja) 2009-05-14 2009-05-14 文書管理システム、文書管理方法及びコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009117572A JP5288617B2 (ja) 2009-05-14 2009-05-14 文書管理システム、文書管理方法及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2010267062A true JP2010267062A (ja) 2010-11-25
JP5288617B2 JP5288617B2 (ja) 2013-09-11

Family

ID=43363985

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009117572A Expired - Fee Related JP5288617B2 (ja) 2009-05-14 2009-05-14 文書管理システム、文書管理方法及びコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP5288617B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012242879A (ja) * 2011-05-16 2012-12-10 Ib Research Kk 知的財産管理装置
JP2016191977A (ja) * 2015-03-30 2016-11-10 新日鉄住金ソリューションズ株式会社 情報処理装置、情報処理方法及びプログラム
CN111125432A (zh) * 2019-12-25 2020-05-08 重庆能投渝新能源有限公司石壕煤矿 安全生产培训快速匹配系统及视频匹配方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0581327A (ja) * 1991-09-19 1993-04-02 Fujitsu Ltd 情報検索支援処理装置
JPH05274314A (ja) * 1992-03-25 1993-10-22 Canon Inc 文書処理装置
JPH07146872A (ja) * 1993-11-22 1995-06-06 Nippon Steel Corp 文書検索装置
JPH08255163A (ja) * 1995-03-16 1996-10-01 Fuji Xerox Co Ltd 文書検索装置
JP2005063283A (ja) * 2003-08-19 2005-03-10 Ricoh Co Ltd 文書ブラウズ装置、文書ブラウズ方法、プログラムおよび記録媒体
WO2008067116A1 (en) * 2006-11-30 2008-06-05 Microsoft Corporation Rank graph

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0581327A (ja) * 1991-09-19 1993-04-02 Fujitsu Ltd 情報検索支援処理装置
JPH05274314A (ja) * 1992-03-25 1993-10-22 Canon Inc 文書処理装置
JPH07146872A (ja) * 1993-11-22 1995-06-06 Nippon Steel Corp 文書検索装置
JPH08255163A (ja) * 1995-03-16 1996-10-01 Fuji Xerox Co Ltd 文書検索装置
JP2005063283A (ja) * 2003-08-19 2005-03-10 Ricoh Co Ltd 文書ブラウズ装置、文書ブラウズ方法、プログラムおよび記録媒体
WO2008067116A1 (en) * 2006-11-30 2008-06-05 Microsoft Corporation Rank graph
JP2010511936A (ja) * 2006-11-30 2010-04-15 マイクロソフト コーポレーション ランク・グラフ

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JPN6011005882; 'Query Term Hits Within Document Content' Modern Information Retrieval 第1版, 1999, 289-293ページ, ADDISON WESLEY *
JPN6013021019; '3.3 検索結果の易読化' 科学技術研究者のための特許文献検索システムに関する調査研究報告書 , 200603, 74-80ページ, 独立行政法人 工業所有権情報・研修館 *
JPN7013001650; 岩山 真: 'テキストマイニングとビジュアル表現' Japio 創立20周年記念誌 特許情報活用の時代の検索と機械翻訳技術 , 200510, 108-111ページ, 財団法人日本特許情報機構 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012242879A (ja) * 2011-05-16 2012-12-10 Ib Research Kk 知的財産管理装置
JP2016191977A (ja) * 2015-03-30 2016-11-10 新日鉄住金ソリューションズ株式会社 情報処理装置、情報処理方法及びプログラム
CN111125432A (zh) * 2019-12-25 2020-05-08 重庆能投渝新能源有限公司石壕煤矿 安全生产培训快速匹配系统及视频匹配方法

Also Published As

Publication number Publication date
JP5288617B2 (ja) 2013-09-11

Similar Documents

Publication Publication Date Title
JP4461769B2 (ja) 文書検索・閲覧手法及び文書検索・閲覧装置
US20140304579A1 (en) Understanding Interconnected Documents
US9384268B2 (en) Information processing device, information processing method and computer program for highlighting content in an electronic document
JPH07282063A (ja) 機械翻訳装置
JP2017211993A (ja) 請求の範囲の中の請求の範囲構成要素名詞所属構成要素対応符号を対応検出する方法
JP2973913B2 (ja) 入力シートシステム
JP5288617B2 (ja) 文書管理システム、文書管理方法及びコンピュータプログラム
KR101069278B1 (ko) 청구항 시각화 장치 및 방법
JP2007279978A (ja) 文書検索装置及び文書検索方法
JP6044800B2 (ja) 色評価装置、色評価方法及びコンピュータ・プログラム
JP2004157668A (ja) 検索システム、検索方法および検索プログラム
JP6114090B2 (ja) 機械翻訳装置、機械翻訳方法およびプログラム
JP2007220144A (ja) 特許検索装置、特許検索装置の制御方法および制御プログラム
JP5826148B2 (ja) 図面管理サーバ及びこれを用いた図面管理システム
KR20100115048A (ko) 복사 문서 판별 시스템 및 그 방법
JP2012064051A (ja) ヘルプ表示装置、ヘルプ表示方法及びヘルプ表示プログラム
JPH11232303A (ja) テキスト検索装置
JP6707410B2 (ja) 文献検索装置、文献検索方法およびコンピュータプログラム
JP2014044555A (ja) 画像処理装置、画像処理システム及びプログラム
JP2005316881A (ja) 図面検索のためのプログラム、図面検索装置及び図面検索結果表示方法
JP4982271B2 (ja) 類似語判断補助装置及び類似語判断補助方法
JP2005276159A (ja) 回路図面表示データ生成装置およびそのプログラム並びに回路図面表示データ生成方法
JP2004295301A (ja) 文書検索装置
JP2008065577A (ja) 文書検索システム、文書検索プログラム及び文書検索プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2010262578A (ja) 帳票辞書生成装置、帳票識別装置、帳票辞書生成方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110324

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120904

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121101

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130507

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130603

R150 Certificate of patent or registration of utility model

Ref document number: 5288617

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees