JP7456136B2 - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
JP7456136B2
JP7456136B2 JP2019220545A JP2019220545A JP7456136B2 JP 7456136 B2 JP7456136 B2 JP 7456136B2 JP 2019220545 A JP2019220545 A JP 2019220545A JP 2019220545 A JP2019220545 A JP 2019220545A JP 7456136 B2 JP7456136 B2 JP 7456136B2
Authority
JP
Japan
Prior art keywords
document
document element
relationship
elements
changed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019220545A
Other languages
English (en)
Other versions
JP2021089664A (ja
Inventor
祐志 原田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2019220545A priority Critical patent/JP7456136B2/ja
Priority to US16/847,594 priority patent/US20210174011A1/en
Priority to CN202010493330.4A priority patent/CN112925880A/zh
Publication of JP2021089664A publication Critical patent/JP2021089664A/ja
Application granted granted Critical
Publication of JP7456136B2 publication Critical patent/JP7456136B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/197Version control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2358Change logging, detection, and notification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Description

本発明は、情報処理装置及びプログラムに関する。
世の中には相互に関係を持つ文書があふれている。相互に関係を持つ文書のうちの1つに変更が行われると、それに応じて残りのいくつかの文書に変更が必要になる場合がある。ある文書に変更が行われた場合にその文書に関係のある文書の関与者(例えば著者)にその変更を知らせることにより、その関係のある文書の変更等といった必要な対処を促す仕組みがある。
例えば、特許文献1には、ホームページ等の文書データの変更の有無を判断して、変更があった場合には、その変更された文書に関係がある文書上で、変更があった旨の情報を自動付加し、その文書へのアクセス可能な利用者に対して、通信回線を介して変更通知を行う文書更新通知装置が開示されている。
また特許文献2に記載されたシステムは、異なる媒体で記録された文書の最新状態をコンピュータに記録する手段、文書の作成、改訂、削除と同時に文書間の影響関係を定義する手段、最新の文書だけを利用できるように利用制限する手段、任意の文書が改訂、削除されたときに影響関係にある文書を抽出して改訂又は削除権限のある者に対して改訂又は削除の必要性確認が必要であることを通知する手段、他の文書の作成、改訂、削除の影響有無の確認が完了した文書を識別する手段を備える。
特許第3890785号明細書 特開平11-306055号公報
本発明は、第1文書要素が変更された場合に第2文書要素に関して行う処理を、第1文書要素と第2文書要素との関係の種類によらず一律なものとした場合と比べて、一律な処理が行われることによる弊害を低減することを目的とする。
請求項1に係る発明は、プロセッサを含み、前記プロセッサは、第1文書要素と、前記第1文書要素と異なる第2文書要素とを、文書要素同士の類似度の大きさにより分類される複数種類の関係のうち、前記第1文書要素と前記第2文書要素との類似度の大きさに応じた種類の関係で関係付け、前記第1文書要素が変更された場合に、前記第2文書要素に関して、前記第1文書要素と前記第2文書要素との前記関係の種類に応じた処理を実行する、情報処理装置であって、前記関係の種類に応じた処理は、前記第1文書要素と前記第2文書要素との前記関係が、前記第1文書要素と前記第2文書要素との類似度が0より大きい所定の第1閾値以上であるという第1種類の関係である場合、前記処理は、前記第2文書要素の関与者に前記第1文書要素が変更された旨を通知する通知処理であり、前記通知処理は、変更された前記第1文書要素と、前記第1文書要素に関係付けられた一以上の前記第2文書要素と、の関係を示す表示画面において、一以上の前記第2文書要素のうち、前記第1文書要素の変更後に変更されていない前記第2文書要素を、前記第1文書要素の変更後に変更された前記第2文書要素とは異なる表示態様で表示する処理である、情報処理装置である。
請求項2に係る発明は、前記プロセッサは、前記第1文書要素及び前記第2文書要素がそれぞれ変更された日時を記録し、前記通知処理では、記録した前記第1文書要素及び前記第2文書要素の変更された日時を参照し、前記第1文書要素との前記関係が前記第1種類の関係である前記第2文書要素のうち、最後に変更された日時が、前記第1文書要素が最後に変更された日時よりも前である前記第2文書要素は、最後に変更された日時が、前記第1文書要素が最後に変更された日時以降である前記第2文書要素よりも、前記表示画面において強調して表示する、ことを特徴とする請求項1に記載の情報処理装置である。
請求項に係る発明は、前記関係の種類に応じた処理では、前記第1文書要素と前記第2文書要素との前記関係が前記第1種類の関係であっても、前記第1文書要素と前記第2文書要素とが同一の文書に含まれる場合には、前記通知処理を行わない、請求項又はに記載の情報処理装置である。
請求項に係る発明は、前記第1文書要素と前記第2文書要素との前記関係が第2種類の関係である場合、前記関係の種類に応じた処理は、変更後の前記第1文書要素を前記第2文書要素にコピーする処理であり、前記第2種類の関係は、前記類似度が、前記第1文書要素と前記第2文書要素とが同一とみなせる類似度の最低値である第2閾値であって前記第1閾値より大きい第2閾値、以上であるという関係である、請求項1~のいずれか1項に記載の情報処理装置である。
請求項に係る発明は、プロセッサを含み、前記プロセッサは、第1文書要素と、前記第1文書要素と異なる第2文書要素とを、文書要素同士の類似度の大きさにより分類される複数種類の関係のうち、前記第1文書要素と前記第2文書要素との類似度の大きさに応じた種類の関係で関係付け、前記第1文書要素が変更された場合に、変更された前記第1文書要素と、前記第1文書要素に関係付けられた一以上の前記第2文書要素と、の関係を、前記第1文書要素及び前記第2文書要素をノードとし、前記関係をエッジとするグラフ、として表示する表示画面において、前記一以上の前記第2文書要素の各々を、当該第2文書要素と前記第1文書要素との関係の種類に応じた表示形態で表示する表示処理、を実行する、情報処理装置である。
請求項に係る発明は、前記表示処理は、前記第2文書要素に関係付けられた第3文書要素を示すノードを前記表示画面に表示するか否かを、前記第1文書要素と前記第2文書要素との前記関係の種類に応じて制御する制御処理を含前記制御処理では、前記第1文書要素と前記第2文書要素との前記関係の種類が表す、前記第1文書要素と前記第2文書要素との類似度、が大きいほど、前記第2文書要素に対する類似度がより小さい前記第3文書要素まで前記表示画面に表示する、ことを特徴とする請求項に記載の情報処理装置である。
参考例の構成は、前記表示処理は、前記第2文書要素と関係付けられた第3文書要素を前記表示画面に表示するか否かを、前記第1文書要素と前記第2文書要素との前記関係の種類と、前記第2文書要素と前記第3文書要素との前記関係の種類と、の組合せに応じて制御する処理を含、請求項に記載の情報処理装置である。
請求項に係る発明は、前記表示処理は、前記第2文書要素に対して連鎖的に関係付けられている文書要素群を何段階の関係の文書要素まで前記表示画面に表示するかを、前記第1文書要素と前記第2文書要素との前記関係の種類に応じて制御する処理、を含前記制御処理では、前記第1文書要素と前記第2文書要素との前記関係の種類が表す、前記第1文書要素と前記第2文書要素との類似度、が大きいほど、より多くの段階の文書要素まで前記表示画面に表示する、ことを特徴とする請求項に記載の情報処理装置である。
請求項に係る発明は、コンピュータに、第1文書要素と、前記第1文書要素と異なる第2文書要素とを、文書要素同士の類似度の大きさにより分類される複数種類の関係のうち、前記第1文書要素と前記第2文書要素との類似度の大きさに応じた少なくとも一の種類の関係で関係付け、前記第1文書要素が変更された場合に、前記第2文書要素に関して、前記第1文書要素と前記第2文書要素との前記関係の種類に応じた処理を実行する、処理を実行させるためのプログラムであって、前記関係の種類に応じた処理は、前記第1文書要素と前記第2文書要素との前記関係が、前記第1文書要素と前記第2文書要素との類似度が0より大きい所定の第1閾値以上であるという第1種類の関係である場合、前記処理は、前記第2文書要素の関与者に前記第1文書要素が変更された旨を通知する通知処理であり、前記通知処理は、変更された前記第1文書要素と、前記第1文書要素に関係付けられた一以上の前記第2文書要素と、の関係を示す表示画面において、一以上の前記第2文書要素のうち、前記第1文書要素の変更後に変更されていない前記第2文書要素を、前記第1文書要素の変更後に変更された前記第2文書要素とは異なる表示態様で表示する処理である、プログラムである。
請求項1、2又はに係る発明によれば、第1文書要素が変更された場合に第2文書要素に関して行う処理を、第1文書要素と第2文書要素との関係の種類によらず一律なものとした場合と比べて、一律な処理が行われることによる弊害を低減することができる。
更に、第1文書要素に対して関係を持つ第2文書要素が、第1文書要素の変更に応じて変更済みでない場合に、第2文書要素の関与者にその旨を知らせることができる。
更に、第1文書要素に対して関係を持つ第2文書要素が、第1文書要素の変更に応じて変更済みか否かを、表示画面における第2文書要素の表示態様の違いによりユーザに知らせることができる。
請求項に係る発明によれば、第1文書要素と第2文書要素とが同一の文書に含まれる場合には、通知処理を行わないようにすることができる。
請求項に係る発明によれば、第2文書要素が第1文書要素と同一とみなせる内容の場合、第1文書要素の変更を第2文書要素に反映することができる。
請求項に係る発明によれば、変更された第1文書要素に関係付けられた第2文書要素が、第1文書要素に対してどの種類の関係を持っているかを、第2文書要素の表示態様の違いで区別できるようにすることができる。
請求項に係る発明によれば、第1文書要素と第2文書要素との関係の種類に応じて、第2文書要素に対して関係のある第3文書要素の表示を制御することができる。
請求項に係る発明によれば、変更された第1文書要素に対して直接又は間接的に関係がある文書要素を、何段階の関係まで表示するかを、第1文書要素と第2文書要素との関係の種類に応じて制御することができる。
文書サービスシステムを含む全体システムの構成を例示する図である。 図1のシステムにおける文書作成作業の例を説明するための図である。 文書サービスシステムが実装されたコンピュータのハードウエア構成を例示する図である。 文書サービスシステムが実行する、データベースの構築及び保守の処理手順を例示する図である。 文書の構造を例示する図である。 データベース中の文書プロパティのデータ構造を例示する図である。 データベース中の要素プロパティのデータ構造を例示する図である。 データベース中の関係情報を例示する図である。 文書サービスシステムが提供する情報提供画面の一例を示す図である。 文書サービスシステムが実行する、情報提供画面の生成のための処理手順を例示する図である。 文書サービスシステムが提供する情報提供画面の別の一例を示す図である。 文書サービスシステムが実行する、情報提供画面の生成のための処理手順の別の例を示す図である。 文書サービスシステムが提供する情報提供画面の更に別の一例を示す図である。 文書サービスシステムが実行する、情報提供画面の生成のための処理手順の更に別の例を示す図である。 文書サービスシステムが提供するグラフ表示の一例を示す図である。 文書サービスシステムが実行する通知処理の手順の一部を例示する図である。
<全体システムの例>
図1に、本発明に係る情報処理装置の一実施形態である文書サービスシステム100を含んだ文書利用のための全体システムを例示する。
この例では、文書サービスシステム100は、ある会社の社内ネットワーク40に接続されている。社内ネットワーク40には、設計書管理システム10や社内規定管理システム20のように、社内の各種文書を管理するための1以上の文書管理システムが接続されている。また社内ネットワーク40には、ユーザが操作するパーソナルコンピュータ等のクライアント30が接続されている。
インターネット50上には、法令管理システム60や「XX」技術の標準文書を管理するXX標準管理システム70等の、各種の文書管理システムが存在する。社内ネットワーク40上の文書サービスシステム100やクライアント30等の装置は、それらインターネット50上の文書管理システムが持つ文書にアクセス可能である。
文書サービスシステム100は、設計書管理システム10等の社内の文書管理システム内の文書に関係する他文書に変更があった場合に、その文書に関してその他文書の変更に対応したサービス(例えば関係者へのその変更の通知)を提供する。
図2に例示するように、会社内のあるユーザが、ある製品の設計書Aを作成して設計書管理システム10に登録し、保守している場合を考える。製品は、各種の法令や各種の社内規定を満たすように設計される必要があるため、設計書Aもそれら法令や社内規定等といった他の文書を参照しながら作成される。例えば、設計書Aは、法令管理システム60の法令DB62に登録されている道路運送車両法と、社内規定管理システム20の社内規定DB22に登録されている完成検査実施規定とを参照して作成されている。法令DB62内の各法令も社内規定DB22内の各規定も、改正に追従して随時更新されている。
道路運送車両法と完成検査実施規定が改正されると、設計書Aの内容を更新する必要が出てくる場合があるが、必ず更新が必要とは限らない。例えば、法令等の改正された部分が、設計書Aの内容が依拠している部分と異なる場合には、設計書Aの内容の更新は不要である。
また、設計書Aが法令のある部分に依拠して作成されているとしても、その依拠の仕方は様々である。例えば、設計書A内に法令の一節がそのままコピーする形で引用されている場合もあれば、法令の関係箇所を確認しつつ設計書A内のある部分を記載しただけで両者間に用語の一致が見られる程度にすぎない場合もある。前者の場合は、法令のその一節が改正されるのに応じて、設計書A内の引用箇所を修正する必要性は高い。これに対して、後者の場合、法令の関係箇所の改正に応じた設計書A側での対応の必要度合いは、前者の場合より低い。
そこで本実施形態の文書サービスシステム100は、この設計書Aの管理担当者等の文書の関与者に対して、その文書に関係する他文書の変更に応じてその文書を変更する必要があるかどうか判断する作業を支援する等のサービスを提供する。
ここで、「文書」とは、何らかのデータ形式のデータであり、そのデータ形式は特に限定されない。例えば、文書は、テキストデータ形式のデータであってもよいし、PDF形式等の各種の文書ファイル形式であってもよい。また文書は、様々なイメージデータ形式の画像データであってもよいし、動画データであってもよいし、HTML(HyperText Markup Language)形式やXML(eXtensible Markup Language)形式等のような構造化文書形式のデータであってもよい。
またこの明細書では、文書にとっての「関与者」とは、その文書の内容の保守に関与している個人又はユーザグループである。関与者は、例えば、その文書の内容の保守の担当者であってもよいし、その担当者に対してその保守の実行を促す役割のものであってもよい。例えば、文書を作成したユーザや文書を更新したユーザが、関与者の代表例である。また、文書が複数の文書要素から構成され、文書要素ごとに関与者が設定されている場合もあり得る。
<ハードウエア構成の例>
文書サービスシステム100は、コンピュータにそのシステムの機能を表すプログラムを実行させることにより実現される。
ここで、文書サービスシステム100のベースとなるコンピュータは、例えば、図3に示すように、ハードウエアとして、プロセッサ102、ランダムアクセスメモリ(RAM)等のメモリ(主記憶装置)104、フラッシュメモリやSSD(ソリッドステートドライブ)、HDD(ハードディスクドライブ)等の補助記憶装置106を制御するコントローラ、各種の入出力装置108とのインタフェース、ローカルエリアネットワークなどのネットワークとの接続のための制御を行うネットワークインタフェース110等が、例えばバス112等のデータ伝送路を介して接続された回路構成を有する。文書サービスシステム100の各機能の処理内容が記述されたプログラムが、ネットワーク等を経由してコンピュータにインストールされ、補助記憶装置106に保存される。補助記憶装置106に記憶されたプログラムが、プロセッサ102によりメモリ104を用いて実行されることにより、文書サービスシステム100の各機能が実現される。
ここでプロセッサ102とは広義的なプロセッサを指し、汎用的なプロセッサ(例えばCPU:Central Processing Unit、等)や、専用のプロセッサ(例えばGPU:Graphics Processing Unit、 ASIC:Application Specific Integrated Circuit、 FPGA:Field Programmable Gate Array、 プログラマブル論理デバイス、等)を含むものである。
また、プロセッサ102の動作は、1つのプロセッサ102によってなすのみでなく、物理的に離れた位置に存在する複数のプロセッサ102が協働してなすものであってもよい。また、プロセッサ102の各動作は、以下の実施形態において説明する順序のみに限定されるものではなく、適宜に変更してもよい。
なお、設計書管理システム10、社内規定管理システム20、クライアント30等の他の装置も、文書サービスシステム100と同様、コンピュータをベースとして構成されている。
<データベース構築>
図4~図8を参照して、文書サービスシステム100がサービス提供のために用いるデータベースの構築処理の例を説明する。このデータベースは、文書サービスシステム100が備える補助記憶装置106内に構築される。
文書サービスシステム100は、設計書管理システム10、社内規定管理システム20、法令管理システム60等、社内外の所定の文書管理システムを例えば定期的に巡回し、それら各文書管理システムに登録されている文書群を取得して解析する。この場合、文書サービスシステム100は、通知された情報を解析する。図4に示す手順は、文書サービスシステム100が、いずれかの文書管理システムから1つの文書を取得(S10)したときに実行する処理を示している。
この場合、文書サービスシステム100のプロセッサ102は、取得した文書の構造を解析することにより、その文書を文書要素の単位に分割する(S12)。構造解析は、例えば、文書をHTML形式に変換する処理により行う。HTML変換のための多種多様なツールが存在しており、S12では、その文書のファイル形式にあったツールを用いればよい。または、文書内容から見出しや、章、節、段落等の構造を認識する既存技術を用いて構造解析を行ってもよい。また、取得した文書が既にXML形式等の構造化文書である場合は、S12は省略してもよい。
次にプロセッサ102は、S10で取得した文書と同一の文書のデータがデータベース内に登録されているか否かを判定する(S14)。ここで言う「同一」とは、文書の内容全体が同一ということではなく、文書同士が同一の識別情報を持つということである。文書の識別情報のことを文書IDと呼ぶ。S14では、取得した文書の同じ文書IDを持つ文書の情報がデータベース内にあるか否かを判定する。
文書IDとしては、例えば、その文書の取得元の文書管理システム(例えば社内規定管理システム20や法令管理システム60)の識別情報と、その文書管理システムでのその文書の識別情報との組合せを用いてもよい。例えば、文書管理システム内にあるその文書のURL(Uniform Resource Locator)をその文書の文書IDとする等である。
S14の判定結果がNoの場合、S10で取得した文書は、プロセッサ102が初めて出会った文書である。この場合、プロセッサ102は、S10で取得した文書の情報と、S12の構造解析により得られた各文書要素の情報をデータベースに登録する(S16)。
次にプロセッサ102は、それら文書要素ごとに、データベース内に登録された他の文書要素との間での内容の類似度を計算し、得られた類似度をデータベースに登録する(S17)。文書要素同士の内容の類似度は、例えば、それら個々の文書要素に含まれる文字列をベクトル化し、得られた文書要素のベクトル同士の類似度合いを公知の手法(例えばコサイン類似度)で計算することで求めればよい。文書要素の文字列をベクトル化する方法としては、TF-IDF(Term Frequency-Inverse Document Frequency)やdoc2vec等の既存の手法を用いればよい。
ここで、S12で求めた文書要素との類似度を求める相手である「他の文書要素」は、典型的には、データベースに登録されている他の文書の文書要素である。ただし、これに限らず、S12で求めた文書要素同士の間の類似度を更に計算してもよい。
次にプロセッサ102は、S10で取得した文書と、データベースに登録されている他の文書との間の類似度を計算し、計算結果の類似度をデータベースに登録する(S18)。例えば、S12の構造解析において得られる文書内の章、節の見出しの文字列をその出現順に並べてマージした文字列を、その文書の特徴を示す文字列とし、その文字列をベクトル化する。このようにして得られた文書の特徴を示す文字列のベクトル同士の類似度を、それら文書間の類似度として求める。なお、文書間の類似度の計算方式はこれに限らない。この他に、例えば、文書内の文書要素(例えば章、節、段落)が構成するツリー構造をその文書の特徴とし、その特徴同士の類似度を、文書間の類似度としてもよい。
S14の判定結果がYesの場合、S10で取得した文書のデータは、文書サービスシステム100のデータベース内に登録されている。この場合、プロセッサ102は、S10で取得した文書、及びS12で求めた各文書要素が、データベース内に登録されている文書及び文書要素から変更されているか否かを調べる(S20)。このステップでは、例えば、S12で求めた文書要素ごとに、その文書要素の内容(すなわち文字列)を、データベース内の同じ文書要素(すなわち識別情報が同じ文書要素)の内容と比較し、両者が一致すればその文書要素は変更なし、不一致ならばその文書要素は変更有りと判定する。また、S12で求めた文書要素と同じ文書要素がデータベース内にない場合や、データベース内にある文書要素と同じ文書要素がS12の構造解析結果にない場合も、その文書要素に変更がある場合の例である。そして、いずれか1以上の文書要素について変更有りと判定された場合は文書全体について変更があるということであり、変更有りと判定された文書要素が1つもなければ文書全体について変更がないということである。
プロセッサ102は、S20で文書、文書要素についての変更を検出したかどうかを判定し(S22)、変更を検出した場合は、検出した変更の情報をデータベースに反映する(S24)。例えば、ある文書要素の内容が変更されていた場合、データベース内のその文書要素の内容を、その変更後の内容に更新する。変更が検出されなかった文書要素については、データベースに登録されている情報は変更不要である。また、文書内の文書要素の変更が検出された場合、データベース内のその文書の更新日時等の情報を変更する。
またプロセッサ102は、S20で内容の変更が検出された文書要素について、データベース内の他の文書要素との間での内容の類似度を計算する。そして、データベースに登録されている、それら文書要素間の類似度の値を、その計算により得られた値へと更新する(S26)。なお、S20で検出された文書要素がデータベース内にない新規の文書要素である場合は、その文書要素とデータベース内の他の文書要素との類似度を計算し、その類似度をデータベースに登録する。また、データベース内にある文書要素がなくなったことがS20で検出された場合は、そのなくなった文書要素と他の文書要素との類似度の情報をデータベースから削除してもよい。なお、変更が検出されなかった文書要素については、S26の処理は行わない。
また、プロセッサ102は、S10で取得した文書とデータベース内の他の文書との類似度を、S18の場合と同様に計算し、データベース内の該文書と他の文書との類似度をその計算結果に応じて更新する(S28)。
図5~図8を参照して、文書サービスシステム100内のデータベースに登録される情報の例を説明する。
図5に、データベースに登録されている2つの文書200及び210の、HTML化による構造解析結果の情報を例示する。文書200は、H1要素(例えば当該文書のタイトル)を子の文書要素(以下、子要素と呼ぶ)として持ち、そのH1要素は子要素として2つのH2要素を持ち、それらH2要素はそれぞれ2つ及び1つのH3要素を子要素として持つ。このように文書200の構造情報は、図示のツリー構造により表現される。文書及び各文書要素にはそれぞれ一意な識別情報が割り当てられている。データベースには、文書の構造情報として、その文書の識別情報に対応付けて、図示のツリー構造を表現するデータが登録される。
また、データベースには、文書200及び210のそれぞれについてのプロパティデータ(「文書プロパティ」と呼ぶ)と、個々の文書要素についてのプロパティデータ(「要素プロパティ」と呼ぶ)が登録される。
また、文書200と文書210との間の、文書間の類似度が計算され、データベースに登録される。また、この文書要素同士の間の内容の類似度が計算され、データベースに登録される。
図6は、データベースに登録されている文書プロパティのデータ構造の一例を示す。図6に例示した文書の文書プロパティには、該文書の文書ID、文書名、文書特徴、作成者、作成日時、最終更新者、更新日時、取得日時、格納場所の各項目が含まれる。文書名は、例えば該文書のファイル名である。また、文書特徴は、該文書の特徴を示すデータであり、例えば前述した該文書内の章、節の見出しの文字列をその出現順に並べてマージした文字列がその一例である。またこの文字列をベクトル化したものを文書特徴として用いてもよい。作成者は、該文書を最初に作成したユーザのユーザIDを示し、作成日時はその作成の日時を示す。また最終更新者は、該文書を最後に更新したユーザのユーザIDを示し、更新日時はその更新の日時を示す。これら作成者、作成日時、最終更新者、更新日時の情報は、例えば、その文書のファイルの属性データから取得すればよい。また、取得日時は、プロセッサ102が、社内規定管理システム20や法令管理システム60等の文書管理システムから該文書を最後に取得した日時を示す。格納場所は、該文書が元々格納されていた文書管理システムを特定する情報(例えばその文書管理システムのURL)である。
前述した図4の手順のS18及びS26では、このような文書プロパティの情報と、S12で求めた該文書のツリー構造の情報をデータベースに登録する。
図7は、データベースに登録されている要素プロパティのデータ構造の一例を示す。図7に例示した文書要素の要素プロパティには、該文書要素の要素ID、要素名、要素内容、内容特徴、作成者、作成日時、最終更新者、更新日時、取得日時、格納場所の各項目が含まれる。要素IDは、該文書要素の識別情報である。例えば、該文書要素が含まれている文書の文書IDと、該文書内で該文書要素に一意に割り当てた番号との組を、要素IDとしてもよい。要素名は、該文書要素の名前である。例えば、該文書要素が見出しを含む場合はその見出しを要素名としてもよい。また該文書要素が見出しを含まない場合は、該文書要素の先頭の所定文字数の文字列を要素名としてもよい。要素内容は、該文書要素の内容のデータである。例えば該文書要素がテキストであれば、要素内容はそのテキストの文字列である。要素特徴は、該文書要素の特徴を示すデータであり、例えば前述した該文書要素の文字列をベクトル化したものである。作成者は、該文書を最初に作成したユーザのユーザIDを示し、作成日時はその作成の日時を示す。元の文書のファイル(又はこれを管理している文書管理システム)が、文書要素単位で作成者や作成日時の情報を有している場合は、それらの情報が要素プロパティの作成者及び作成日時の項目に登録される。元の文書のファイルが、文書単位での作成者及び作成日時しか持たない通常のケースでは、該文書に含まれる文書要素の要素プロパティの作成者及び作成日時には、該文書の作成者及び作成日時が登録される。
最終更新者は、該文書要素を最後に更新したユーザのユーザIDを示し、更新日時はその更新の日時を示す。元の文書のファイル(又はこれを管理している文書管理システム)が、文書要素単位で最終更新者や更新日時の情報を有している場合は、それらの情報が要素プロパティの最終更新者及び更新日時の項目に登録される。元の文書のファイルが、文書単位での最終更新者や更新日時しか持たない通常のケースでは、該文書に含まれる文書要素の要素プロパティの最終更新者や更新日時の項目には、該文書要素の内容が変更されたことを検知したときの文書の最終更新者や更新日時の値が登録される。なお、文書要素の内容が変更されたか否かは、S12で得た文書要素の要素内容又は内容特徴と、これと同じ要素IDを持つデータベース内の文書要素の要素内容又は内容特徴とを比較することで判定すればよい。
また、取得日時は、プロセッサ102が、該文書要素を最後に取得した日時である。この取得日時は、該文書要素が含まれる文書の取得日時と同じである。格納場所は、該文書要素が元々格納されていた文書管理システムを特定する情報であり、該文書要素が含まれる文書の格納場所と同じである。
前述した図4の手順のS16では、このような要素プロパティの各項目の情報をデータベースに登録する。またS24では、変更が検知された文書要素の要素プロパティの各項目の値を、その変更の内容に応じた値に更新する。
なお、文書が外部(例えば社内ネットワーク40の外)の文書管理システムから取得されたものである場合、その文書については図6及び図7に例示した文書プロパティ及び要素プロパティのうちの全ての項目の情報が取得できない場合がある。そのような項目は空値とするか、又は他の情報に基づき文書サービスシステム100が求めた値を設定する。例えば、法令管理システム60から取得した文書については、作成者、作成日時、最終更新者、更新日時の情報が、その文書又は法令管理システム60から入手できないことが考えられる。その場合、作成者、作成日時、最終更新者の項目は空値としておいてもよい。また、取得した文書内の文書要素に図4の手順のS20で変更を検知した場合、文書サービスシステム100は、その文書要素及びその文書の更新日時に、その取得の日時を設定すればよい。
図6及び図7に例示した文書プロパティ及び要素プロパティの項目群はあくまで一例に過ぎない。文書プロパティ及び要素プロパティは、図示した項目の全てを含んでいる必要はないし、また図示していない項目を含んでいてもよい。
図8に、データベースに登録されている文書要素同士の関係情報を例示する。図8に例示した関係情報は、2つの文書要素の要素IDのペアに対応付けて、それら2つの文書要素の内容の類似度の値と、その値から判定されるそれら文書要素同士の関係の種類とを含んでいる。この例では、文書要素同士の関係の種類を、文書要素同士の内容の類似度の大きさに応じていくつかに分類している。例えば、文書要素同士の内容の類似度が0.95(すなわち95%)以上の場合は、それら文書要素同士の関係の種類を「引用」と名付ける。また、文書要素同士の内容の類似度が0.80以上0.95未満の場合の関係の種類を「類似」と名付け、0.60以上0.80未満の場合の関係の種類を「参照」と名付ける。また、類似度が0.60未満場合は、それら2つの文書要素は無関係と判断する。
また、図8では省略したが、類似度や関係の種類を判定した日時を更に関係情報に登録してもよい。
図4の手順のS17及びS26では、文書要素同士の類似度と、その類似度に対応する関係の種類を判定し、それらの値を図8に例示した関係情報に登録する。
なお、図8に例示した関係情報はあくまで例示的なものにすぎない。関係情報としては、類似度は含むが関係の種類を含まないものを用いてもよいし、その逆に類似度は含まないが関係の種類は含むものを用いてもよい。
<文書サービスシステムが提供するサービス>
構築されたデータベースを用いて文書サービスシステム100が提供するサービスの例を説明する。
図9に、文書サービスシステム100がユーザに提供する情報提供画面300を例示する。この情報提供画面300は、ユーザから指定された文書320の中で変更があった文書要素322及び324に関係がある文書要素332及び342の情報を提供する。その情報は、それら文書320や文書要素322,324,332,342の関係のグラフ310の形で提供される。
なお、この情報提供画面300には、変更があった文書要素322及び324に関係がある全ての文書要素が示されるのではなく、そのうちそのユーザが関与者(例えばその文書要素の作成又は更新を行った者等)である文書要素のみが表示される。そのユーザが関与者である文書要素は、文書要素322及び324の変更に応じた変更作業をそのユーザが行うものと期待されるので、そのユーザにその文書要素の情報を提供するのである。これに対して、ユーザが関与者でない文書要素は、そのユーザに対して情報提供しても、そのユーザが修正等の対応作業を行えない可能性が高いので、情報提供を行わない。
なお、ここでは文書要素の関与者として、文書要素の要素プロパティに含まれる作成者又は更新者を例示したが、この他に、その文書要素又はその文書要素の含む文書に対して編集権限を持っているユーザやユーザグループを、その文書要素の関与者としてもよい。
図示例では、ユーザから指定された文書は「サービス品質保証ガイド」という文書名の文書であり、そのうち「規定第7項」という要素名の文書要素322と、「規定第11項」という要素名の文書要素324とが、変更があった文書要素として検出されている。文書要素に変更があったかどうかは、例えば現在から所定長さ(例えば1ヶ月)だけ遡る期間内にその文書要素が更新されているか否かにより判定すればよい。すなわち、文書要素の最終更新日時がその期間内であれば「変更があった」と判定し、最終更新日時がその期間より前であれば、「変更はなかった」と判定すればよい。なお、その期間の長さをユーザが指定できるようにしてもよい。また、その期間の始期と終期の両方をユーザが指定できるようにしてもよい。情報提供画面300の右下の「期間」の指定欄は、このために用いられる。
また図示例では、変更があった文書要素322に対して「参照」の関係を持つ文書要素332が見つかっている。この文書要素332は、「ファミリー動作環境.docx」という文書名の文書330に属する文書要素であり、「3.動作仕様」という要素名を持つ。また、変更があった文書要素324に対して「参照」の関係を持つ文書要素342が見つかっている。この文書要素342は、「品質点検結果報告書.xlsx」という文書名の文書340に属する文書要素であり、「4.実施対象」という要素名を持つ。
また図示例では、文書320の文書要素群のうち、互いに「類似」の関係にある文書要素326及び328が示されている。
グラフ310には、それら文書320、330、340を示すノード群と、文書要素322~328、332、342を示すノード群と、それらノード間の関係を示すエッジ群が示される。各エッジの近くには、そのエッジが示す関係の種類を示す文字列が表示されている。例えば、文書要素322、332間の関係を示すエッジには「参照」という文字列が、文書要素326、328間の関係を示すエッジには「類似」という文字列が示されている。また、例えば、文書要素322から文書320へと延びる矢印状のエッジには、「親」という文字列が示されている。これは文書320は文書要素322からみてツリー構造上の親であることを示す。
グラフ310のうち、変更があった文書320及び文書要素322、324のノードは、変更があったことを表す特別な表示態様で強調表示されている。
また、変更のあった文書要素322、324と関係がある文書要素332、342と、この文書要素332、342の親である文書330、340のノードも、別の表示態様で強調表示されている。図示例では、文書要素322、332間の関係と、文書要素324、342間の関係は共に「参照」なので、文書要素332と文書要素342の強調表示の表示態様は同じである。これに対して、仮にそれら2つの関係の種類が異なる場合には、文書要素332と文書要素342の強調表示の表示態様は異なったものとなる。例えば、後述する図13に示すように、変更された文書要素324に対して「引用」関係を持つ文書要素352のノードは、「参照」関係よりも目立つ表示態様で表示する。「参照」よりも「引用」の方が両文書要素間の内容の類似度がはるかに高いので、変更された文書要素に対応して内容を修正する必要性は、「引用」の方がはるかに高いと考えられるからである。
図9に示す情報提供画面300を作成する処理手順の例を、図10に示す。
図10の手順では、文書サービスシステム100のプロセッサ102は、クライアント30に対して検索条件等を入力するための入力画面を例えばウェブページの形態で提供し、ユーザから検索条件等の入力を受け付ける(S30)。次にプロセッサ102は、入力された検索条件に合致する文書をデータベース内から検索し(S32)、検索結果の文書のリストを示す画面をクライアント30に提供し、ユーザから注目文書の選択を受け付ける(S34)。図9は、注目文書として文書320「サービス品質保証ガイド」をユーザが選択した場合の例である。
次にプロセッサ102は、ユーザから選択された注目文書に属する各文書要素の要素プロパティを調べることで、所定期間内に変更があった文書要素を特定し、変更があった文書要素の有無を判定する(S36)。注目文書内に変更があった文書要素がない場合は、プロセッサ102は、その旨を示す画面を生成し、クライアント30に表示させる(S38)。
S36の判定結果がYesの場合、プロセッサ102は、特定した変更ありの文書要素に関係のある文書要素をデータベース内の関係情報(図8参照)から求め、求めた文書要素のうちそのユーザが関与者である文書要素を抽出する(S40)。この抽出は、求めた文書要素の要素プロパティを参照して行えばよい。そして、プロセッサ102は、S36で求めた変更のあった文書要素とその文書要素が属する文書、及びS40で抽出した文書要素とその文書要素が属する文書の関係を示すグラフ310を生成する。そして、そのグラフ310を含む情報提供画面300をクライアント30に提供する(S42)。プロセッサ102は、グラフ310に表示する各文書要素のノードの表示形態を、該文書要素の変更の有無や、該文書要素と変更のあった文書要素との関係の種類に応じて決定する。
図11に、文書サービスシステム100がユーザに提供する情報提供画面300の別の例を示す。
図11に示すグラフ310では、注目文書320内の変更があった文書要素322、324に関係のある、該ユーザが関与者である文書要素332、342のうち、その変更の後に内容に変更が加えられていない文書要素332が強調表示されている。これに対し、変更があった文書要素324に関係する文書要素342は、その変更の後に内容が変更済みなので、強調表示はされていない。
文書要素322が変更されると、これに応じてその文書要素322に関係がある文書要素を変更する必要があるか確認し、必要ならば変更を行うこととなる。そこで、変更のあった文書要素と関係する文書要素のうち、未変更のものを強調表示することにより、ユーザに確認を促すのである。
図11に示す情報提供画面300を作成する処理手順の例を、図12に示す。図12の手順のうち、図10の手順と同様の処理を行うステップには同一符号を付し、説明を省略する。
図12の手順では、プロセッサ102は、S40で抽出した文書要素が、対応する変更された文書要素の変更の後に変更されているか否かを判定する(S50)。例えば、判定対象の文書要素の最終更新日時が、対応する変更された文書要素の最終更新日時より後であれば、S50では変更済みと判定され、そうでなければS50では未変更と判定される。図10の例でいえば、文書要素332の最終更新日時は、対応する変更のあった文書要素322の最終更新日時より前なので、文書要素332は未変更と判定される。
プロセッサ102は、グラフ310を生成すると共に、そのグラフ310のうち、S50で未変更と判定された文書要素のノードを、未変更の旨を知らせるための特別な表示態様で強調表示する。そして、そのグラフ310を含む情報提供画面300をクライアント30に提供する(S42A)。
ユーザは、クライアント30に表示されるその情報提供画面300上で、変更があった文書要素322と、強調表示された未変更の文書要素332のノードとを選択する。これに応じて、文書サービスシステム100のプロセッサ102は、それら選択された文書要素の最新の内容を表示する画面を、クライアント30に提供する。ユーザは、その画面でそれら各文書要素の内容を確認し、文書要素332の内容に変更が必要か判断する。そして、文書要素332の変更が必要と判断すると、ユーザは、その文書要素332の内容に必要な変更を加える。この変更に応じて、プロセッサ102は、データベース内の文書要素332の要素プロパティ(図7参照)の要素内容や内容特徴を変更する。また、プロセッサ102は、その要素プロパティ内の格納場所の情報を用いて、その文書要素332が属する文書を管理している文書管理システムにアクセスし、その文書のオリジナルにおける文書要素332に対応する部分に、その変更を反映する。
なお、文書要素に変更があった後、その文書要素に関係のある文書要素をその変更に応じて変更するかをユーザが確認した結果、変更不要と判断する場合もある。この場合、後者の文書要素の内容は変更されていないが、必要な確認は済んでいるので、グラフ310において強調表示すると、無駄な確認をユーザに求めてしまうことになる。そこで、文書サービスシステム100のプロセッサ102は、情報提供画面300上で選択された文書要素の内容を表示する画面にて、その内容の編集を受け付けるだけでなく、その内容の確認の有無の指定を受け付ける。そして、ユーザから確認ありの指定があれば、その文書要素の最終更新日時を、その指定がなされた時刻に変更する。これにより、その後の情報提供画面300で、その文書要素が未変更として強調表示されることはない。
図13に、文書サービスシステム100がユーザに提供する情報提供画面300の更に別の例を示す。
図13に示すグラフ310には、図9に示したノード群に加え、変更があった文書要素322に関係のある、該ユーザが関与者である別の文書要素352と、その文書要素352の親である文書350(文書名「機能仕様書.xlsx」)のノードが表示されている。文書要素352は、変更があった文書要素324に対して「引用」の関係を持っている。すなわち、文書要素352の内容は、文書要素324の内容と同一であるか又は非常に近い。他の文書要素342も同じ文書要素324に関係を持つが、その関係は「引用」よりも文書要素の内容同士の類似度がかなり低い「参照」である。このため、文書要素352のノードは、「引用」の関係を表す表示態様で強調表示されており、この表示態様は「参照」の関係を表す表示態様よりも目立ちやすい態様である。
また、この例では、文書サービスシステム100は、変更があった文書要素322に対して「引用」関係を持つ文書要素352を検出した場合、その文書要素352の内容を、変更があった文書要素322の内容に合わせて更新する。すなわち、例えば、文書要素352に対して変更後の文書要素322の内容を上書きする。
この更新は、文書サービスシステム100のデータベース内の文書要素352の要素内容(図7参照)に対して行う。更に、その文書要素352を含む文書350を管理している文書管理システム(図示省略)内の、その文書350のオリジナルのデータに対しても同様の更新を実行する。
また、この更新は、文書サービスシステム100が、ユーザの確認を待たずに自動的に実行してもよい。また、別の例として、その更新を行うか否かの確認をユーザに求め、更新を行う旨の指示をユーザから得た場合に、文書サービスシステム100がその更新を実行してもよい。
図13の例における文書サービスシステム100の処理手順の例を、図14に示す。図12の手順のうち、図10の手順と同様の処理を行うステップには同一符号を付し、説明を省略する。
図14の手順では、プロセッサ102は、S40で抽出した文書要素の中に、変更のあった文書要素(変更要素と呼ぶ)に対して「引用」関係を持つ文書要素(対象要素と呼ぶ)があるかどうか調べる。対象要素があれば、文書サービスシステム100内のデータベースのその対象要素の要素内容、及びその対象要素を含む文書を管理している文書管理システム内のその文書を、その変更要素の変更後の内容に合わせて更新する(S55)。この更新にともない、そのデータベース内のその対象要素の要素プロパティの内容特徴、最終更新者、更新日時等、及び、その対象要素を含む文書の文書プロパティ(図6参照)の文書特徴、最終更新者、更新日時等も更新される。
なお、プロセッサ102は、対象要素の更新を実行するか否かを問い合わせる画面をクライアント30に提供し、その画面に対して実行する旨を示す指示がユーザからあった場合に、S55を実行してもよい。その画面に対して更新を実行しない旨の指示がユーザから入力された場合には、プロセッサ102は、S55を実行しない。
また、プロセッサ102は、グラフ310を生成すると共に、そのグラフ310のうち、変更があった文書要素に対して「引用」関係を持つ文書要素のノードを、「引用」を示す特別の表示態様で強調表示する。そして、そのグラフ310を含む情報提供画面300をクライアント30に提供する(S42B)。
以上では、情報提供画面300について図9、図11、図13に示す3つの例を別々に示したが、それら3つの例の表示制御を組み合わせてもよい。例えば、変更があった文書要素に対して関係を持つ文書要素をその関係の種類に応じた表示態様で表示すると共に、後者の文書要素が前者の変更後に未変更であれば、未変更の旨を示す強調表示を後者に追加する。
図15に、文書サービスシステム100がユーザに提供する情報提供画面300内のグラフ310の別の例を示す。
図15に示したグラフ310は、図9に示したグラフ310に対して、文書要素334、文書要素A,B,C,D,X,Yの各ノードを追加し、文書要素322と334との関係を「参照」から「類似」に変更したものである。上述のように「類似」は「参照」よりも、文書要素同士の内容の類似度が高い。
文書要素334(要素名「4.動作環境」)は、文書330内の文書要素であり、文書320内の変更のあった文書要素322に対して「引用」関係を持っている。文書要素A,B,Cは、その文書要素334に対してそれぞれ「引用」、「類似」、「参照」の関係を持っている。また、文書要素Dは、文書要素Aに対して「引用」の関係を持っている。
また、文書要素X,Yは、文書要素332に対してそれぞれ「引用」、「類似」の関係を持っている。
このように、図15のグラフ310には、変更のあった文書要素322に対して直接の関係を持たない文書要素A,B,C,D,X,Yも表示される。変更のあった文書要素に対して直接の関係を持たない文書要素の表示の制御について、以下に説明する。
ここで、以下の説明では、ユーザが指定した文書内で変更のあった文書要素を変更要素と呼び、この変更要素に対して直接の関係を持つ文書要素を一次要素と呼ぶ。また、一次要素に対して関係を持つ要素を二次要素と呼び、二次要素に対して関係を持つ文書要素を三次要素と呼ぶ。図15の例では、文書要素322及び324は変更要素であり、文書要素332,334及び342は一次要素である。また、文書要素A,B,C,X,Yは二次要素であり、文書要素Dは三次要素である。二次要素及び三次要素は、変更要素に対して直接の関係を持たない。また、以下の説明では、変更要素と一次要素との関係を一次関係と、一次要素と二次要素の関係を二次関係、二次要素と三次要素の関係を三次関係と呼ぶ。一般化すると、(n-1)次要素とn次要素との関係がn次関係である(nは1以上の整数)。ただし、この場合、変更要素は0次要素である。
まず、文書サービスシステム100のプロセッサ102は、グラフ310に含める、すなわち表示する、二次関係の種類を、対応する一次関係の種類に応じて制限する。すなわち、一次関係の種類が「強い」ほど、対応する二次関係のうちグラフ310に含めるものの種類を多くする。また、「弱い」関係ほど、グラフ310に含まれにくくする。一次関係は、種類によらずグラフ310に含められるが、二次関係は、対応する一次関係の種類に応じて限定された種類のみがグラフ310に含められる。これまでに例示した「引用」、「類似」、「参照」の3つの種類の関係では、「引用」が最も強く、その次が「類似」であり、最も弱いのが「参照」である。この強弱関係は、それら各種類の関係をなす文書要素同士の内容類似度の大小関係を反映している。
図15の例では、一次関係が「引用」であれば3種類全ての二次関係を表示し、一次関係が「類似」であれば「引用」と「類似」の2種類の二次関係のみを表示し、一次関係が「参照」であれば「引用」という1種類の二次関係のみを表示している。
例えば、変更要素322に対して「引用」という一次関係を持つ一次要素334については、「引用」(すなわち二次要素Aとの関係)、「類似」(すなわち二次要素Bとの関係)、「参照」(すなわち二次要素Cとの関係)の全ての種類の二次関係が表示されている。
これに対して、変更要素322に対して「類似」という一次関係を持つ一次要素332については、「引用」(すなわち二次要素Xとの関係)、「類似」(すなわち二次要素Yとの関係)という2種類の二次関係が表示されるのみである。仮に、一次要素332に対して「参照」という種類の二次関係を持つ二次要素が存在していたとしても、その二次関係及び二次要素はグラフ310には表示されない。
また、変更要素324に対して「参照」という一次関係を持つ一次要素342については、二次関係及び二次要素はグラフ310に表示されていない。変更要素に「参照」の一次関係を持つ一次要素については、最も強い「引用」の種類の二次関係は表示可能であるが、図15の例では、一次要素342に対して「引用」の二次関係を持つ二次要素は存在しないので、表示されないのである。仮に一次要素342に「類似」や「参照」の関係を持つ二次要素が存在しても、それはグラフ310には表示されない。
また、プロセッサ102は、グラフ310に含めるn次関係のnの上限値を、一次関係の種類に応じて決定してもよい。
図15の例では、文書要素322と334との「引用」の一次関係から延びる関係については、最大三次までの関係をグラフ310に含めている。これに対して、「引用」より弱い「類似」の一次関係から延びる関係については、最大二次までしかグラフ310に含めない。文書要素322と332との一次関係は「類似」なので、仮に一次要素332に関係する二次要素Xに対して、「引用」等の強い三次関係を持つ三次要素が存在していたとしても、その三次関係及び三次要素はグラフ310には表示されない。
また、図15の例では、S32で検索した文書内の変更があった文書要素に関係がある文書要素であっても、変更があった文書要素と同じ文書(すなわち検索した文書)に含まれる文書要素については、ユーザに提供するグラフ310中に表示していない。検索した文書又はその中の文書要素に対して、そのユーザが編集権限を持っているとは限らないからである。ただし、変更があった文書要素に関係がある文書要素ごとに、そのユーザが編集権限を持っているかどうかを確認し、編集権限持っている場合には、変更があった文書要素と同じ文書内の文書要素であっても、グラフ310に表示するようにしてもよい。
<サービスの別の例>
以上に示した例では、文書サービスシステム100は、文書要素の変更を検知した時点では単にそれをデータベースに記録するのみであった。その変更の情報がユーザに提供されるのは、ユーザがその文書要素を含む文書を指定し、これに応じてその文書に対する情報提供画面300がそのユーザに提供された時点である。
これに対する別の例として、以下では、文書サービスシステム100が、ある文書要素の内容が変更されたことを検知した場合に、その文書要素に関係を持つ他の文書要素の関与者に対して通知する処理を説明する。
この処理の手順の一例を図16に示す。図16の手順は、図4に示した手順におけるS28の後に続くステップ群を示している。
図16の手順では、プロセッサ102は、S22(図4参照)で変更があった文書要素を検出した場合、その文書要素に対して関係を持っている文書要素群をデータベース内の関係情報(図8参照)から抽出する(S60)。そして、プロセッサ102は、抽出した文書要素ごとに、その文書要素の関与者の情報をデータベースから求め、その関与者に対して、その変更を知らせる通知を、その関係の種類に応じた通知方式で実行する(S62)。関与者への通知の方式には、例えば関与者が文書サービスシステム100にログインした際に表示するポータルページ上の通知欄に表示する方式や、文書サービスシステム100がその関与者に提供する情報提供画面300等の画面に対してポップアップ画面としてその変更を知らせるメッセージを表示する方式、関与者が文書サービスシステム100に登録している該関与者の電子メールアドレスに対して電子メールで送信する方式等、複数の方式がある。通知欄の表示は、関与者が文書サービスシステム100にログインしない限り表示されないのに対して、電子メールでの通知は関与者が文書サービスシステム100にログインしていない期間でも関与者に届くので、電子メールの方が関与者にとって目立ちやすい。S62では、その関係の種類が強いほど、関与者にとって目立ちやすい方式の通知を行う。例えば、その関係の種類が「参照」及び「類似」であれば、関与者のポータルページ上の通知欄への表示のみを行うのに対し、その関係の種類がそれらより強い「引用」であれば、その通知欄への表示に加え、関与者に対して電子メールによる通知を行う。
以上に説明した実施形態はあくまで例示的なものにすぎず、本発明の範囲内で様々な変形があり得る。
例えば、上記実施形態では、文書要素同士の関係の種類を、それら文書要素の内容の類似度に応じて定めたが、これは一例に過ぎない。
例えば、文書要素を作成又は更新したユーザが、その文書要素に関係を持つ他の文書要素とその関係の種類を文書サービスシステム100に登録してもよい。
また、ユーザに文書編集の機能を提供する装置(例えばクライアント30が提供する文書編集アプリケーション)が、ユーザが文書要素を編集中に行った操作に応じて、文書要素間の関係を判定し、文書サービスシステム100に登録してもよい。例えば、ユーザが、装置の画面上に開いた文書A内の文書要素aを、コピー&ペースト操作により、その画面上に開いた別の文書B内の文書要素bにコピーした場合、その装置は、文書要素bが文書要素aに対して「引用」の種類の関係を持つと判定する。そして、その「引用」関係を文書サービスシステム100に登録する。また、例えば、装置は、ユーザが画面上に開いた文書要素cを編集中に、その画面上に別の文書要素dが開かれていた(ただし、文書要素dからcに対してコピー&ペーストは行われなかった)場合、文書要素cが文書要素dに対して「参照」の関係を持つと判定する。
以上に説明した実施形態において、文書要素は、文書を構成する要素のことである。ここで、文書管理システムが管理する個々の文書を構成要素とするより大きな単位の文書が存在してもよい。この場合、前者の個々の文書は、後者の大きな単位の文書にとっての文書要素である。例えば、ハイパーリンクで結びつけられた複数の文書から構成されるハイパーテキストを大きな単位の文書と捉えた場合、それら複数の文書はそのハイパーテキストから見ると文書要素に当たる。
10 設計書管理システム、20 社内規定管理システム、30 クライアント、40 社内ネットワーク、50 インターネット、60 法令管理システム、70 XX標準管理システム、100 文書サービスシステム、102 プロセッサ、104 メモリ、106 補助記憶装置、108 入出力装置、110 ネットワークインタフェース、112 バス。

Claims (8)

  1. プロセッサを含み、
    前記プロセッサは、
    第1文書要素と、前記第1文書要素と異なる第2文書要素とを、文書要素同士の類似度の大きさにより分類される複数種類の関係のうち、前記第1文書要素と前記第2文書要素との類似度の大きさに応じた種類の関係で関係付け、
    前記第1文書要素が変更された場合に、前記第2文書要素に関して、前記第1文書要素と前記第2文書要素との前記関係の種類に応じた処理を実行する、
    情報処理装置であって、
    前記関係の種類に応じた処理は、前記第1文書要素と前記第2文書要素との前記関係が、前記第1文書要素と前記第2文書要素との類似度が0より大きい所定の第1閾値以上であるという第1種類の関係である場合、前記処理は、前記第2文書要素の関与者に前記第1文書要素が変更された旨を通知する通知処理であり、
    前記通知処理は、変更された前記第1文書要素と、前記第1文書要素に関係付けられた一以上の前記第2文書要素と、の関係を示す表示画面において、一以上の前記第2文書要素のうち、前記第1文書要素の変更後に変更されていない前記第2文書要素を、前記第1文書要素の変更後に変更された前記第2文書要素とは異なる表示態様で表示する処理である、情報処理装置
  2. 前記プロセッサは、
    前記第1文書要素及び前記第2文書要素がそれぞれ変更された日時を記録し、
    前記通知処理では、
    記録した前記第1文書要素及び前記第2文書要素の変更された日時を参照し、
    前記第1文書要素との前記関係が前記第1種類の関係である前記第2文書要素のうち、最後に変更された日時が、前記第1文書要素が最後に変更された日時よりも前である前記第2文書要素は、最後に変更された日時が、前記第1文書要素が最後に変更された日時以降である前記第2文書要素よりも、前記表示画面において強調して表示する、
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記関係の種類に応じた処理では、前記第1文書要素と前記第2文書要素との前記関係が前記第1種類の関係であっても、前記第1文書要素と前記第2文書要素とが同一の文書に含まれる場合には、前記通知処理を行わない、請求項又はに記載の情報処理装置。
  4. 前記第1文書要素と前記第2文書要素との前記関係が第2種類の関係である場合、前記関係の種類に応じた処理は、変更後の前記第1文書要素を前記第2文書要素にコピーする処理であり、
    前記第2種類の関係は、前記類似度が、前記第1文書要素と前記第2文書要素とが同一とみなせる類似度の最低値である第2閾値であって前記第1閾値より大きい第2閾値、以上であるという関係である、請求項1~のいずれか1項に記載の情報処理装置。
  5. プロセッサを含み、
    前記プロセッサは、
    第1文書要素と、前記第1文書要素と異なる第2文書要素とを、文書要素同士の類似度の大きさにより分類される複数種類の関係のうち、前記第1文書要素と前記第2文書要素との類似度の大きさに応じた種類の関係で関係付け、
    前記第1文書要素が変更された場合に、変更された前記第1文書要素と、前記第1文書要素に関係付けられた一以上の前記第2文書要素と、の関係を、前記第1文書要素及び前記第2文書要素をノードとし、前記関係をエッジとするグラフ、として表示する表示画面において、前記一以上の前記第2文書要素の各々を、当該第2文書要素と前記第1文書要素との関係の種類に応じた表示形態で表示する表示処理、を実行する
    報処理装置。
  6. 前記表示処理は、前記第2文書要素に関係付けられた第3文書要素を示すノードを前記表示画面に表示するか否かを、前記第1文書要素と前記第2文書要素との前記関係の種類に応じて制御する制御処理を含
    前記制御処理では、前記第1文書要素と前記第2文書要素との前記関係の種類が表す、前記第1文書要素と前記第2文書要素との類似度、が大きいほど、前記第2文書要素に対する類似度がより小さい前記第3文書要素まで前記表示画面に表示する、ことを特徴とする請求項に記載の情報処理装置。
  7. 前記表示処理は、前記第2文書要素に対して連鎖的に関係付けられている文書要素群を何段階の関係の文書要素まで前記表示画面に表示するかを、前記第1文書要素と前記第2文書要素との前記関係の種類に応じて制御する制御処理、を含
    前記制御処理では、前記第1文書要素と前記第2文書要素との前記関係の種類が表す、前記第1文書要素と前記第2文書要素との類似度、が大きいほど、より多くの段階の文書要素まで前記表示画面に表示する、ことを特徴とする請求項に記載の情報処理装置。
  8. コンピュータに、
    第1文書要素と、前記第1文書要素と異なる第2文書要素とを、文書要素同士の類似度の大きさにより分類される複数種類の関係のうち、前記第1文書要素と前記第2文書要素との類似度の大きさに応じた少なくとも一の種類の関係で関係付け、
    前記第1文書要素が変更された場合に、前記第2文書要素に関して、前記第1文書要素と前記第2文書要素との前記関係の種類に応じた処理を実行する、
    処理を実行させるためのプログラムであって、
    前記関係の種類に応じた処理は、前記第1文書要素と前記第2文書要素との前記関係が、前記第1文書要素と前記第2文書要素との類似度が0より大きい所定の第1閾値以上であるという第1種類の関係である場合、前記処理は、前記第2文書要素の関与者に前記第1文書要素が変更された旨を通知する通知処理であり、
    前記通知処理は、変更された前記第1文書要素と、前記第1文書要素に関係付けられた一以上の前記第2文書要素と、の関係を示す表示画面において、一以上の前記第2文書要素のうち、前記第1文書要素の変更後に変更されていない前記第2文書要素を、前記第1文書要素の変更後に変更された前記第2文書要素とは異なる表示態様で表示する処理である、プログラム
JP2019220545A 2019-12-05 2019-12-05 情報処理装置及びプログラム Active JP7456136B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2019220545A JP7456136B2 (ja) 2019-12-05 2019-12-05 情報処理装置及びプログラム
US16/847,594 US20210174011A1 (en) 2019-12-05 2020-04-13 Information processing apparatus and non-transitory computer readable medium storing program
CN202010493330.4A CN112925880A (zh) 2019-12-05 2020-06-03 信息处理装置、存储介质及信息处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019220545A JP7456136B2 (ja) 2019-12-05 2019-12-05 情報処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2021089664A JP2021089664A (ja) 2021-06-10
JP7456136B2 true JP7456136B2 (ja) 2024-03-27

Family

ID=76163343

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019220545A Active JP7456136B2 (ja) 2019-12-05 2019-12-05 情報処理装置及びプログラム

Country Status (3)

Country Link
US (1) US20210174011A1 (ja)
JP (1) JP7456136B2 (ja)
CN (1) CN112925880A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021089668A (ja) * 2019-12-05 2021-06-10 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP2022059704A (ja) * 2020-10-02 2022-04-14 富士フイルムビジネスイノベーション株式会社 ファイル管理装置およびプログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003281118A (ja) 2002-03-22 2003-10-03 Toshiba Corp 文書管理装置、文書編集装置、文書管理方法、文書編集方法及びプログラム
JP2014021508A (ja) 2012-07-12 2014-02-03 Fuji Xerox Co Ltd 文書関連付け装置及びプログラム
JP2015032293A (ja) 2013-08-07 2015-02-16 富士ゼロックス株式会社 文書管理装置及び文書管理プログラム
JP2018077670A (ja) 2016-11-09 2018-05-17 株式会社日立製作所 分析装置、分析方法、および分析プログラム
JP2020160521A (ja) 2019-03-25 2020-10-01 日本電気株式会社 文書管理装置、文書管理方法、及び、プログラム

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040098405A1 (en) * 2002-11-16 2004-05-20 Michael Zrubek System and Method for Automated Link Analysis
CA2418255A1 (en) * 2003-01-31 2004-07-31 Ibm Canada Limited - Ibm Canada Limitee Tracking and maintaining related and derivative code
JP4872079B2 (ja) * 2006-05-19 2012-02-08 国立大学法人長岡技術科学大学 文章更新量評価プログラム
NZ553484A (en) * 2007-02-28 2008-09-26 Optical Systems Corp Ltd Text management software
US8032546B2 (en) * 2008-02-15 2011-10-04 Microsoft Corp. Transformation-based framework for record matching
US9384175B2 (en) * 2008-02-19 2016-07-05 Adobe Systems Incorporated Determination of differences between electronic documents
US8694887B2 (en) * 2008-03-26 2014-04-08 Yahoo! Inc. Dynamic contextual shortcuts
US8606796B2 (en) * 2008-09-15 2013-12-10 Kilac, LLC Method and system for creating a data profile engine, tool creation engines and product interfaces for identifying and analyzing files and sections of files
US10739951B2 (en) * 2013-09-06 2020-08-11 Knowledge Initiatives LLC Interactive user interfaces for electronic textbook implementations
US10216715B2 (en) * 2015-08-03 2019-02-26 Blackboiler Llc Method and system for suggesting revisions to an electronic document
JP2017219954A (ja) * 2016-06-06 2017-12-14 岡田 泰成 ホームページの作成を支援する方法、プログラム、記録媒体、および装置
US11941344B2 (en) * 2016-09-29 2024-03-26 Dropbox, Inc. Document differences analysis and presentation
US10832000B2 (en) * 2016-11-14 2020-11-10 International Business Machines Corporation Identification of textual similarity with references
WO2018226888A1 (en) * 2017-06-06 2018-12-13 Diffeo, Inc. Knowledge operating system
WO2020005986A1 (en) * 2018-06-25 2020-01-02 Diffeo, Inc. Systems and method for investigating relationships among entities
WO2020060718A1 (en) * 2018-08-22 2020-03-26 Three10 Solutions, Inc. Intelligent search platforms
US11263223B2 (en) * 2018-10-23 2022-03-01 International Business Machines Corporation Using machine learning to determine electronic document similarity
US11163555B2 (en) * 2018-12-21 2021-11-02 Beijing Voyager Technology Co., Ltd. Tree delta encoding
JP7331384B2 (ja) * 2019-03-01 2023-08-23 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
US20200364270A1 (en) * 2019-05-14 2020-11-19 General Electric Company Feedback-based improvement of cosine similarity
FR3104282B1 (fr) * 2019-12-05 2024-01-19 Codexo Sauvegarde de documents en blocs
JP7456137B2 (ja) * 2019-12-05 2024-03-27 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP2021089667A (ja) * 2019-12-05 2021-06-10 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP2021089665A (ja) * 2019-12-05 2021-06-10 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP2021089668A (ja) * 2019-12-05 2021-06-10 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
US11687723B2 (en) * 2020-03-23 2023-06-27 International Business Machines Corporation Natural language processing with missing tokens in a corpus
US11594054B2 (en) * 2021-02-19 2023-02-28 Capital One Services, Llc Document lineage management system
US11580764B2 (en) * 2021-06-22 2023-02-14 Microsoft Technology Licensing, Llc. Self-supervised document-to-document similarity system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003281118A (ja) 2002-03-22 2003-10-03 Toshiba Corp 文書管理装置、文書編集装置、文書管理方法、文書編集方法及びプログラム
JP2014021508A (ja) 2012-07-12 2014-02-03 Fuji Xerox Co Ltd 文書関連付け装置及びプログラム
JP2015032293A (ja) 2013-08-07 2015-02-16 富士ゼロックス株式会社 文書管理装置及び文書管理プログラム
JP2018077670A (ja) 2016-11-09 2018-05-17 株式会社日立製作所 分析装置、分析方法、および分析プログラム
JP2020160521A (ja) 2019-03-25 2020-10-01 日本電気株式会社 文書管理装置、文書管理方法、及び、プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
宮部 泰成 外2名,異なる文書中の文間関係の特定,情報処理学会研究報告 2005-NL-168 自然言語処理,日本,社団法人情報処理学会,2005年07月22日,第2005巻 第73号,pp.35-42

Also Published As

Publication number Publication date
US20210174011A1 (en) 2021-06-10
CN112925880A (zh) 2021-06-08
JP2021089664A (ja) 2021-06-10

Similar Documents

Publication Publication Date Title
US9519706B2 (en) Multiple rule development support for text analytics
US20150254530A1 (en) Framework for data extraction by examples
US8527867B2 (en) Enabling users to edit very large XML data
US8601367B1 (en) Systems and methods for generating filing documents in a visual presentation context with XBRL barcode authentication
US20220245336A1 (en) Automatic template generation with inbuilt template logic interface
KR20150132858A (ko) 메타데이터 관리를 위한 시스템
JP7456137B2 (ja) 情報処理装置及びプログラム
US6915303B2 (en) Code generator system for digital libraries
US11651607B2 (en) Information processing apparatus and non-transitory computer readable medium storing program
US20210174013A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
US11030391B2 (en) Document creation support system
JP7456136B2 (ja) 情報処理装置及びプログラム
US8799256B2 (en) Incorporated web page content
US20050273721A1 (en) Data transformation system
US11790162B2 (en) Information processing apparatus and non-transitory computer readable medium storing program
US20110078552A1 (en) Transclusion Process
JP7340952B2 (ja) テンプレート検索システムおよびテンプレート検索方法
US8234563B1 (en) Editing of customised documents
US20060136438A1 (en) Process server array for processing documents and document components and a method related thereto
US11734506B2 (en) Information processing apparatus and non-transitory computer readable medium storing program
JP6281239B2 (ja) プログラム開発サポート装置および方法
WO2023223424A1 (ja) ドキュメント生成装置、プログラム及びドキュメント生成方法
JP7044967B2 (ja) 格納制御プログラム、格納制御装置及び格納制御方法
Leonard et al. Documenting Your Biml Solution
JP2007172645A (ja) データ更新装置、データ更新方法、及びデータ更新プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230915

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230926

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240226

R150 Certificate of patent or registration of utility model

Ref document number: 7456136

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150