JP2009048598A - 文書情報表示システム - Google Patents

文書情報表示システム Download PDF

Info

Publication number
JP2009048598A
JP2009048598A JP2007241557A JP2007241557A JP2009048598A JP 2009048598 A JP2009048598 A JP 2009048598A JP 2007241557 A JP2007241557 A JP 2007241557A JP 2007241557 A JP2007241557 A JP 2007241557A JP 2009048598 A JP2009048598 A JP 2009048598A
Authority
JP
Japan
Prior art keywords
change
information
similarity
item
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007241557A
Other languages
English (en)
Inventor
Daisuke Kamiyama
大輔 上山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2007241557A priority Critical patent/JP2009048598A/ja
Publication of JP2009048598A publication Critical patent/JP2009048598A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 本発明は、過去の変更情報を元に、ユーザーが指定した部分に対して関連性の強い部分の情報を表示することを目的とする。
【解決手段】 まず、過去の変更情報から各変更項目間の類似度を計算し保存する。次に、ユーザーに文書の一部分を指定させ、変更箇所がユーザー指定部分内に含まれている変更項目を検索する。そして、その変更項目に対し類似度の高い変更項目を検索し、類似度の高い変更項目に対応する変更箇所や変更情報等の情報を表示する。変更情報の類似度の高い変更は同じ目的によってなされた可能性が高く、結果として、過去に同じ目的で変更された別の部分の情報を表示することが出来る。
【選択図】図1

Description

本発明は、文書情報表示システムに関する。
従来、文書の変更管理ツールや、文書編集システム内に組み込まれた変更管理機能が使用されているが、変更記録を参照・確認するための機能に限定されており、過去のノウハウの蓄積情報としては活用されていない。
文書では、部分間に関連性があることが多いが、ある部分を参照しているときに、他のどの部分が関連しているかは簡単には分からないことが多い。このことは、文書の理解の妨げや、文書変更時の変更漏れ・誤りにつながる。
本発明は、過去の変更情報を元に、ユーザーが指定した部分に対して関連性の強い部分の情報を表示することを目的とするものである。
この課題を解決するための請求項1の発明は、図1のように構成されるシステムである。図1において、1は変更情報記憶手段であり、文書の過去の変更情報を、一回の変更ごとに一つの変更項目として保存する。
2は変更項目間類似度計算処理手段であり、変更情報記憶手段1から変更情報を読み出し、各変更項目間の変更情報の類似度を計算する。
3は変更項目間類似度情報記憶手段であり、変更項目間類似度計算処理手段2の結果を保存する。
4はユーザーインターフェイス手段であり、文書内の一部分をユーザーに指定させる。
5は変更項目検索処理手段であり、変更情報記憶手段1に保存された変更項目の中から、その変更箇所がユーザーインターフェイス手段4により指定された部分内に含まれているものを検索する。
6は類似度の高い変更項目を検索する処理手段であり、変更項目検索処理手段5により検索された変更項目について、変更項目間類似度情報記憶手段6から対応する類似度情報を読み出し、類似度の高い変更項目を検索する。
7は表示手段であり、処理手段6により検索された類似度の高い変更項目から得られる情報を表示する。
変更情報が類似しているということは、同じ目的のために変更されたという可能性が高い。よって、結果として、ユーザーが指定した部分に対し、過去に同じ目的で変更された可能性が高い変更の情報を表示していることになる。
そして、変更情報には変更箇所の情報が含まれるため、結果として、ユーザーが指定した部分に対し、過去に同じ目的で変更された可能性が高い別の変更箇所を表示することが出来る。過去に同じ目的で変更された可能性が高い箇所とは、すなわち関連性が強い箇所であるといえる。
請求項2の発明は、図1のユーザーインターフェイス手段4において複数の部分を一括して指定し、表示手段7において複数の部分に対する結果を一括して表示することにより、複数の部分の関連性の情報を一括して表示するシステムである。
本発明により、ユーザーが指定した部分に対して、関連性の強い部分の情報を表示することができ、文書のより良い理解や、文書変更時の変更漏れ・誤りの削減につながる。
また、過去のノウハウ情報を活かすこととなるため、品質の良い文書を効率的に作成することができる。特に、ソフトウエアのソースプログラムなど、部分間での論理矛盾が許されない文書において、大きな効果が期待できる。
さらに、従来の変更管理ツールはそのまま使用できるため、低コストでの導入が可能である。
以下、本発明の実施の形態を図2〜図5に基づき説明する。図2は本発明の実施の形態の構成図、図3は変更情報の例、図4は変更項目間類似度情報の例、図5は画面のイメージおよび処理の流れの例を示す図である。図2において、11は変更管理レポジトリ、2は変更項目間類似度計算処理手段、3は変更項目間類似度情報記憶手段、41は文書編集ンフトの選択インターフェイス、5は変更項目検索処理手段、6は類似度の高い変更項目の検索処理手段、7は表示手段である。
複数の文書の過去の変更情報が、一回の変更に対し一つの変更項目として、変更管理レポジトリ11に記憶されている。変更情報は、変更箇所情報(ファイル名・行番号等)を含み、変更内容の差分・変更日時・変更者名・コメントのうち1つ以上の情報を含む。変更が発生するたびに、従来の変更管理ツール、または、文書編集ソフト内に組み込まれた変更管理機能等により、変更項目が追加される。変更情報の例を図3に示す。
変更項目間類似度計算処理手段2は、変更管理レポジトリ11から、全ての変更項目の変更情報を読み出す。変更情報の読み出しは、変更管理ツールの参照機能を用いるか、変更管理レポジトリのデータを直接読み取ることにより行う。なお、変更管理ツールの参照機能を用いる場合は、変更管理ツールが提供するコマンドやスクリプトなどを利用して自動的に、全ての変更情報を含むレポートファイルを取得し、取得したレポートファイルから変更項目毎の変更情報を抽出する。
そして、変更項目間類似度計算処理手段2は、各変更項目間の類似度を計算し、変更項目間類似度情報記憶手段3に保存する。例えば、変更内容の差分の類似度・変更日時の近さ・変更者名の同一性・コメントの類似度をそれぞれ数値で評価し、それら4つの数値を重み付けして加算したものを、変更項目間の類似度とする。変更項目間類似度情報の例を図4に示す。
変更項目数が多く、全ての変更項目間の類似度を計算することが処理時間的に困難な場合は、日時の範囲・変更者名・コメントの形式等の変更情報がユーザーにより指定された条件に一致する変更項目のみを読み出し、それらの組み合わせのみを計算する。
変更内容の差分やコメントの類似度の数値としては、全体の単語数に対する同じ単語の割合、全体の文字数に対する同じ文字数の割合などを用いる。全く一致しないテキストは0、全く同じテキストは100とする。例えば、“Track#0123”と“Track#0999”は10文字中7文字一致なので70とする。両者の文字数が違う場合は、両者の割合の平均などを使用する。文字列の比較アルゴリズムは、文書比較ツールなどで使用されている、既存の文書比較アルゴリズムを使用する。
ユーザーによっては、コメントに記述のルールが存在することが考えられる。そのため、そのルールを考慮して、同じ目的の変更の場合に類似度が高くなるような計算方法を、ユーザーが選択できるようにしたほうが良い。例えば、同じ目的の変更について同じ管理番号をコメントに記述するルールの場合、番号が同じ場合のみ100、それ以外は0とするという方法をユーザーが選択できるようにする。
変更日時の近さの数値は、日時が近いほど値が高くなるような計算式にする。ただし、特定の閾値以上日時が離れている場合は0となるようにする。例えば、2つの変更項目の変更日時の分数の差を求めtとし、(1440−t)の二乗を類似度とする。ただし、1440<tの場合は、0とする。1440は1日の分数である。閾値以上日時が離れている場合に0とするのは、日時がある一定以上離れると、日時の差分と、同じ目的の変更である確率とは相関がなくなると考えられるからである。ユーザーの文書変更業務のスタイルによって妥当な閾値は異なると考えられるので、閾値はユーザーが変更可能とするほうが良い。
変更者名の同一性の数値は、変更者名が同じ場合のみ0より大きい数値になるようにする。たとえば、変更者名が同じなら100、それ以外は0とする。
重み付けのパラメータ値としては、最も簡単な実施例としては、4つの数値それぞれについて最大が100最小が0となるような値をとる。文書のタイプや、ユーザーの文書変更業務のスタイルによって、妥当な重み付けのパラメータ値は異なると考えられるため、ユーザーによって変更可能とするのが良い。また、文書のタイプ毎にデフォルトのパラメータ値を持つほうが良い。
なお、変更管理レポジトリ11に、新たな変更項目が追加されたときは、その新規変更項目と、従来の変更項目との間の類似度のみを計算し、変更項目間類似度情報記憶手段3に追加すれば良い。全ての変更項目間の類似度計算をやり直す必要はない。
次に、文書編集ソフトの選択インターフェイス41により、変更管理レポジトリ11が対象とする文書の中から特定の文書の一部分をユーザーに指定させる。例えば、文書編集ソフトにより文書ファイルを開き、その文書の一部分をマウス操作やキーボード操作によって選択した後、ボタンをクリックするなどの操作を行わせる。あるいは、その部分を表す名称(章の名称やC言語の関数名等)をキーボードから入力したり、一覧からマウスクリックにより選択したりさせる。
なお、選択インターフェイス41を備えるシステムは、文書編集ソフトでなくても、文書内の一部分を指定することができるシステムであれば良く、例えば文書の参照専用のシステムでも良い。
変更項目検索処理手段5は、変更管理レポジトリ11から各変更項目の変更箇所情報を参照し、その変更箇所が選択インターフェイス41によって指定された部分内に含まれている変更項目を検索する。
検索処理手段6は、変更項目検索処理手段5によって検索された変更項目それぞれについて、変更項目間類似度情報記憶手段3を参照し、他の全ての変更項目との間の類似度を取得する。例えば、図4の例において、変更項目検索処理手段5によって変更項目4が検索された場合、項目4の行を参照することにより、項目1、項目2、項目3、項目5、・・・との間の類似度が得られる。
そして、検索処理手段6は、得られた類似度を比較し、類似度の高い変更項目を1つまたは複数選択する。この選択の方法としては、あらかじめ設定された閾値より値の大きいものを選択する、最も値の大きいものを一つ選択する、最も値の大きいものから順にいくつかを選択する、などの方法が考えられ、ユーザーがこれらの中から方法を選択できるのが良い。
なお、類似度の高い変更項目の選択方法として、プログラム言語であれば変更箇所のモジュール・関数・メソッド等、構造化文書や一般的な文書であれば変更箇所の章・節やブロックごとに、変更項目をグループ分けし、グループごとに類似度の和を求め、類似度の和が最も大きいグループを見つけ、そのグループ内で最も類似度が大きい変更項目を代表として選択する、という方法も考えられる。この場合、表示手段7では、同じグループの変更項目の変更情報を同時に参照できるほうが良い。
最後に、検索処理手段6により選択された変更項目から得られる情報を、表示手段7により表示する。変更項目から得られる情報としては、変更箇所情報、文書の該当する部分、プログラム言語であれば変更箇所のモジュール名・関数名・メソッド名・変数名・クラス名等、構造化文書や一般的な文書であれば変更箇所の章・節やブロック等の名称、差分・変更日時・変更者名・コメント、関連度等がある。これらのうち全てまたはいくつかを表示する。あるいは、変更箇所のモジュール名等を関連度の高い順に表示し、それをユーザーがクリックして選択することにより、他の情報を表示する。
関連度は、変更項目間の類似度をそのまま数値で表示するほか、棒グラフや星マークの数に変換して表示する方法が考えられ、ユーザーが表示方法を選択できるのが良い。
なお、変更項目検索処理手段5や検索処理手段6での処理時間を低減するため、プログラム言語であればモジュール・関数・メソッド、構造化文書や一般的な文書であれば章・節やブロックといった、一般的な文書の部分分けのルールに従って特定された部分について、それぞれの部分間の関連度をあらかじめ計算して保存しておき、ユーザーインターフェイス手段4で選択された部分について、前記部分間の関連度情報を参照して、関連度の高い部分の情報を表示するという方法も考えられる。部分間の関連度は、それぞれの部分について、変更箇所がその部分に含まれている変更項目X1,X2,・・・,Xmを検索し、変更項目Xk(k=1,2,・・・,m)全てについて、他の変更項目Y1,Y2,・・・,Ynとの類似度Sk1,Sk2,・・・,Sknを取得し、その類似度Sk1,Sk2,・・・,Sknをそれぞれ変更項目Y1,Y2,・・・,Ynの変更箇所が属する部分毎に加算することによって得られる。
画面のイメージおよび処理の流れの例を図5に示す。まず、ユーザーによって、ファイルAの2行目を含む部分が指定される。次に、変更管理レポジトリ11から、変更箇所がユーザー指定部分内に含まれている変更項目を検索し、変更項目4が発見される。そして、変更項目間類似度情報記憶手段3を参照して、変更項目4に対し類似度の高い変更項目を検索し、変更項目3が発見される。最後に、変更項目3から得られる情報をユーザーに表示することにより、ユーザーは関連する部分の情報を知ることができる。
また、選択インターフェイス41においてユーザーに複数の部分を一括して指定させ、表示手段7において複数の部分に対する結果を一括して表示することにより、一覧形式のレポートを作成することができる。たとえば、C言語ファイルについて、ファイルXの全モジュールといった指定をさせ、ファイルXのモジュールが関連しているモジュールを一覧で表示する。
本発明の原理構成図である。 本発明の実施の形態の構成図である。 変更情報の例を示す図である。 変更項目間類似度情報の例を示す図である。 画面のイメージおよび処理の流れの例を示す図である。
符号の説明
1 変更情報記憶手段
2 変更項目間類似度計算処理手段
3 変更項目間類似度情報記憶手段
4 文書の一部分を指定するインターフェイス手段
5 変更項目検索処理手段
6 類似度の高い変更項目の検索処理手段
7 表示手段
11 変更管理レポジトリ
41 文書編集ソフトの選択インターフェイス

Claims (2)

  1. 文書の過去の変更情報を、一回の変更ごとに一つの変更項目として保存した、変更情報記憶手段と、
    前記変更情報記憶手段から変更情報を読み出し、各変更項目間の変更情報の類似度を計算する、変更項目間類似度計算処理手段と、
    前記変更項目間類似度計算処理手段の結果を保存する、変更項目間類似度情報記憶手段と、
    文書内の一部分をユーザーに指定させるユーザーインターフェイス手段と、
    前記変更情報記憶手段に保存された変更項目の中から、その変更箇所が前記ユーザーインターフェイス手段により指定された部分内に含まれているものを検索する、変更項目検索処理手段と、
    前記変更項目検索処理手段により検索された変更項目について、前記変更項目間類似度情報記憶手段から対応する類似度情報を読み出し、類似度の高い変更項目を検索する処理手段と、
    類似度の高い変更項目から得られる情報を表示する表示手段とを備えることを特徴とする、
    文書情報表示システム。
  2. 前記ユーザーインターフェイス手段は、複数の部分を一括して指定し、
    前記表示手段は、複数の部分に対する結果を一括して表示することを特徴とする、
    請求項1記載の文書情報表示システム。
JP2007241557A 2007-08-20 2007-08-20 文書情報表示システム Pending JP2009048598A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007241557A JP2009048598A (ja) 2007-08-20 2007-08-20 文書情報表示システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007241557A JP2009048598A (ja) 2007-08-20 2007-08-20 文書情報表示システム

Publications (1)

Publication Number Publication Date
JP2009048598A true JP2009048598A (ja) 2009-03-05

Family

ID=40500719

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007241557A Pending JP2009048598A (ja) 2007-08-20 2007-08-20 文書情報表示システム

Country Status (1)

Country Link
JP (1) JP2009048598A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014085786A (ja) * 2012-10-23 2014-05-12 Hitachi Ltd 設備データ変更作業支援装置、設備データ変更作業支援方法およびプログラム
WO2014083878A1 (ja) * 2012-11-27 2014-06-05 富士ゼロックス株式会社 情報処理装置及びプログラム
JP2015094965A (ja) * 2013-11-08 2015-05-18 富士ゼロックス株式会社 文書管理装置及び文書管理プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014085786A (ja) * 2012-10-23 2014-05-12 Hitachi Ltd 設備データ変更作業支援装置、設備データ変更作業支援方法およびプログラム
WO2014083878A1 (ja) * 2012-11-27 2014-06-05 富士ゼロックス株式会社 情報処理装置及びプログラム
JP2014106729A (ja) * 2012-11-27 2014-06-09 Fuji Xerox Co Ltd 情報処理装置及びプログラム
US9870632B2 (en) 2012-11-27 2018-01-16 Fuji Xerox Co., Ltd. Information processing apparatus and non-transitory computer readable medium
JP2015094965A (ja) * 2013-11-08 2015-05-18 富士ゼロックス株式会社 文書管理装置及び文書管理プログラム

Similar Documents

Publication Publication Date Title
JP5924339B2 (ja) 数値範囲検索装置、数値範囲検索方法、および数値範囲検索プログラム
JP4473893B2 (ja) 作業項目抽出装置、作業項目抽出方法、および、作業項目抽出プログラム
US20080235210A1 (en) Searching related documents
JP2007304796A (ja) データベース解析システム及びデータベース解析方法及びプログラム
US8954838B2 (en) Presenting data in a tabular format
JP2009048598A (ja) 文書情報表示システム
JP5780036B2 (ja) 抽出プログラム、抽出方法及び抽出装置
JP6722565B2 (ja) 類似文書抽出装置、類似文書抽出方法及び類似文書抽出プログラム
CN108304291B (zh) 测试输入信息检索装置和方法
Paramonov et al. Tacle: Learning constraints in tabular data
CN109614455B (zh) 一种基于深度学习的地理信息的自动标注方法及装置
CN116450664A (zh) 数据处理方法、装置、设备和存储介质
JP2006155344A (ja) データ分析装置、データ分析プログラム及びデータ分析方法
EP1555609A1 (en) Data processing method and data processing program
JP6753190B2 (ja) 文書検索装置及びプログラム
JP4969536B2 (ja) 設計支援装置、及び、その方法並びにその記憶媒体
JP4393482B2 (ja) 情報共有システム及びプログラム
JP2016126532A (ja) 算出プログラム、情報処理装置、および算出方法
JP2007140889A (ja) 輸出管理該非判定シート抽出システム
US10515051B2 (en) Data analysis supporting apparatus
US9990420B2 (en) Method of searching and generating a relevant search string
JP7457392B2 (ja) 文書処理方法、文書処理プログラム及び情報処理装置
WO2021210100A1 (ja) パターン抽出装置、パターン抽出方法及びプログラム
JP2009059332A (ja) 文書情報表示システム
JP4612469B2 (ja) 漏洩源業務調査システム及び漏洩源業務調査方法