JP2010262502A - 文書作成支援プログラム、文書作成支援方法及び文書作成支援装置 - Google Patents

文書作成支援プログラム、文書作成支援方法及び文書作成支援装置 Download PDF

Info

Publication number
JP2010262502A
JP2010262502A JP2009113330A JP2009113330A JP2010262502A JP 2010262502 A JP2010262502 A JP 2010262502A JP 2009113330 A JP2009113330 A JP 2009113330A JP 2009113330 A JP2009113330 A JP 2009113330A JP 2010262502 A JP2010262502 A JP 2010262502A
Authority
JP
Japan
Prior art keywords
component
document
correction
overlap
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2009113330A
Other languages
English (en)
Inventor
Naomi Yoshizawa
直美 吉沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2009113330A priority Critical patent/JP2010262502A/ja
Publication of JP2010262502A publication Critical patent/JP2010262502A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

【課題】過不足なく文書を作成するための支援を行う。
【解決手段】部品暫定作成手段12は、入力された文書20を暫定的に部品化し、登録済部品と照合して文書20に含まれる部品を特定する。重なり度算出手段13は、文書修正履歴30に基づき、修正の開始から終了までの時間における各部品の修正の傾向を修正曲線として得る。そして、部品間の修正曲線の重なり量に応じた重なり度を算出する。結合部品選別手段14は、結合部品の結合ルールに基づいて重なり度を評価し、基準を満たす部品の組み合わせを結合部品として選別する。
【選択図】図1

Description

文書の一部を部品として抽出して管理し、文書作成時の支援を行うコンピュータを機能させる文書作成支援プログラム、その文書作成支援方法及び文書作成支援装置に関する。
従来、コンピュータによって作成された文書は記憶手段に蓄積されており、新たな文書を作成する際には、蓄積された文書が再利用されていた。しかし、再利用は個人個人の判断で行われていたため、文書作成の効率化といった点で問題があった。
マニュアルなど類似形式の文書が大量に作成される文書は、過去に作成された文書の再利用を図ることにより、文書作成者の負担の軽減が可能となる。しかし、メーカのマニュアルであれば、ハードまたはソフトウェアの製品数、また、製品によっては製品数に納入顧客数を掛け合わせた数といった大量の文書が作成される。これらの文書は、非常に類似しているが、全く同じものはなく、違いは確実に存在する。このため、個人個人の判断で文書を再利用するのでは、この違いを見落としなく変更することは容易ではない。また、見直し作業では変更箇所がわからず、全体を見直さなければならなかった。
そこで、過去に作成された文書を部品化して共有し、部品化された文書を再利用することによって文書作成時の負荷の軽減及び作成された文書の品質保持を図る手法が試みられている。
しかし、単に文書を部品化しただけでは、どれを再利用してよいのか判断することは難しい。このため、文書とともに文書作成時の操作履歴を記録し、その操作履歴を文書の部品間の関係などに基づいて階層化し、階層化された操作履歴を作成者に参照させることで、文書作成時における作業効率を向上させる文書作成支援装置が提案されている(例えば、特許文献1参照)。
特開平10−222506号公報
しかし、従来の文書作成支援では、過不足なく文書を作成することが難しく、かつその見直し作業が容易ではないという問題点がある。
技術文書には、マニュアル、運用手順書、ミドルウェアの稼働・終了処理スクリプトなど、主機能の前後に記載される起動処理と終了処理といったセットで利用されなければならない部品が存在するものが多い。セットでの利用が実現されない場合には整合性が保てなくなり、問題を引き起こす可能性がある。
従来の文書作成支援には、部品の位置的連続性や、同時に使用された頻度などに基づいて部品間の相関関係を検出する手法がある。これは、位置的に連続する部品や、同時使用された部品は、関連する部品である可能性が高いという予測に基づく手法である。しかし、位置的に連続していても関連する部品とは限らない。また、組み合わせが一対多の場合には、同時使用の頻度から相関関係を検出することは難しい。一方、操作履歴に基づく操作の連続性などから、関連する部品を検出する手法もある。しかし、単に操作が連続しているから関連しているとは限らない。例えば、上記の起動処理と終了処理のように、位置的にも連続せず、操作も連続しないような部分の関連性を検出することはできなかった。
このように、従来の文書作成支援では、必ずセットで使用しなければならない部品を確実に検出することが難しく、セットでの利用が見落とされる場合があった。また、文書の見直し作業においても、セット部品の利用が見落とされていたことを検出することは容易ではない。このため、文書の部品を利用して過不足なく文書を作成することが難しく、部品の再利用が促進されない要因となっていた。
このような点に鑑み、過不足なく文書を作成するための支援を行う文書作成支援プログラム、文書作成支援方法及び文書作成支援装置を提供することを目的とする。
上記課題を解決するために、文書作成支援プログラムが提供される。文書作成支援プログラムは、文書の一部を部品として抽出して管理し、文書作成時の支援を行うコンピュータを、部品暫定作成手段、重なり度算出手段及び結合部品選別手段として動作させる。部品暫定作成手段は、文書及び修正履歴情報データベースから文書及びこの文書の修正に関する文書修正履歴を取得する。取得した文書を暫定的に分割した暫定部品を特徴付ける部品要素を抽出し、記憶手段に格納される登録部品情報に登録済みの登録済部品から抽出した部品要素と、暫定部品を特徴付ける部品要素とを照合する。所定の部品要素が一致する登録済部品が検出されたときはこの登録済部品、検出されないときは新規部品として、文書に含まれる部品を特定する。重なり度算出手段は、文書に含まれる部品ごとに、文書修正履歴に基づいて一定時間間隔ごとの部品に対する修正量を時間軸に沿って並べたヒストグラムを作成する。このヒストグラムをスムージング処理し、部品ごとの修正傾向を表す修正曲線を算出する。また、修正曲線が表す修正の傾向が重なる重なり量に応じた部品間の重なり度を算出する。結合部品選別手段は、関係の強い部品群を結合する結合ルールを用いて、重なり度及び部品要素を評価する。そして、結合ルールに基づいて結合部品と評価される部品群を選別し、結合部品として登録部品情報に登録する。
このような文書作成支援プログラムを実行するコンピュータは、文書作成支援装置として機能し、以下の処理を行う。文書及び修正履歴情報データベースから文書と文書修正履歴が取得されると、この文書を暫定的に分割した暫定部品を特徴付ける部品要素と、登録部品情報に登録済みの登録済部品の部品要素と、が照合される。文書に含まれる部品は、所定の部品要素が一致する登録済部品があれば登録済部品、なければ新規部品と特定される。続いて、文書とともに取得した文書修正履歴に基づき、この文書の部品ごとの修正傾向を表す修正曲線が算出される。修正曲線は、各部品の一定時間間隔ごとの修正量を時間軸上に並べたヒストグラムをスムージング処理して算出される。修正曲線の重なり量が算出され、重なり量に応じた部品間の重なり度が算出される。重なり度が高いほど、結合部品である可能性が高くなる。そして、部品間の重なり度及び部品要素が結合ルールを用いて評価され、結合部品と評価される部品群が選別される。
また、上記課題を解決するために、上記の文書作成支援プログラムによって実現される処理と同様の処理手順をコンピュータに実行させる文書作成支援方法と、文書作成支援装置が提供される。
開示の文書作成支援プログラム、文書作成支援方法及び文書作成支援装置によれば、文書修正履歴に基づいて文書部品間の関係の強さを推定し、関係の強い部品群を結合部品として特定する。これにより、部品提供時に、部品情報に基づき、セットで使用しなければならない部品群を結合部品としてまとめて提供することができる。この結果、過不足なく文書を作成するための支援が可能となる。
発明の概要を示した図である。 文書の修正箇所とその修正量を時間軸上に表したグラフである。 文書1の文書修正履歴を時系列で並べた一例を示した図である。 文書1の各部品の修正量ヒストグラムと修正曲線の一例を示した図である。 文書1の修正曲線の重なり領域を示した図である。 文書作成システムの構成例を示した図である。 文書作成支援装置のハードウェア構成例を示すブロック図である。 対象文書と対象文書から作成される暫定部品の一例を示した図である。 部品要素リストの一例を示した図である。 修正履歴と修正履歴情報から抽出した修正履歴情報の一例を示した図である。 修正量集計テーブルの一例を示した図である。 修正曲線(スムーズ値)テーブルの一例を示した図である。 足きり処理後の修正曲線を示した図である。 重なり度テーブルを示した図である。 部品情報の一例を示した図である。 結合ルールの一例を示した図である。 登録部品情報の一例を示した図である。 キーワード対応表の一例を示した図である。 部品登録処理の手順を示したフローチャートである。 部品暫定作成処理の手順を示したフローチャートである。 部品度算出処理の手順を示したフローチャートである。 結合部品選別処理の手順を示したフローチャートである。
以下、実施の形態を、図面を参照して説明する。まず、発明の概要について説明し、その後、具体的な内容を説明する。
図1は、発明の概要を示した図である。
文書作成支援装置10は、記憶手段11、部品暫定作成手段12、重なり度算出手段13、結合部品選別手段14及び部品管理手段15を有し、文書20及び文書修正履歴30に基づいて、文書を部品化し、登録部品情報に登録して管理する。各処理手段は、コンピュータが文書作成支援プログラムを実行することによって、その処理機能が実現される。なお、文書20及び文書修正履歴30は、文書編集などの文書作成処理を行う文書作成装置によって作成され、文書作成装置の文書及び修正履歴データベースに格納される。文書20は、文書及び修正履歴データベースに格納された文書であり、文書修正履歴30はこの文書20に対して行われた編集作業に伴う修正を記録した履歴情報である。文書作成支援装置10は、文書及び修正履歴データベースから直接読み出して、もしくは、文書作成装置を介して文書20及び文書修正履歴30を取得する。ここでは、予め文書20及び文書修正履歴30を取得し、取得した文書20は文書情報DB11b、文書修正履歴30は修正履歴情報DB11cに保存し、管理しているとする。
記憶手段11は、各種情報を記憶する記憶領域を有し、部品情報データベース(以下、DBとする)11a、文書情報DB11b及び修正履歴情報DB11cとして機能する。
部品情報DB11aには、部品要素を含む登録済部品に関する登録部品情報が、部品を識別する部品識別子に対応付けて格納される。文書情報DB11bには、取得された文書20の少なくとも一部が管理情報とともに格納される。また、部品ごとに分割され、部品の部品識別子と関連付けて管理されるとしてもよい。修正履歴情報DB11cには、取得された文書20に関する文書修正履歴30の少なくとも一部が管理情報とともに格納される。なお、文書情報DB11bと、修正履歴情報DB11cは、1つのデータベースとして構成されていてもよい。
部品暫定作成手段12は、文書20を文書情報DB11bから読み出し、章や節といった単位で暫定的に分割して暫定部品を設定する。また、この暫定部品を特徴付ける部品要素を抽出し、この暫定部品を特徴付ける部品要素と、部品情報DB11aの登録部品情報に登録済みの登録済部品の部品要素と、を照合する。互いの部品要素が予め定義された同一部品と見なす基準を満たして一致すれば、暫定部品にこの登録済部品の部品識別子を付与する。一致しなければ、新たな部品識別子を付与し、新規部品とする。こうして、文書20に含まれる部品が特定される。
重なり度算出手段13は、部品暫定作成手段12で特定された部品ごとに、文書20に対応する文書修正履歴30を読み出して解析し、部品の修正傾向を表す修正曲線を算出する。まず、文書修正履歴30を解析し、一定時間間隔ごとの各部品の修正量を集計し、集計された修正量を時間軸に沿って並べ、修正量ヒストグラムを生成する。そして、ヒストグラムをスムージング処理し、修正が開始されてから終了するまでの期間における各部品の修正曲線を得る。得られた修正曲線は、各部品の修正傾向を示す。さらに、各部品の修正曲線が他の部品の修正曲線と重なる重なり量に基づいて、部品間の重なり度を算出する。例えば、修正曲線が重なって形成される重なり領域の面積で重なり量を算出し、重なり量が修正量全体に占める割合に応じて重なり度を算出する。重なり度は、部品間の関係の強さを表す指標であり、重なり度が高いほど部品間の関係が強く、重なり度が低いほど部品間の関係が弱くなる。さらに、重なり度に基づいて部品間の関係の強さを測る別の指標を算出するとしてもよい。そして、重なり度、もしくは重なり度に基づく指標は、部品要素とともに、部品に付与された部品識別子に対応付けて部品要素リストに暫定的に登録され、記憶手段11に格納する。
結合部品選別手段14は、関係の強い部品群を結合する結合ルールを用いて、部品要素リストに登録される重なり度もしくは重なり度に基づく指標、または必要に応じて部品要素を評価する。そして、結合ルールに基づいて結合部品と評価される部品群を選別する。例えば、「部品間の重なり度が閾値より高い場合には、結合部品とする」という結合ルールがあれば、結合ルールに従って部品間の重なり度を評価し、重なり度が閾値以上の部品群を結合部品に選別する。選別された結合部品は、新たな部品識別子を付与し、新規部品として登録部品情報に登録する。結合部品は、部品間の関係が強く、再利用時には、セットでの利用が望ましい。
部品管理手段15は、部品情報DB11aに格納される登録部品情報に基づいて登録された部品を管理する。そして、部品の再利用のための部品入手依頼を受け付けると、部品情報DB11aに格納される登録部品情報を参照し、依頼を受けた部品が結合部品に属するかどうかを判定する。結合部品に属すると判定されたときは、依頼を受けた部品が属する結合部品を依頼元に提供する。属する結合部品がないと判定されたときは、単独で使用される部品であると判断し、この部品のみを依頼元に提供する。
なお、ここでの文書は、一連の動作を説明した文書とする。操作説明書などの一般的な文書ばかりでなく、一連の処理手順を記述したスクリプトなども含まれる。
次に、上記の構成の文書作成支援装置10の動作及び文書作成支援方法について説明する。まず、文書修正者による関連部分の修正タイミングの傾向について説明する。
図2は、文書の修正箇所とその修正量を時間軸上に表したグラフである。水平方向は、時間軸、垂直方向は修正量を示す。
図2の例では、ある文書を4つのセクション(部品)に分け、それぞれにs1,s2,s3,s4という識別番号を付与している。各セクションが暫定部品に相当する。修正されたセクションの識別番号は、修正量を表すヒストグラムの上に示されている。例えば図2では、文書がオープンされてから最初にセクションs3が修正され、続いてセクションs1、セクションs2と修正されていることがわかる。
文書の修正履歴に記録される修正場所、修正順序及び修正量と、セクション間の関連の強さとの相関性について、次のような傾向があることが発明者によって見出されている。
第1に、「修正量」について、修正量の多少は、部品間の関連性の強さと相関が高いことが見出されている。すなわち、ほぼ同時期に行われている部品間の修正量が同様の傾向を示し、特に、その修正量がともに多いとき、その部品間の関連性は強い。例えば、ある部品について修正するとき、関連する部品でも同様な修正が行われることが多い。ある部品についての修正量が多くなるとき、関連する部品でも同様に修正量が多くなる可能性が高い。
第2に、「修正順序」について、修正場所の反復遷移は関係の強さを示すことが見出されている。すなわち、ほぼ同時期に反復して部品の修正が行われているとき、その部品間の関連性は強い。ある部品について修正を行うとき、関連する記述のある部品の修正を続けて行う場合が多い。そして、関連する部分の修正が終了したとき、元の部品の修正に戻る。このため、修正場所の反復遷移が多くなる。
第3に、「修正間隔」について、タイミングの遠近は、部品間の関連性の強さと相関が高いことが見出されている。すなわち、修正タイミングが近い方が、その部品間の関連性は強い。例えば、ある部品の修正後、次に修正が行われる部品は、修正間隔が近い場合関連する部品である場合が多い。しかし、修正間隔が遠い場合、例えば、ある部品の修正後に休憩し、他の部品の修正を再開するような場合は、関連部品でない可能性がある。
第4に、「修正時期」について、修正の開始から一定期間と、終了前の一定期間とは、修正の傾向を示さないケースが多いことが見出されている。すなわち、修正の開始から一定の期間は、修正操作が安定せず、まだ修正傾向が表れていない場合が多い。終了前の一定期間は、見直し作業などによって修正が行われている可能性が高く、部品の修正傾向ではなく作成者の質などによる傾向が表れていると考えられる。
このような修正傾向を捉えるため、文書オープン時から文書クローズ時までの期間について、各部品(図2ではセクション)の一定間隔ごとの修正量が集計され、修正量を時間軸上に並べたヒストグラムが生成される。さらに、上記のような部品間の関連性を検出するため、ヒストグラムがスムージング処理され、修正曲線が算出される。修正履歴には、単一時刻における単一部品の修正が記録される。スムージング処理を行うことにより、部品修正の同時性が判断可能となる。すなわち、部品間の修正曲線が重なる場合には、ほぼ同時期に修正が行われていると見なすことができる。
図2の例では、セクションs1について、修正曲線31a,31b,31c,31d,31eが得られる。図2では鎖線で示している。セクションs2について、修正曲線32a,32b,32c,32d,32eが得られる。図2では、一点鎖線で示している。そして、セクションs4について、修正曲線34aが得られる。図2では、二点鎖線で示している。なお、文書オープン時から一定の期間35a、文書クローズ時より前の一定期間35bの間の修正量は、修正の傾向を表さないことがあることから、修正曲線の算出には含めない。文書クローズ時のセクションs1の修正量を反映すると、セクションs1に関する修正曲線は、31e−1になるが、ここではクローズ時より前の一定期間35bの修正量を含めないことから、修正曲線31eが得られる。
こうして得られた各セクションの修正曲線の重なる重なり量を、例えば、重なり領域の面積を算出して求める。ここでは、セクションs1の修正曲線31aとセクションs2の修正曲線32aとの重なり領域41、セクションs1の修正曲線31bとセクションs2の修正曲線32bとの重なり領域42、セクションs4の修正曲線34aとセクションs2の修正曲線32cとの重なり領域43、セクションs1の修正曲線31cとセクションs2の修正曲線32dとの重なり領域44、及びセクションs1の修正曲線31dとセクションs2の修正曲線32eとの重なり領域45の面積が算出される。
ここで、算出された重なり領域41,42,43,44,45から、上記の文書の修正量及び修正タイミングと、セクション間の関連の強さとの相関性に基づき、セクション間の関連性の強さを判断することができることを説明する。
まず、「修正量」については、修正量の絶対値の大小は、修正曲線の重なり量と相関する。例えば、ともに修正量の多いセクションs1の修正曲線31aとセクションs2の修正曲線32aとの重なり領域41は、所定の領域が形成されている。しかし、同様の間隔で修正が行われているが、ともに修正量の少ないセクションs1の修正曲線31bとセクションs2の修正曲線32bとの重なり領域42はない。このように、修正量の絶対値の大小に起因する重なり量は、修正曲線の重なり領域に対応する。
「修正順序」については、部品間の反復の多少は、修正曲線の重なり量と相関する。スムージング処理された修正曲線は、短い期間に同じセクションが修正されると、下降する間もなく上昇する。例えば、セクションs4とセクションs2の修正は反復して行われており、セクションs4の修正曲線34aとセクションs2の修正曲線32cとの重なり領域43の重なり量は大きくなる。
「修正間隔」については、修正間隔の遠近は、修正曲線の重なり量と相関する。例えば、修正量が同程度のセクションs1の修正曲線31cとセクションs2の修正曲線32dの重なり領域44と、セクションs1の修正曲線31dとセクションs2の修正曲線32eの重なり領域45とを比べる。修正間隔の近いセクションs1の修正曲線31dとセクションs2の修正曲線32eの重なり領域45は所定の領域が形成されている。しかし、修正間隔の遠いセクションs1の修正曲線31cとセクションs2の修正曲線32dの重なり領域44はない。このように、修正間隔の遠近は、修正曲線の重なり量と相関する。「修正時期」については、時間軸上の一定の時間範囲を修正曲線の算出に用いないことによって、修正曲線の重なり量に反映することができる。
以上より、修正曲線の重なり量を算出し、これを評価することによって、「修正量」、「修正順序」、「修正間隔」、「修正時期」という部品間の関係の強さに相関するパラメータの値を総合評価することができる。したがって、上記の文書のセクション間の関連の強さを評価することができる。
図1に戻って文書作成支援装置10の各処理部の動作について説明する。文書20とその文書修正履歴30は、予め文書作成支援装置10に入力され、それぞれ文書情報DB11bと、修正履歴情報DB11cに格納されている。利用者からの指示などによって、処理が開始される。
部品暫定作成手段12は、文書情報DB11bから文書20を読み出し、文書20を分割して暫定部品を生成する。そして、暫定部品を特徴付ける部品要素を抽出し、登録部品情報に登録済みの登録済部品の部品要素と照合する。照合により、暫定部品が登録済部品と同じであると判定されれば、暫定部品に登録済部品の部品識別子が付与される。同じと認められる登録済部品がないときは、暫定部品に新たな部品識別子が付与される。こうして、文書20に含まれる部品が特定される。続いて重なり度算出手段13は、文書20に対応する文書修正履歴30を修正履歴情報DB11cから読み出して解析し、特定された部品の一定時間間隔ごとの修正量を算出して修正量ヒストグラムを生成する。このヒストグラムをスムージング処理して、修正曲線を得る。具体例を用いて説明する。
図3は、文書1の文書修正履歴を時系列で並べた一例を示した図である。図3は、文書1の修正履歴であり、文書1の修正を開始した修正時刻T0から、実行された修正に関する修正時刻と修正場所及び修正量の記録が時系列にソートされている。
例えば、修正時刻T1では、部品Aについて、文字を挿入する修正が行われていることが記録されている。また、修正時刻T1で行われた修正の修正場所は「オフセットP1文字後」であり、修正量は、「サイズL1」であることも記録されている。修正時刻T2から修正時刻Tdにおいて実行された修正についても同様の内容が記録されている。文書1の修正が開始されてから一定時間間隔ごとに、その時間間隔内に発生した各部品の修正量をプロットし、修正量ヒストグラムを生成する。
図4は、文書1の各部品の修正量ヒストグラムと修正曲線の一例を示した図である。図4の修正量ヒストグラムは、図3に示した修正履歴に基づき、上記の手順によって作成される。縦軸は経過時間、横軸は文書1に対する修正量を表す。
ここで、ヒストグラムの修正時刻T1,T2,T4,T5,T8,T9,・・・においてプロットされている修正量は、部品Aに関する修正を表す。修正時刻T1,T2,T4,T5,T8,T9,・・・における部品Aに対する修正量をスムージング処理し、修正曲線36aを得る。修正履歴は、1時刻に対し1か所の修正を示した情報であるが、スムージング処理を行うことにより、並列連続性を判断することができる。こうして得られた修正曲線36aは、部品Aに対する修正の傾向を表す。同様に、ヒストグラムの修正時刻Tc,Tdにおいてプロットされている修正量は、部品Bに関する修正を表す。修正時刻Tc,Tdにおける部品Bに対する修正量をスムージング処理し、修正曲線36bを得る。修正曲線36bは、部品Bに対する修正の傾向を表す。さらに、ヒストグラムの修正時刻T3,T6,T7,Ta,Tb,・・・においてプロットされている修正量は、部品Cに関する修正を表す。修正時刻T3,T6,T7,Ta,Tb,・・・における部品Cに対する修正量をスムージング処理し、修正曲線36cを得る。修正曲線36cは、部品Cに対する修正の傾向を表す。
こうして得られた部品Aの修正曲線36a、部品Bの修正曲線36b及び部品Cの修正曲線36cの重なり量を算出する。
図5は、文書1の修正曲線の重なり領域を示した図である。
部品Aの修正曲線36aと、部品Bの修正曲線36bとは、重なる領域がない。すなわち、部品Aの修正と、部品Bの修正とは、互いに独立して実行されており、部品Aと部品Bとの関連性は低いと判断できる。同様に、部品Bの修正曲線36bと、部品Cの修正曲線36cとも、重なる領域がほとんどない。したがって、部品Bと部品Cとの関連性も低いと判断できる。部品Aの修正曲線36aと、部品Cの修正曲線36cとは、重なり領域40を有する。したがって、部品Aと部品Cとは関連性があると判断できる。重なり量は、重なり領域の面積とし、重なり領域を有する部品間についてのみ算出する。例えば、部品Aの修正曲線36aと、部品Cの修正曲線36cとが重なる重なり領域40は、修正曲線が重なる区間における部品の修正曲線の最小値の積分値として算出される。例えば、修正時刻T0から修正曲線36aと修正曲線36cとの交点までは、修正曲線36cの値が最小値として選択されて積分され、交点以降は、修正曲線36aの値が最小値として選択されて積分される。
さらに、算出された重なり量に基づいて、重なり量が全体の修正量に占める割合として、重なり度を算出する。
結合部品選別手段14は、予め定義された結合ルールに基づいて、部品間の重なり度を評価し、結合部品を選別する。例えば、結合ルールとして、「重なり度が閾値を超えるものを結合部品とする」というルールが設定されていたとき、算出された重なり度と閾値とを比較し、閾値を超える重なり度を有する部品群を結合部品とする。結合部品には、新たに部品識別子を付与し、登録部品情報に登録する。なお、結合ルールには、独立部品として使用される部品などが定義されていてもよい。この場合、重なり度が閾値を超えていても、この部品は結合部品には選別されず、独立部品として使用される。
以上の処理が実行されることにより、修正履歴に基づいて関係が強く結合部品としての使用が望ましい部品群が選択され、1つの結合部品として登録部品情報に登録される。
部品管理手段15は、部品の入手依頼を受けたときは、文書情報に基づいて依頼を受けた部品を特定し、その情報を依頼元へ送信する。なお、部品管理手段15が参照する登録部品情報は、上記の一連の処理が終了し、部品として確定された登録済部品のみが設定されている。登録部品情報を参照することにより、安定的に部品を管理することができる。部品管理手段15は、登録部品情報に基づいて、入手依頼を受けた部品が結合部品であるかどうかを判断する。そして、結合部品と判定されたときは、依頼を受けた部品に加え、結合部品を構成する部品群全てのデータを依頼者に送る。独立部品と判定されたときは、入手依頼を受けた部品のみのデータを依頼者に送る。
以上の処理手順が実行されることにより、修正履歴に基づいて各部品間の関係の強さが算出され、結合ルールに基づく結合部品の条件を満たす部品の組み合わせが結合部品として登録される。利用者の修正傾向に基づく部品間の関係の強さによって結合部品が設定されるため、部品が位置的に離れていても、セットで使用しなければならない部品群が結合部品に選別される。これにより、利用者にとってより利用しやすい部品の提供ができるばかりでなく、過不足なく文書を作成する支援を行うことが可能となる。
なお、文書20及び文書修正履歴30は、予め記憶手段11に格納しておく必要はなく、部品の設定要求とともに要求元装置から取得するとしてもよい。
以下、上記の文書作成支援装置を文書作成システムに適用した場合を例に、図面を参照して詳細に説明する。
図6は、文書作成システムの構成例を示した図である。
文書作成システムは、文書作成者が文書の編集作業と、部品の登録及び利用と、を行うユーザ装置500と、部品の登録と再利用を管理する文書作成支援装置100とを有する。文書作成支援装置100は、ユーザ装置500で作成される文書A200と、修正履歴300とを取得し、部品を抽出して管理するとともに、ユーザ装置500からの部品入手依頼に応じて部品データをユーザ装置500に提供する。
文書作成支援装置100は、文書部品検索情報DB111及び部品情報DB112の各データベースと、部品作成・登録部120、文書部品検索部130、キーワード抽出部140及び文書部品管理部150の各処理手段とを有する。
文書部品検索情報DB111には、登録済部品の部品識別子と、その登録済部品に設定されたキーワードとを関連付けたキーワード対応表を含む部品検索情報が格納される。部品情報DB112には、登録済部品の登録部品情報、結合部品の結合ルールなど、部品登録の処理に必要な情報が格納される。
部品作成・登録部120は、部品暫定作成手段12、重なり度算出手段13及び結合部品選別手段14として機能し、文書A200を部品化し、部品情報DB112に格納される登録部品情報に登録する。
文書部品検索部130は、文書編集部510より、キーワードを与えられたときは、文書部品検索情報DB111に格納されるキーワードと部品識別子の対応表を検索し、部品検索結果として該当する部品群の部品識別子を通知する。
キーワード抽出部140は、各部品を構成する文字列やコマンド名から該当部品の特性を示す語句(キーワード)を抽出する。
文書部品管理部150は、部品作成・登録部120が登録した部品について、キーワード抽出部140を用いてキーワードを取り出し、部品識別子とキーワードとを対応付けた対応表を文書部品検索情報DB111に格納される文書検索情報に登録する。また、部品管理手段15として機能し、文書編集部510から、部品識別子を指定して部品入手依頼を受けたときは、部品情報DB112に格納される部品情報を確認する。そして、結合部品(単独使用不可)であれば、指定された部品単独でなく、結合部品に属する部品群の部品データを一式提供する。
ユーザ装置500は、文書編集部510、修正履歴記録部520及び文書登録部530の各処理手段を有する。
文書編集部510は、いわゆるエディタなどの文書編集手段であり、文書作成支援装置100の解析対象となる文書を作成する。文書作成開始指示またはエディタ起動指示で処理を開始し、文書作成者の文書作成作業を支援する。このとき、文書作成者から部品入手の指示があったときは、部品入手依頼を文書作成支援装置100に送信し、応答として部品データを受け取る。これを表示装置などに表示し、文書作成者の利用を可能にする。
修正履歴記録部520は、いつ、どの文書の、どこを、どのように、修正したのかを記録する修正履歴記録手段である。記録された修正履歴300は、文書登録部530を介して文書作成支援装置100に送信される。
文書登録部530は、作成・修正された文書A200を、その修正履歴300とともに文書作成支援装置100に送信する。全ファイルを対象とし、ファイルをクローズしたときに自動的に文書作成支援装置100に送信するとしてもよいし、文書作成者の判断で送信するとしてもよい。文書作成者が判断する場合は、部品として使われてもよいと判断したもののみが指定され、文書作成支援装置100に送信される。
ここで、文書作成支援装置100のハードウェア構成について説明する。図7は、文書作成支援装置のハードウェア構成例を示すブロック図である。
文書作成支援装置100は、CPU(Central Processing Unit)101によって装置全体が制御されている。CPU101には、バス107を介してRAM(Random Access Memory)102、ハードディスクドライブ(HDD:Hard Disk Drive)103、グラフィック処理装置104、入力インタフェース105、及び通信インタフェース106が接続されている。
RAM102には、CPU101に実行させるOS(Operating System)のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM102には、CPU101による処理に必要な各種データが格納される。HDD103には、OSやアプリケーションのプログラムが格納される。グラフィック処理装置104には、モニタ108が接続されており、CPU101からの命令に従って画像をモニタ108の画面に表示させる。入力インタフェース105には、キーボード109aやマウス109bが接続されており、キーボード109aやマウス109bから送られてくる信号を、バス107を介してCPU101に送信する。通信インタフェース106は、ネットワーク600に接続されており、ネットワーク600を介してユーザ装置500との間でデータの送受信を行う。
このようなハードウェア構成によって、文書作成支援装置100の処理機能を実現することができる。なお、図7には、文書作成支援装置100のハードウェア構成を示したが、ユーザ装置500のハードウェア構成も同様である。
上記の構成の文書作成支援装置100における処理を、プログラムの一連の動作に対する説明書を対象文書とした場合を例にとり、部品を登録するまでの部品作成・登録処理について説明する。図8は、対象文書と対象文書から作成される暫定部品の一例を示した図である。
プログラムの一連の動作を説明する文書A200は、プログラムの構成上、必ずセットで行わなければならない2つの機能「prework」と、「postwork」についての説明部分を有する。
図8の「2.module動作説明」は、2.2節の「si」を挟んで、2.1節の「prework」と、2.3節の「postwork」と、が配置される文書構成となっている。この文書A200を部品化して登録することにより、再利用を促進する。この際、2.2節で分断された2.1節と、2.3節とはセットで使用されるべき部品になる。
部品作成・登録部120では、最初に文書A200を分割し、暫定部品を生成する。文書A200の2章については、節ごとに分割し、2.1節を抽出した「¥subsection prework」は暫定部品201、2.2節を抽出した「¥subsection si」は暫定部品202、2.3節を抽出した「¥subsection postwork」は暫定部品203とする。そして、部品情報DB112に格納される登録部品情報を参照し、登録済部品と照合する。詳細は後述するが、登録部品情報には、登録済部品の部品識別子に関連付けて、登録済部品の部品要素が登録されている。また、部品要素には、部品を特徴付ける、例えば、文書内の部品の位置を示すオフセット値、部品の使用回数累積値、部品のサイズ、実体などがある。ここでは、部品の引用関係や、実体データの文字列の一致度などに基づいて、暫定部品と同じ部品が登録済部品に存在するか否かを検索する。同一と見なせる登録済部品があれば、暫定部品に登録済部品の部品識別子が付与される。同一と見なせる登録済部品がなければ、暫定部品には新規の部品識別子が付与される。図8の例では、暫定部品201には部品識別子「ID15」、暫定部品202には部品識別子「ID18」、暫定部品203には部品識別子「ID16」が付与されたとする。こうして特定された部品を特徴付ける部品要素に関する情報は、部品要素リストに登録される。
図9は、部品要素リストの一例を示した図である。
部品要素リスト1000は、対象の文書A200の要素となる部品の一覧と、その特徴が記述される。言い換えれば、文書A200がリスト形式で表現されている。部品要素リスト1000には、対象要素となる部品の属性情報として、部品識別子1001、文書内開始オフセット1002、部品度1003、使用回数累積1004及び実体1005の情報項目が設定される。
部品識別子1001には、部品を特定する部品識別子が設定される。
文書内開始オフセット1002には、文書A200における部品の開始位置を特定するオフセット値が設定される。例えば、部品の先頭文字が、文書A200の最初の文字から何番目の文字になるのかという値が設定される。
部品度1003の詳細は後述するが、部品度とは、この部品の部品らしさを表す指標であり、重なり度に基づいて算出されるとする。ここでは、部品が独立で使用できるのか、セットで使用する関連部品が存在するのかを判断する指標として用いる。なお、初期値として1が設定されるとする。部品度が大きいほど、この部品は独立して使用されるべき部品となる。また、部品度が小さいほど、この部品は結合部品として使用されるべき部品となる。
使用回数累積1004は、この部品が使用された回数、すなわち、文書に出現した回数の累積値が格納される。暫定部品と登録済部品の照合によって、登録済部品が検出されるごとに、1ずつカウントアップされる。複数の類似する文書を用いて解析を行うと、多くの文書に出現する部品は、その使用回数累積値が多くなる。よく使用される部品は、部品としての利用度が高いということであるので、結合部品の判定時に参照される。
実体1005には、文字列のデータなど部品の実体部分が格納される。実体部分のデータは別の記憶部に格納しておき、格納された位置を示すポインタを実体1005に設定しておくとしてもよい。
次に、修正履歴300を解析する。図10は、修正履歴と修正履歴情報から抽出した修正履歴情報の一例を示した図である。
修正履歴300には、修正履歴記録部520が検出した、修正時刻、対象文書、操作種別、修正を行った場所(文書内のオフセット)及び操作対象の文字列が記録されている。例えば、1行目には、修正時刻「08・20 12:00」に、対象文書「文書A」について操作種別「挿入」の処理を、文書内のオフセット「offsetP1」から開始し、操作対象の文字列「B社統合システム対応」を挿入したことが記録されている。
なお、この修正履歴300は一例であり、いつ、どの文書の、どこを、どのように修正したかが記録されていれば、どのような形式であってもよい。
通常、修正履歴300には対象文書以外の修正履歴も含まれている。そこで、修正履歴300から対象の文書A200対する処理の記録のみを抽出し、かつ抽出した処理の記録を時刻順に並べ替える。そして、文書内のオフセットと、部品要素リスト1000の文書内開始オフセットとを照合し、修正が行われた部品を特定する。一般に、修正履歴には、修正位置として文書の先頭からのオフセットが与えられていることが多いので、これを用いて文書を構成するどの部品に対して修正が行われたのかを特定する。また、操作対象の文字列の文字数を算出し、修正サイズとする。予め修正履歴記録部520が修正サイズを算出している場合には、これを用いるとしてもよい。なお、修正箇所が複数部品にまたがる場合は、その修正量を部品単位に分割しておく。例えば、部品1が10バイト、部品2が20バイト、部品3が5バイトと連続で構成された文書において、修正履歴よりオフセットが8バイト、修正量が23バイト削除と記録されていたとする。この場合、修正履歴から、部品1の修正量2バイト、部品2の修正量20バイト、部品3の修正量1バイトと割り当てられる。
こうして解析処理された修正履歴は、修正履歴情報1100として記憶手段に保存される。
修正履歴情報1100は、修正日時1101、修正場所部品識別子1102及び修正サイズ1103の情報項目を有する。修正日時1101には、抽出された対象文書(ここでは、文書A200)の修正履歴から抜き出された修正日時が設定される。修正場所部品識別子1102には、オフセットを照合して算出された修正場所の部品の部品識別子が設定される。修正サイズ1103には、修正履歴から算出された修正量(バイト単位の修正サイズ)が設定される。
ここまでの処理で、対象文書A200の要素である部品が特定されて部品要素リスト1000が生成され、修正履歴300から各部品の修正履歴情報1100が得られる。
続いて、修正履歴情報1100を用いて各部品の修正曲線を算出する。ヒストグラム作成時の単位時間とする時間刻み幅Tは、T=2分と設定する。
上記の条件で修正履歴情報1100を解析し、修正量を集計する。例えば、12:00から12:02の区間を1単位とすると、12:00と12:01に発生した部品識別子ID15の部品(¥subsection prework)に対する修正サイズが集計される。この例では、修正量は16+19=35になる。以下、同様に各部品の単位時間ごとの修正量を算出する。集計結果は、修正量集計テーブルに格納する。
図11は、修正量集計テーブルの一例を示した図である。
修正量集計テーブル1200には、各時間単位における部品ごとの修正量が算出されて設定される。行は、2分単位の時間刻み幅を表し、列は文書A200の部品要素を表す。先ほど算出された「12:00〜12:02」の期間に行われた部品ID15に対する修正量35は、修正量集計テーブル1200上の行「12:00」、列「部品ID15」の交差する箇所に格納される。同様にして、各ヒストグラム作成単位時間(時間刻み幅)における部品ごとの修正量を集計し、修正量集計テーブル1200に登録していく。修正履歴情報1100に登録される全項目の集計が終了した時点では、修正量集計テーブル1200は、時間刻み幅を2分とする修正量ヒストグラムに相当する。
こうして算出された修正量ヒストグラムをスムージング処理し、各部品の修正曲線を得る。スムージング処理として、ヒストグラム作成窓枠の微細化+補間作業、移動平均などを用いた近似曲線作成手法などがよく知られている。ここでは、公知のスムージング処理を適宜用いて修正量ヒストグラムのスムージング処理を行うとする。
図12は、修正曲線(スムーズ値)テーブルの一例を示した図である。
修正曲線(スムーズ値)テーブル1300は、図11に示した修正量集計テーブル1200が表す修正量ヒストグラムをスムージング処理して算出されたスムーズ値1301が設定される。例えば、部品ID15は、「開始〜12:00」の期間(pre行)でのスムーズ値は11.7、「12:00〜12:02」の期間(12:00行)のスムーズ値も11.7となる。
累積更新量1302は、各期間までの修正量(スムーズ値)を累積して算出される。例えば、部品ID15は、「開始〜12:00」の期間(pre行)における累積更新量は11.7になる。「12:00〜12:02」の期間(12:00行)の累積更新量は、pre期間の累積更新量にこの期間のスムーズ値を加算した23.4となる。
以下、同様の処理が行われ、全期間及び全部品についてのスムーズ値と、累積更新量が算出され、修正曲線(スムーズ値)テーブル1300に設定される。こうして各部品の修正曲線が得られる。
なお、修正量ヒストグラムをスムージング処理して得られた修正曲線は、重なり度の算出に当たって有効と見なす領域を予め定義しておく。このため、有効と見なされない部品ごとの修正開始直後と、終了直前の部分を足きり領域とし、足きり領域の値を0としてスムーズ値を補正する。ここでは、足きり領域割合をxx=10%、yy=1−xx=90%とする。xxは、修正曲線算出から除外される修正開始直後の期間を示し、yyは修正曲線算出から除外される修正終了直前の期間を示す。ここでは、全修正量を100%として、修正量が10%に到達するまでの期間と、修正量が90%に到達した後の期間のスムーズ値が足きりされる。
図13は、足きり処理後の修正曲線を示した図である。
足きり処理済修正曲線テーブル1400は、図13に示した修正曲線(スムーズ値)テーブル1300の値を足きり処理した後のスムーズ値(足きり処理後)1401が設定される。例えば、部品ID15の修正曲線は、「pre〜12:00」の期間(pre行)から「12:06〜12:08」の期間(12:06行)に渡る。このうち、足きり領域割合に相当する先頭部分及び終了部分の値を0として修正曲線を補正する。この例では、「pre〜12:00」の期間(pre行)のスムーズ値が11.7から1.09に補正されている。同様に、「12:06〜12:08」の期間(12:06行)のスムーズ値が23.7から13.09に補正されている。
以下、同様の処理が行われ、全部品についての修正曲線が補正され、スムーズ値(足きり処理後)1401が算出される。なお、累積更新量1402は、修正曲線(スムーズ値)テーブル1300の累積更新量1302と同じである。
こうして得られた足きり処理後の修正曲線を用いて、各部品の重なり量と重なり度を算出する。なお、重なりが存在しない組み合わせの計算は省略する。
例えば、図13の足きり処理済修正曲線テーブル1400のスムーズ値(足きり処理後)1401を参照すると、部品ID15と部品ID18とは、修正曲線が重ならない(ともに値が0以外となる期間がない)。同様に、部品ID15と部品ID234とは、修正曲線が重ならない。部品ID15と部品ID16とは修正曲線が重なる。また、部品ID18と部品ID16とは修正曲線が重ならない。部品ID18と部品ID234とは修正曲線は重なる。そして、部品ID16と部品ID234とは修正曲線が重ならない。
したがって、修正曲線が重なるのは、部品ID15と部品ID16の組み合わせと、部品ID18と部品ID234の組み合わせとなる。それぞれの組み合わせについて、重なり量と重なり度を算出する。
図14は、重なり度テーブルを示した図である。
重なり度テーブル1500には、重なりが存在する部品の組み合わせについて算出された重なり量1501、修正量総計1502及び重なり度1503が設定される。
重なり量1501には、重なり量として、各部品の修正曲線の重なり領域の面積に基づく値が設定される。修正曲線の重なり領域の面積は、修正曲線が重なる区間における部品の修正曲線の最小値の積分値として算出される。例えば、2つの部品M,Nについて、
重なり量= ∫min(部品Mの修正量,部品Nの修正量) ・・・(1)
によって算出することができる。ここで、minは、いずれか小さい値を選択することを意味する。
修正量総計1502には、組み合わされた部品の累積更新量の総計が算出されて設定される。例えば、部品ID15と部品ID16との組み合わせであれば、部品ID15の累積更新量106.1と、部品ID16の累積更新量73.1を合算した179.2が設定される。
重なり度1503には、重なり度として、重なり量が全修正量に占める割合を計算した値が設定される。ここでは、
重なり度= 重なり量×2/修正量総計 ・・・(2)
として算出される。
以上の処理手順により、修正履歴300に基づいて、部品ごとの修正曲線が算出され、部品間の修正曲線が重なる関連部品が検出される。また、修正曲線の重なり量と、重なり度も算出される。
なお、図1に示した文書作成支援装置10の例では、部品間の関係の強さを重なり度によって評価するとした。ここでは、さらに、重なり度に基づく指標として、部品度差分と、部品度とを算出し、部品度差分または部品度によって部品間の関係の強さを評価する。
部品度は、その部品の部品らしさを表す指標であり、この部品が独立で使用できるのか、関連部品が存在するかを示す指標となる。部品度差分は、修正履歴300に基づく解析を行ったときに算出される重なり度に基づき、当該部品と関連する部品があるかどうかを示す指標となる。具体的に、部品度差分は、
部品度差分= 1−β×重なり度 ・・・(3)
によって求める。ここで、βは重み付けのための任意の係数である。部品度差分は、今回の解析結果から得られた部品度の差分であり、解析が行われるごとに算出される。また、重み係数βの値を小さくすることにより、結合部品の判定に重なり度の与える影響を抑えることができる。なお、部品度差分は、重なり度が大きくなるほど、小さな値となる。すなわち、最大値を1として、他の部品との関係が強いほど値が小さくなる。最大値の1は、当該部品が他の部品との関連のない独立部品であることを示す。部品度差分を評価することにより、当該部品が結合部品であるかどうかを選別することができる。
一方、部品度は、解析処理が行われるごとに算出される部品度差分の値を加味して算出される値である。部品度は、
部品度= 更新前部品度 + 部品度差分 ・・・(4)
によって得られる。こうして算出される部品度は、部品の独立性、すなわち、単独で使用される部品であるかどうかを示す。部品の修正量は、部品が挿入される文書や、そのときの修正内容に応じて変動する。毎回算出される部品度差分は、変動の影響を受ける。部品度は、過去に算出された部品度に基づいて算出されるので、部品度を評価することにより、過去の算出結果を反映して結合部品であるか否かの判定を行うことができる。
部品度及び部品度差分を含む部品要素は、部品識別子に対応付けて部品情報に登録され、部品情報DB11aに格納される。このとき、修正曲線が重なる部品は、関連部品として部品情報に登録しておく。例えば、図14の重なり度テーブル1500作成時、部品ID15と、部品ID16とは重なり量を有する関連部品と判断されている。この場合、部品情報1600の部品ID15に対応する関連部品1602欄に部品ID16が登録される。同様に、部品ID16に対応する関連部品1602欄に部品ID15が登録される。
図15は、部品情報の一例を示した図である。
部品情報1600は、部品を特定する部品識別子1601に対応付けて、関連部品1602、結合要因1603、部品度1604、部品度差分1605、使用回数累積1606及び実体1607の各情報項目が設定される。
関連部品1602は、修正履歴300に基づいて関連が検出された部品が設定される。具体的には、重なり度テーブル1500における組み合わせの相手の部品の部品識別子が設定される。
結合要因1603は、関連部品1602が設定された部品について、関連する結合部品と判断した要因を設定する。ここでは、修正曲線に基づいて関連部品が検出されたので、「修正タイミング分散」と設定される。
部品度1604は、この段階では、まだ部品要素リスト1000の該当する部品識別子に対応する部品度1003の値が転記される。
部品度差分1605は、式(3)を用いて、重なり度1503に基づいて算出される。
使用回数累積1606及び実体1607は、部品要素リスト1000の該当部品識別子の情報が転記される。
こうして各項目の値が設定された部品情報1600に基づいて、結合部品の選別処理が行われる。結合部品の選別処理は、関係の強い部品群を結合する結合ルールを用いて部品情報1600の各項目を評価し、判定を行う。
図16は、結合ルールの一例を示した図である。
結合ルール1700には、ある部品が修正曲線を用いて算出された重なり度に基づいて結合部品と判定されたとき、実際に結合部品として登録するか否かの判断情報が設定される。ここでは、対象の部品識別子1701、結合回避1702、サイズ(条件1)1703、(条件2)1704が設定される。
部品識別子1701は、結合ルールが適用される対象の部品を指示する情報である。「*」の表記は、結合ルールが全部品に適用されることを示している。
結合回避1702は、当該部品は単独で使用される独立部品であるか否かの情報である。ここでは、「有」で結合回避が指定される。例えば、ルール番号2は、部品識別子がID234の部品に適用され、ID234は無条件に結合を回避し、単独で使用される独立部品とするというルールになる。例えば、他部品との関連が強いが、あえて独立部品としたいものが登録される。
サイズ(条件1)1703は、条件1としてサイズが指定されたことを示している。ここでは、部品サイズとして最大が文書全体の50%であることを指示している。
(条件2)1704は、ここでは何も定義されていないが、必要に応じて、適宜設定することができる。
なお、図16の例では、ルール番号1は、部品の最大サイズは文書全体の50%以下とし、文書サイズの半分以上の部品の更なる結合は認めないというルールになる。このルールが適用されることにより、最大の部品サイズが文書サイズの半分と限定される。例えば、文書を構成するすべての部品が関連するため、文書全体が1つの部品として結合される恐れのある文書について、すべての部品が結合されることを防止することができる。
また、結合ルール1700には、定義されていないが、結合ルール1700によって結合不可と判定されたもの以外は、重なり度、または、重なり度に基づいて算出される部品度差分あるいは部品度の値を評価し、結合部品であるかどうかを判定する。判定は、重なり度、部品度差分または部品度のうちの1つと、予め指定された閾値を比較して行う。
ここでは、部品度差分について0.5の閾値が設定されていたとする。部品度差分は、式(3)から、値が小さいほど部品間の関係が強くなる。したがって、0.5>部品度差分のとき、この部品は関連が強く、単独では部品として成立しない結合部品であると判断する。
なお、部品度を用いた場合も同様に、閾値>部品度を満たす部品の組み合わせが結合部品と判定される。ただし、部品度は、使用されるごとに値が大きくなるので、使用累積回数に基づいて部品度を補正する必要がある。また、重なり度で判定することもできる。重なり度は、逆に、大きくなるほど部品間の結合度が高くなるので、閾値<重なり度によって判定する。
この結合ルール1700と、0.5>部品度差分と、を部品情報1600に登録される部品ID15,ID18,ID16,ID234に適用する。部品ID234は、ルール番号2の対象になるので、独立部品とする。したがって、部品ID18と部品ID234とは、それぞれ単独で用いられる独立部品と設定される。一方、部品ID15と部品ID16とは、ルール番号1,2のルールに該当しないとし、続いて部品度差分(0.37)と、閾値(0.5)とを比較する。閾値(0.5)>部品度差分(0.37)を満たすので、部品ID15と部品ID16とは結合部品と判定される。
なお、上記の説明では、2つの部品を結合する場合について説明したが、3以上の部品を結合することもできる。例えば、部品Aと部品B、及び部品Bと部品C、それぞれが関連していると判定されたときは、部品A、部品B、部品Cとは結合部品と判定する。
こうして最終的に決定された結合部品が登録部品情報に登録される。
図17は、登録部品情報の一例を示した図である。
登録部品情報1800には、単独使用1801、部品識別子1802、関連部品1803、結合要因1804、部品度1805、使用回数累積1806及び実体1807の各情報項目が設定される。
単独使用1801には、この部品が単独で使用可能な独立部品か、セットで使用される結合部品か、を示すフラグ情報が設定される。ここでは、結合部品と判定された部品ID15と、部品ID16に単独で使用されないことを示す「否」が設定される。
部品識別子1802は、当該部品の識別情報である。
関連部品1803には、当該部品に関連すると判定された部品の部品識別子が設定される。また、結合要因1804には、関連部品と判断した要因が設定される。ここで、重なり度から結合部品と判断された部品の組み合わせのうち、部品ID18とID234とは、結合ルール1700の結合回避指示によって、単独部品として使用されると判断されている。そこで、部品情報1600に登録されていた関連部品1602のうち、結合回避が指示された部品ID18と部品ID234からは、関連部品1803と結合要因1804の項目のデータが削除されている。
部品度1805には、式(4)を用いて、部品情報1600の部品度1604の値に、部品度差分1605の値を加算して算出された値が設定される。なお、結合回避指示によって結合しなかった部品は、旧状態のままとしてもよい。
使用回数累積1806と実体1807は、部品情報1600に登録されていた部品については、その値が転記される。
ここで、結合部品には、新たに部品識別子を付与し、登録部品情報に登録する。登録部品情報1800では、最後の行に結合部品の部品情報が登録されている。部品識別子として新たにID1023が付与され、部品識別子1802に登録される。また、部品度1805と、使用回数累積1806には、初期値(=1)が設定される。そして、実体1807には、結合部品ID1023が、ブランク(¥blank)を挟んで、部品ID15と、部品ID16とが組み合わされた構造であることが示されている。
以上の処理によって、登録部品情報1800に、セットで使用されるべき結合部品が登録される。
キーワード抽出部140では、各部品からキーワードを抽出する。文書部品管理部150は、抽出されたキーワードと部品とを対応付けたキーワード表を生成し、文書部品検索情報DB111に格納する。
図18は、キーワード対応表の一例を示した図である。
キーワード対応表1900には、部品識別子1901に対応付けて、抽出されたキーワード1902が登録される。例えば、部品ID15には、「前処理」と、「起動」というキーワードが対応付けられている。
こうして、必要な登録済部品を、キーワードを用いて検索し、検索された部品を利用することができるようになる。
なお、上記の説明では、部品度を独立で使用できるのか、関連部品が存在するのかを反映する値として算出している。したがって、部品度差分は、式(3)に示したように、部品の修正曲線の重なり度に基づいて算出される。さらに、その部品を利用する際にどの程度修正を行ったかという修正度を指標に入れると、部品度を参照することにより、その部品の使い勝手の判断を行うことができる。使い勝手がよいとは、その部品が修正することなく使えることを表す。個別環境に合わせて修正が必要になるほど、使い勝手が低下する。この場合の部品度は、
部品度=1−α*修正度−β*重なり度 ・・・(5)
と表すことができる。なお、修正度は、該当部品の部品サイズに占める修正量で、例えば、修正サイズ/(修正前部品サイズ+修正後部品サイズ)によって求めることができる。
次に、登録済部品の再利用について説明する。
ユーザは、部品の再利用をする際、キーワードを指定して所望の部品を検索する。例えば、ユーザの指定により、ユーザ装置500の文書編集部510から「前処理」というキーワードが文書作成支援装置100に送信されたとする。文書部品検索部130は、取得したキーワードを用いて、文書部品検索情報DB111に格納されるキーワード対応表1900を検索する。ここでは、「前処理」というキーワードが対応付けられた部品ID15が検索される。この部品検索結果は、文書編集部510に通知され、文書編集部510は、部品ID15の入手依頼を文書作成支援装置100に送信する。
部品ID15の入手依頼は、文書部品管理部150が処理する。文書部品管理部150は、部品情報DB112に格納される登録部品情報1800から部品ID15を検索する。部品ID15は、単独使用「否」が設定されているので、結合部品と判断し、該当する結合部品を検索する。ここでは、部品ID1023が検出されるので、部品ID1023を文書編集部510に返す。部品ID1023の実体は、部品ID15と部品ID16なので、文書編集部510には、部品ID15とともにセットで使用すべき部品ID16が返送される。これにより、利用者は過不足なく文書を作成することが可能となる。
以下、文書作成システムによる部品登録処理の手順を、フローチャートを用いて説明する。
図19は、部品登録処理の手順を示したフローチャートである。
文書作成者の文書作成開始指示によって、ユーザ装置500の処理が開始される。
[ステップS01] 文書編集部510は、文書作成者の操作指示に基づいて文書A200を作成する。文書A200の作成過程は、修正履歴記録部520によって、修正履歴300という形式で保存される。
[ステップS02] 文書登録部530は、自動的、もしくは文書作成者の明確な指示に基づき、文書作成支援装置100に文書A200と、修正履歴300とを送付する。
以上の処理手順が実行されることにより、文書A200及び修正履歴300が、文書作成支援装置100に入力される。
[ステップS03] 部品作成・登録部120は、対象の文書A200から暫定部品を作成し、暫定部品の部品要素を抽出し、部品を特定する。詳細は後述する。
[ステップS04] 部品作成・登録部120は、修正履歴300を解析し、ステップS02で特定された部品の一定時間間隔の修正量を集計し、その修正曲線を算出する。そして、部品間の修正曲線の重なり度に基づいて、部品度差分及び部品度を計算する。詳細は後述する。
[ステップS05] 部品作成・登録部120は、結合ルール1700を用いて、ステップS04で算出された重なり度に基づく部品度差分または部品度を評価する。そして、結合部品と判定される部品群を選別し、結合部品として登録部品情報1800に登録する。登録部品情報1800は、部品情報DB112に格納される。詳細は後述する。
[ステップS06] 文書部品管理部150は、部品化された一連の部品をキーワード抽出部140に送付し、各部品のキーワードを抽出する。抽出されたキーワードと、各部品の部品識別子とを対応付け、キーワード対応表1900を作成し、文書部品検索情報DB111に格納する。
以上の処理手順が実行されることにより、文書A200から部品が抽出され、登録部品情報1800に登録され、部品情報DB112に格納される。このとき、修正履歴300に基づいて算出された各部品の修正傾向によってセットで使用しなければならない結合部品も検出され、登録部品情報1800に登録される。また、キーワードと、部品及び結合部品とを対応付けたキーワード対応表1900も作成され、文書部品検索情報DB111に格納される。
各処理の詳細を説明する。
まず、部品暫定作成処理について説明する。部品暫定作成処理では、入力された文書A200に含まれる部品を特定する。図20は、部品暫定作成処理の手順を示したフローチャートである。
部品作成・登録部120に、対象の文書A200及び修正履歴300が入力されて処理が開始される。なお、修正履歴300が残っていれば、過去に作成された文書が対象となってもよい。
[ステップS31] 入力された文書A200をブロック化し、暫定部品を作成する。ブロック化は、章や節単位で分割するなど、公知の技術を用いて行う。
[ステップS32] ステップS31でブロック化された暫定部品の部品要素リスト1000を保存するための格納領域を用意する。部品要素リスト1000には、文書A200の部品要素として、部品識別子、文書内開始オフセット、部品度、使用回数累積、実体、その他の部品要素の情報がリスト形式で設定される。
[ステップS33] 暫定部品に関する部品要素リスト1000を生成し、ステップS32で用意された格納領域に格納する。暫定部品に一致する登録済部品を、登録部品情報1800を検索して探す。部品間の引用関係、部品を構成する文字列の一致などによって、暫定部品と登録済部品とが一致しているか否かを判定し、一致しているものがあれば、その登録済部品の部品識別子を暫定部品に割り当てる。こうして、暫定部品をこの登録済部品と特定する。登録済部品と一致していなければ、新規部品の部品識別子を割り当て、新規部品として登録する。さらに、当該部品の文書A200内における開始位置を示す文書内開始オフセットの計算など、部品要素リスト1000の各情報項目を取り出し、部品要素リスト1000に登録する。
以上の処理手順が実行されることにより、文書A200に含まれる部品が特定され、その部品要素が部品要素リスト1000に登録される。
次に、修正履歴300に基づいて各部品の修正曲線を算出し、部品度を求める部品度算出処理を行う。部品度算出処理では、部品暫定作成処理によって特定された文書A200の要素である部品について部品度差分及び部品度を算出する。
図21は、部品度算出処理の手順を示したフローチャートである。文書A200の要素である部品が特定され、処理が開始される。
[ステップS41] 入力された対象文書A200に関する修正履歴300を解析し、修正履歴300に記述される時順に沿って修正場所と修正量を各部品単位にソートする。このため、部品要素リスト1000の各部品の文書内開始オフセットを読み出し、文書A200における部品の並び順と、部品サイズを計算する。部品サイズは、次の並び順の部品の文書内開始オフセットと、当該部品の文書内開始オフセットと、から算出する。次に、修正履歴300の修正時刻、対象文書、修正箇所オフセット、修正サイズを抽出し、ステップS41で算出した部品サイズと部品の文書内開始オフセットと照合して、修正された部品及び部品修正サイズを特定する。さらに、修正履歴300の修正時刻に沿って、修正された部品の部品識別子及び修正サイズを並び替え、修正日時、部品識別子及び修正サイズを修正履歴情報1100に登録する。
[ステップS42] 修正量ヒストグラムの作成準備として、ヒストグラムの時間刻み幅Tと、足きり領域割合xx,yyとを読み出す。Tは、例えば、分単位の任意の値が設定される。xx,yyは、足きりの範囲をパーセント(%)で表した数値であり、xxは有効とする範囲の下限、yyは上限を示す。xx−yy以外の範囲は、足きりされる。
[ステップS43] 各部品に対する修正量ヒストグラムを作成する。時刻をT分刻みに分割し、分割期間の時刻と修正時刻を照合する。そして、分割期間に含まれる各部品の修正量を集計する。これにより、修正量集計テーブル1200が生成される。
[ステップS44] ヒストグラム作成窓枠の微細化及び補間作業を行って、各部品のヒストグラムをスムージング処理する。スムージング処理には、公知の近似曲線作成手法を利用する。こうして各部品の修正曲線(スムーズ値)テーブル1300が得られる。
[ステップS45] ステップS43によるスムージング処理後、時間刻み幅に応じた各期間までの累積修正量を計算する。例えば、開始時刻かT分後までの期間に対しては、その間の修正量が計算される。そのT分後(開始時刻から2T分後)の期間に対しては、T分後から2T分後までの期間の修正量が開始時刻かT分後までの期間の修正量に加算される。さらに、足きり領域割合に応じて、各部品修正曲線の先頭と末尾部分の足きりを行う。すなわち、各部品において、t1=修正量がxx%に到達した時刻と、t2=修正量がyy%に到達した時刻とを計算し、修正曲線におけるt1<t<t2以外の部分の修正量を0とする。こうして、各部品の足きり処理済修正曲線テーブル1400が得られる。
[ステップS46] ステップS45において足きり処理がされた後の修正曲線を用いて、文書A200に含まれる部品間の重なり度を計算する。式(1)を用いて、文書A200に含まれる文書群の任意の2つの部品M,Nにおける修正曲線の重なり量を求める。さらに、式(2)を用いて、部品M,Nの修正量に占める重なり量の割合を計算し、重なり度を算出する。これを部品の組み合わせすべてに対し行う。こうして、重なり度テーブル1500が得られる。
[ステップS47] ステップS46で得られた部品間の関係に基づいて、各部品の部品情報1600の関連部品及び結合要因を登録する。部品情報1600には、予め特定された部品の部品識別子に関連付けて、部品度(前回値)、使用回数累積、実体などが登録されているとする。ここではさらに、重なり度テーブル1500に基づいて、各部品に関連付けられた部品があればその関連部品と、結合要因「修正タイミング分散」と、を設定する。例えば、関連が認められた部品M,Nについて、部品Mの関連部品の欄に部品Nを、部品Nの関連部品の欄に部品Mを登録する。
[ステップS48] 式(3)を用いて部品度差分を算出する。部品度差分は、最大値を1とする1以下の正数で、重なり度が大きくなるほど、その値が小さくなる。なお、一回の文書修正の影響を小さくしたいときは、係数βを小さい値とする。算出された部品度差分は、部品情報1600に登録される。
以上の処理手順が実行されることにより、修正履歴300に基づいて部品間の関係の強さに基づき、関連部品が特定される。また、部品間の関係の強さを表す指標として部品度差分が算出され、部品情報1600に各情報が登録される。
次に、関連部品と、関連部品間の関係の強さを表す部品度差分が設定される部品情報1600と、結合ルール1700とを用いて結合部品選別処理が行われる。結合部品選別処理では、結合ルール1700の条件を満たす部品群が結合部品として登録される。
図22は、結合部品選別処理の手順を示したフローチャートである。
[ステップS51] 結合ルール1700から結合回避指示情報を読み出す。結合回避の指示は、結合ルール1700の結合回避1702が、「有」であるかどうかによって判断する。当該部品に部品情報1600の関連部品1602が設定されるときは、結合回避が指示されているかどうかを判断し、指示されているときは、該当部品の関連部品1602及び結合要因1603を削除する。
[ステップS52] 結合部品を確認する。部品情報1600の関連部品1602に2回以上出現する部品を抽出し、結合関係を解析する。例えば、部品Aと部品Bとの結合関係が検出され、部品Bと部品Cとの結合関係が検出された場合、部品A、部品B及び部品Cを結合部品と判断する。
[ステップS53] 式(4)を用いて、部品情報1600の部品度1604に、これまでの処理によって算出された部品度差分を加算し、部品度を更新する。なお、ステップS52で3以上の部品が結合されたときは、部品度差分を再計算する。例えば、各部品間の部品度差分の平均を算出する。部品A、部品B及び部品Cが結合部品と判定されたときは、部品Aと部品Bの部品度差分と、部品Bと部品Cの部品度差分との平均値を求め、部品度差分を再計算する。そして、再計算された部品度差分により部品度を算出する。
[ステップS54] ステップS53の処理で再計算された部品度差分、部品度、あるいは、結合部品のサイズなどを結合ルール1700と照合し、最終的に結合部品とするかどうかを判定する。例えば、「部品度差分が一定値以下」、「部品度と使用回数累積の差が一定以上」などのルールが適用され、条件に合致するかどうかが判定される。条件に合致したときは、処理をステップS55に進める。合致しないときは、登録部品情報1800の該当する部品の登録部品情報を更新し、処理をステップS56に進める。
[ステップS55] 結合部品の条件に合致したときは、結合部品に新たな部品識別子を付与し、登録部品情報1800に登録する。また、結合部品に属する各部品の登録部品情報を更新し、単独使用1801に「否」を設定する。
[ステップS56] 部品情報1600に登録される全部品の処理が終了したかどうかを判定する。終了していないときは、対象を次の部品とし、ステップS51に戻って処理を行う。終了しているときは、部品登録処理を終了する。
以上の処理手順が行われることにより、文書A200から部品が抽出され、登録される。このとき、修正履歴300に基づいてセットで使用されなければならない結合部品であるかどうかが判断され、結合部品であれば新たな部品として登録される。
これにより、登録された部品を再利用しようとすると、その部品が結合部品であれば、結合された他の部品も同時に文書作成者に提供される。この結果、文書作成者は過不足なく文書を作成することが可能となる。
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、文書作成支援装置が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD(Digital Versatile Disc)、CD−ROM(Compact Disc Read Only Memory)などの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。
以上の実施の形態に関し、さらに以下の付記を開示する。
(付記1) 文書の一部を部品として抽出して管理し、文書作成時の支援を行うコンピュータを機能させる文書作成支援プログラムにおいて、
前記コンピュータを、
文書及び修正履歴情報データベースから文書及び前記文書の修正に関する文書修正履歴を取得し、前記文書を暫定的に分割した暫定部品を特徴付ける部品要素を抽出し、記憶手段に格納される登録部品情報に登録済みの登録済部品から抽出した部品要素と、前記暫定部品を特徴付ける部品要素とを照合して、所定の前記部品要素が一致する前記登録済部品が検出されたときは該登録済部品、検出されないときは新規部品、として前記文書に含まれる部品を特定する部品暫定作成手段、
前記文書に含まれる部品ごとに、前記文書修正履歴に基づいて一定時間間隔ごとの該部品に対する修正量を時間軸に沿って並べたヒストグラムをスムージング処理して前記部品ごとの修正傾向を表す修正曲線を算出し、前記修正曲線が表す前記修正の傾向が重なる重なり量に応じた部品間の重なり度を算出する重なり度算出手段、
関係の強い部品群を結合する結合ルールを用いて前記部品間の重なり度及び前記部品要素を評価し、前記結合ルールに基づいて結合部品と評価される部品群を選別し、前記部品群を前記結合部品として前記登録部品情報に登録する結合部品選別手段、
として機能させることを特徴とする文書作成支援プログラム。
(付記2) 前記重なり度算出手段は、前記修正曲線のうち、前記文書の修正の開始から修正が安定すると予測されるまでの期間と、前記文書の修正の終了前の見直しが行われていると予測される期間と、に相当する部分を除いて前記部品間の重なり度を求める、ことを特徴とする付記1記載の文書作成支援プログラム。
(付記3) 前記重なり度算出手段は、前記部品ごとの前記修正曲線が重なる重なり区間における前記修正曲線の最小値を積分して前記修正曲線が重なる重なり量を算出し、前記重なり量が全体の修正量に占める割合に応じて前記部品間の重なり度を算出する、ことを特徴とする付記1記載の文書作成支援プログラム。
(付記4) 前記重なり度算出手段は、さらに、前記部品間の前記修正曲線がまったく重ならない状態を最大値とし、前記部品間の重なり度に所定の重み係数を乗算した値を、前記最大値から減算して部品度差分を算出し、
前記結合部品選別手段は、前記部品度差分を前記結合部品の評価に用いる、
ことを特徴とする付記1〜3記載の文書作成支援プログラム。
(付記5) 前記重なり度算出手段は、さらに、前記部品の部品サイズに占める修正量を修正度とし、前記修正度に所定の重み係数を乗算した値を前記部品度差分の値から減算し、拡張部品度差分を算出し、前記部品度差分とする、ことを特徴とする付記4記載の文書作成支援プログラム。
(付記6) 結合部品選別手段は、前記結合ルールとして、単独で使用される独立部品が定義されていたときは、前記独立部品に該当する前記部品を前記結合部品の評価対象から除外する、ことを特徴とする付記1〜5記載の文書作成支援プログラム。
(付記7) 結合部品選別手段は、前記結合部品に新たな部品識別子を付与し、セットで使用される新たな部品として前記部品情報に登録する、ことを特徴とする付記1〜6記載の文書作成支援プログラム。
(付記8) 前記コンピュータを、さらに、前記部品情報に登録される前記部品ごとにキーワードを抽出し、抽出された前記キーワードを該部品に対応付けた部品キーワード対応表を生成して前記記憶手段に格納するキーワード抽出手段、として機能させることを特徴とする付記1〜7記載の文書作成支援プログラム。
(付記9) 前記コンピュータを、さらに、前記部品の再利用が要求されたときは、前記登録部品情報に基づいて前記部品が前記結合部品に属するか否かを判定し、前記結合部品に属すると判定されたときは対応する前記結合部品を出力し、属する前記結合部品がないと判定されたときは前記部品を単独で出力する部品管理手段、として機能させることを特徴とする付記1〜8記載の文書作成支援プログラム。
(付記10) 文書の一部を部品として抽出して管理し、文書作成時の支援を行う文書作成支援方法において、
コンピュータが、
文書及び修正履歴情報データベースから文書及び前記文書の修正に関する文書修正履歴を取得し、前記文書を暫定的に分割した暫定部品を特徴付ける部品要素を抽出し、記憶手段に格納される登録部品情報に登録済みの登録済部品から抽出した部品要素と、前記暫定部品を特徴付ける部品要素とを照合して、所定の前記部品要素が一致する前記登録済部品が検出されたときは該登録済部品、検出されないときは新規部品、として前記文書に含まれる部品を特定する部品暫定作成手順と、
前記文書に含まれる部品ごとに、前記文書修正履歴に基づいて一定時間間隔ごとの該部品に対する修正量を時間軸に沿って並べたヒストグラムをスムージング処理して前記部品ごとの修正傾向を表す修正曲線を算出し、前記修正曲線が表す前記修正の傾向が重なる重なり量に応じた重なり度を算出する重なり度算出手順と、
関係の強い部品群を結合する結合ルールを用いて前記部品間の重なり度及び前記部品要素を評価し、前記結合ルールに基づいて結合部品と評価される部品群を選別し、前記部品群を前記結合部品として前記登録部品情報に登録する結合部品選別手順と、
を実行することを特徴とする文書作成支援方法。
(付記11) 文書の一部を部品として抽出して管理し、文書作成時の支援を行う文書作成支援装置において、
文書及び修正履歴情報データベースから文書及び前記文書の修正に関する文書修正履歴を取得し、前記文書を暫定的に分割した暫定部品を特徴付ける部品要素を抽出し、記憶手段に格納される登録部品情報に登録済みの登録済部品から抽出した部品要素と、前記暫定部品を特徴付ける部品要素とを照合して、所定の前記部品要素が一致する前記登録済部品が検出されたときは該登録済部品、検出されないときは新規部品、として前記文書に含まれる部品を特定する部品暫定作成手段と、
前記文書に含まれる部品ごとに、前記文書修正履歴に基づいて一定時間間隔ごとの該部品に対する修正量を時間軸に沿って並べたヒストグラムをスムージング処理して前記部品ごとの修正傾向を表す修正曲線を算出し、前記修正曲線が表す前記修正の傾向が重なる重なり量に応じた部品間の重なり度を算出する重なり度算出手段と、
関係の強い部品群を結合する結合ルールを用いて前記部品間の重なり度及び前記部品要素を評価し、前記結合ルールに基づいて結合部品と評価される部品群を選別し、前記部品群を前記結合部品として前記登録部品情報に登録する結合部品選別手段と、
を有することを特徴とする文書作成支援装置。
10 文書作成支援装置
11 記憶手段
11a 部品情報データベース(DB)
11b 文書情報データベース(DB)
11c 修正履歴情報データベース(DB)
12 部品暫定作成手段
13 重なり度算出手段
14 結合部品選別手段
15 部品管理手段
20 文書
30 文書修正履歴

Claims (5)

  1. 文書の一部を部品として抽出して管理し、文書作成時の支援を行うコンピュータを機能させる文書作成支援プログラムにおいて、
    前記コンピュータを、
    文書及び修正履歴情報データベースから文書及び前記文書の修正に関する文書修正履歴を取得し、前記文書を暫定的に分割した暫定部品を特徴付ける部品要素を抽出し、記憶手段に格納される登録部品情報に登録済みの登録済部品から抽出した部品要素と、前記暫定部品を特徴付ける部品要素とを照合して、所定の前記部品要素が一致する前記登録済部品が検出されたときは該登録済部品、検出されないときは新規部品、として前記文書に含まれる部品を特定する部品暫定作成手段、
    前記文書に含まれる部品ごとに、前記文書修正履歴に基づいて一定時間間隔ごとの該部品に対する修正量を時間軸に沿って並べたヒストグラムをスムージング処理して前記部品ごとの修正傾向を表す修正曲線を算出し、前記修正曲線が表す前記修正の傾向が重なる重なり量に応じた部品間の重なり度を算出する重なり度算出手段、
    関係の強い部品群を結合する結合ルールを用いて前記部品間の重なり度及び前記部品要素を評価し、前記結合ルールに基づいて結合部品と評価される部品群を選別し、前記部品群を前記結合部品として前記登録部品情報に登録する結合部品選別手段、
    として機能させることを特徴とする文書作成支援プログラム。
  2. 前記重なり度算出手段は、前記部品ごとの前記修正曲線が重なる重なり区間における前記修正曲線の最小値を積分して前記修正曲線が重なる重なり量を算出し、前記重なり量が全体の修正量に占める割合に応じて前記部品間の重なり度を算出する、ことを特徴とする請求項1記載の文書作成支援プログラム。
  3. 結合部品選別手段は、前記結合部品に新たな部品識別子を付与し、セットで使用される新たな部品として前記登録部品情報に登録する、ことを特徴とする請求項1または2記載の文書作成支援プログラム。
  4. 文書の一部を部品として抽出して管理し、文書作成時の支援を行う文書作成支援方法において、
    コンピュータが、
    文書及び修正履歴情報データベースから文書及び前記文書の修正に関する文書修正履歴を取得し、前記文書を暫定的に分割した暫定部品を特徴付ける部品要素を抽出し、記憶手段に格納される登録部品情報に登録済みの登録済部品から抽出した部品要素と、前記暫定部品を特徴付ける部品要素とを照合して、所定の前記部品要素が一致する前記登録済部品が検出されたときは該登録済部品、検出されないときは新規部品、として前記文書に含まれる部品を特定する部品暫定作成手順と、
    前記文書に含まれる部品ごとに、前記文書修正履歴に基づいて一定時間間隔ごとの該部品に対する修正量を時間軸に沿って並べたヒストグラムをスムージング処理して前記部品ごとの修正傾向を表す修正曲線を算出し、前記修正曲線が表す前記修正の傾向が重なる重なり量に応じた重なり度を算出する重なり度算出手順と、
    関係の強い部品群を結合する結合ルールを用いて前記部品間の重なり度及び前記部品要素を評価し、前記結合ルールに基づいて結合部品と評価される部品群を選別し、前記部品群を前記結合部品として前記登録部品情報に登録する結合部品選別手順と、
    を実行することを特徴とする文書作成支援方法。
  5. 文書の一部を部品として抽出して管理し、文書作成時の支援を行う文書作成支援装置において、
    文書及び修正履歴情報データベースから文書及び前記文書の修正に関する文書修正履歴を取得し、前記文書を暫定的に分割した暫定部品を特徴付ける部品要素を抽出し、記憶手段に格納される登録部品情報に登録済みの登録済部品から抽出した部品要素と、前記暫定部品を特徴付ける部品要素とを照合して、所定の前記部品要素が一致する前記登録済部品が検出されたときは該登録済部品、検出されないときは新規部品、として前記文書に含まれる部品を特定する部品暫定作成手段と、
    前記文書に含まれる部品ごとに、前記文書修正履歴に基づいて一定時間間隔ごとの該部品に対する修正量を時間軸に沿って並べたヒストグラムをスムージング処理して前記部品ごとの修正傾向を表す修正曲線を算出し、前記修正曲線が表す前記修正の傾向が重なる重なり量に応じた部品間の重なり度を算出する重なり度算出手段と、
    関係の強い部品群を結合する結合ルールを用いて前記部品間の重なり度及び前記部品要素を評価し、前記結合ルールに基づいて結合部品と評価される部品群を選別し、前記部品群を前記結合部品として前記登録部品情報に登録する結合部品選別手段と、
    を有することを特徴とする文書作成支援装置。
JP2009113330A 2009-05-08 2009-05-08 文書作成支援プログラム、文書作成支援方法及び文書作成支援装置 Withdrawn JP2010262502A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009113330A JP2010262502A (ja) 2009-05-08 2009-05-08 文書作成支援プログラム、文書作成支援方法及び文書作成支援装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009113330A JP2010262502A (ja) 2009-05-08 2009-05-08 文書作成支援プログラム、文書作成支援方法及び文書作成支援装置

Publications (1)

Publication Number Publication Date
JP2010262502A true JP2010262502A (ja) 2010-11-18

Family

ID=43360507

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009113330A Withdrawn JP2010262502A (ja) 2009-05-08 2009-05-08 文書作成支援プログラム、文書作成支援方法及び文書作成支援装置

Country Status (1)

Country Link
JP (1) JP2010262502A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012160093A (ja) * 2011-02-01 2012-08-23 Fujitsu Ltd 通知対象決定プログラム、通知対象決定装置、および通知対象決定方法
JP5267711B1 (ja) * 2012-08-30 2013-08-21 富士ゼロックス株式会社 文書管理装置及びプログラム
JP2019082854A (ja) * 2017-10-30 2019-05-30 三菱電機株式会社 情報処理装置、情報処理方法及び情報処理プログラム
JP2020060971A (ja) * 2018-10-10 2020-04-16 富士通株式会社 分類プログラム、分類方法および分類装置
JP2021082111A (ja) * 2019-11-21 2021-05-27 富士フイルムビジネスイノベーション株式会社 情報処理システム、情報処理装置、および、プログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012160093A (ja) * 2011-02-01 2012-08-23 Fujitsu Ltd 通知対象決定プログラム、通知対象決定装置、および通知対象決定方法
JP5267711B1 (ja) * 2012-08-30 2013-08-21 富士ゼロックス株式会社 文書管理装置及びプログラム
US9104652B2 (en) 2012-08-30 2015-08-11 Fuji Xerox Co., Ltd. Deleting a document from a document group based on time conditions
JP2019082854A (ja) * 2017-10-30 2019-05-30 三菱電機株式会社 情報処理装置、情報処理方法及び情報処理プログラム
JP2020060971A (ja) * 2018-10-10 2020-04-16 富士通株式会社 分類プログラム、分類方法および分類装置
JP7219396B2 (ja) 2018-10-10 2023-02-08 富士通株式会社 分類プログラム、分類方法および分類装置
JP2021082111A (ja) * 2019-11-21 2021-05-27 富士フイルムビジネスイノベーション株式会社 情報処理システム、情報処理装置、および、プログラム

Similar Documents

Publication Publication Date Title
US7640532B2 (en) Mapping software code to business logic
US7562088B2 (en) Structure extraction from unstructured documents
US20080312992A1 (en) Automatic business process creation method using past business process resources and existing business process
US20100121859A1 (en) Workflow management system, workflow management control method, and computer-readable recording medium storing workflow management control program
US20080162455A1 (en) Determination of document similarity
US20100042745A1 (en) Workflow diagram generation program, apparatus and method
JP4904878B2 (ja) システム開発支援プログラム、システム開発支援装置およびシステム開発支援方法
JP2010262502A (ja) 文書作成支援プログラム、文書作成支援方法及び文書作成支援装置
JP6008693B2 (ja) 情報処理装置及びその制御方法、プログラム
JP7456137B2 (ja) 情報処理装置及びプログラム
US8201174B2 (en) Technique of determining performing order of processes
US20100077382A1 (en) Computer-readable recording medium string a bug detection support program, similar structure identification information list output program, bug detection support apparatus, and bug detection support method
JP2008204405A (ja) ソフトウェアのリグレッションテストシステム、リグレッションテストプログラムおよびリグレッションテスト方法
US11328024B2 (en) Data analysis device and data analysis method
CN111444312A (zh) 一种多平台联合检索专利的方法和装置
JP5233587B2 (ja) 業務フロー分析プログラム、方法及び装置
JP2021089664A (ja) 情報処理装置及びプログラム
JP4383409B2 (ja) 情報処理装置及びその制御方法、プログラム、並びに記録媒体
JP5168099B2 (ja) 改修作業範囲分割プログラム,改修作業範囲分割装置,及び改修作業範囲分割方法
JP4906424B2 (ja) Webサービス設計方法及び装置
JP6695847B2 (ja) ソフトウェア部品管理システム、計算機
JP4559448B2 (ja) 文書群組合せ装置
JP2009301447A (ja) 情報処理装置
JP2009205372A (ja) 情報処理装置及び情報処理方法及びプログラム
JP2008021256A (ja) 情報共有システム及びプログラム

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20120807