JP2009181189A - 文書チェックルール作成支援装置 - Google Patents
文書チェックルール作成支援装置 Download PDFInfo
- Publication number
- JP2009181189A JP2009181189A JP2008017748A JP2008017748A JP2009181189A JP 2009181189 A JP2009181189 A JP 2009181189A JP 2008017748 A JP2008017748 A JP 2008017748A JP 2008017748 A JP2008017748 A JP 2008017748A JP 2009181189 A JP2009181189 A JP 2009181189A
- Authority
- JP
- Japan
- Prior art keywords
- check
- check rule
- rule
- document
- partial structure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
Abstract
【課題】従来、作成文書チェック用のルール作成には、暫定的なチェック条件を作り、該チェック条件を所定文書と照合して、修正を加える手順を繰り返して所望の精度を得るが、この方法は煩雑であった。
【解決手段】文書と照合するためのチェック条件と、該チェック条件が文書と合致したとき文書作成者に対し提示するメッセージとが合わされたチェックルールが予め作成されて格納されたチェックルール記憶部と、チェックルールを検索する検索条件を取得するチェックルール検索入力部と、チェックルール記憶部のチェックルールを、チェックルール検索入力部からの検索条件に合致するものと、合致しないものに弁別するチェックルール弁別部と、弁別されたチェックルールからチェック条件の部分構造を抽出する部分構造抽出部とを備える。
【選択図】図1
【解決手段】文書と照合するためのチェック条件と、該チェック条件が文書と合致したとき文書作成者に対し提示するメッセージとが合わされたチェックルールが予め作成されて格納されたチェックルール記憶部と、チェックルールを検索する検索条件を取得するチェックルール検索入力部と、チェックルール記憶部のチェックルールを、チェックルール検索入力部からの検索条件に合致するものと、合致しないものに弁別するチェックルール弁別部と、弁別されたチェックルールからチェック条件の部分構造を抽出する部分構造抽出部とを備える。
【選択図】図1
Description
この発明は、文書チェックルールの作成作業を支援するための、チェックルール作成支援装置に関するものであり、本装置を利用して作成されたチェックルールは、専用の文書作成支援装置に読み込まれ、業務においてユーザが作成する文書のチェックとガイダンスメッセージの提示のために利用される。
業務で文書を作成する際には、その内容をチェックして警告やガイダンスを提示してくれる支援装置を利用することにより、作業を効率化したり、記載の不備を削減したりすることが可能である。そのような文書作成支援装置の例として特開2007-26418号公報「文書作成支援装置」(特許文献1)に記載のものがある。
上記特許文献1に記載の文書作成支援装置は、あらかじめ作成されたチェックルールに従って動作している。チェックルールはチェック条件とメッセージとから構成されており、該装置は、文書に記載された内容がチェック条件と合致するときに、対応するメッセージをガイダンスとしてユーザに提示している。
業務において文書に記載される内容や注意すべき事項は一般に日々変化するから、文書作成支援装置に有用なガイダンスを提示させ続けるためには、チェックルールの追加や更新作業を継続的に実施する必要がある。
しかし、こうした作業を継続的に実施するとなると、装置の開発者が常にサポートするわけにはいかないため、チェックルールの追加更新作業は、ユーザ(ユーザ部署)が自身で実施できる必要がある。多機能なチェックルールを扱う文書作成支援装置ではなおさら、チェックルールの作成を支援するツールが不可欠である。
上記特許文献1に記載の文書作成支援装置は、あらかじめ作成されたチェックルールに従って動作している。チェックルールはチェック条件とメッセージとから構成されており、該装置は、文書に記載された内容がチェック条件と合致するときに、対応するメッセージをガイダンスとしてユーザに提示している。
業務において文書に記載される内容や注意すべき事項は一般に日々変化するから、文書作成支援装置に有用なガイダンスを提示させ続けるためには、チェックルールの追加や更新作業を継続的に実施する必要がある。
しかし、こうした作業を継続的に実施するとなると、装置の開発者が常にサポートするわけにはいかないため、チェックルールの追加更新作業は、ユーザ(ユーザ部署)が自身で実施できる必要がある。多機能なチェックルールを扱う文書作成支援装置ではなおさら、チェックルールの作成を支援するツールが不可欠である。
チェックルールの作成支援装置としては、従来特開2007-172260号公報に記載のものがある。
特開2007-172260号公報「文書ルール作成支援装置および文書ルール作成支援方法並びに文書ルール作成支援プログラム」に記載のものでは、まず暫定的なチェック条件を作成した後、該チェック条件を所定の文書と照合してみて、照合結果に応じチェック条件に修正を加える、という手順を所望の精度が得られるまで繰り返すことにより、チェック条件を作成する方法が述べられている。
特開2007-172260号公報「文書ルール作成支援装置および文書ルール作成支援方法並びに文書ルール作成支援プログラム」に記載のものでは、まず暫定的なチェック条件を作成した後、該チェック条件を所定の文書と照合してみて、照合結果に応じチェック条件に修正を加える、という手順を所望の精度が得られるまで繰り返すことにより、チェック条件を作成する方法が述べられている。
上記特許文献2では、まず暫定的なチェック条件を作成した後、該チェック条件を所定の文書と照合してみて、照合結果に応じチェック条件に修正を加える、という手順を所望の精度が得られるまで繰り返すことにより、チェック条件を作成する方法が述べられている。
しかし、この方法は煩雑であり、ユーザが手間をかけずにチェックルールを作成できるようにするという目的には供さない。
この発明は上記のような問題点を解決するためになされたもので、チェックルールの作成における、特にチェック条件の作成を省力化する文書チェックルール作成支援装置を得ることを目的とする。
しかし、この方法は煩雑であり、ユーザが手間をかけずにチェックルールを作成できるようにするという目的には供さない。
この発明は上記のような問題点を解決するためになされたもので、チェックルールの作成における、特にチェック条件の作成を省力化する文書チェックルール作成支援装置を得ることを目的とする。
この発明による文書チェックルール作成支援装置は、文書と照合するためのチェック条件と、該チェック条件が文書と合致したとき文書作成者に対し提示するメッセージとが合わされてチェックルールとされ、このチェックルールが予め作成されて格納されたチェックルール記憶部と、チェックルールを検索する検索条件を取得するチェックルール検索入力部と、チェックルール記憶部のチェックルールを、チェックルール検索入力部からの検索条件に合致するものと、合致しないものに弁別するチェックルール弁別部と、弁別されたチェックルールからチェック条件の部分構造を抽出する部分構造抽出部とを備える。
この発明の文書チェックルール作成支援装置によれば、チェックルール記憶部に予め作成され、格納されたチェックルールをチェックルール検索入力部から入力された検索条件でチェックルール弁別部が弁別し、部分構造抽出部がチェック条件の部分構造を抽出してチェック条件の候補とすることができるので、チェックルール記憶部の作成済みチェックルールを流用することで新規チェックルールを簡単に作成することが可能になる。
実施の形態1.
まず、この発明による装置が支援しようとする文書チェックルールの作成作業とはいかなる作業であるかについて説明する。
一般に、業務において仕様書などの文書を作成する際には、文書の記載内容に抜け・誤りがないかを確認する文書チェック作業が付随して実施される。
図2は、そうした文書チェック作業で用いられるチェックリストの例である。文書作成作業者は、完成した文書を提出する際、本チェックリストと文書の記載内容を突き合わせる。その結果、記載内容に問題が無ければ結果記入欄にレ点などの確認結果を記入し、問題があれば適宜文書を加筆・修正する。
このような人手による文書チェック作業は、一般に実施されているが、文書作成後にまとめてチェック項目を確認する形態となるために、
(1)問題点の見落としが生じやすい。
(2)不備が見つかったとき見直し・修正が必要になる範囲(手戻り)が大きくなりやすい。
などの問題がある。
まず、この発明による装置が支援しようとする文書チェックルールの作成作業とはいかなる作業であるかについて説明する。
一般に、業務において仕様書などの文書を作成する際には、文書の記載内容に抜け・誤りがないかを確認する文書チェック作業が付随して実施される。
図2は、そうした文書チェック作業で用いられるチェックリストの例である。文書作成作業者は、完成した文書を提出する際、本チェックリストと文書の記載内容を突き合わせる。その結果、記載内容に問題が無ければ結果記入欄にレ点などの確認結果を記入し、問題があれば適宜文書を加筆・修正する。
このような人手による文書チェック作業は、一般に実施されているが、文書作成後にまとめてチェック項目を確認する形態となるために、
(1)問題点の見落としが生じやすい。
(2)不備が見つかったとき見直し・修正が必要になる範囲(手戻り)が大きくなりやすい。
などの問題がある。
これに対し、機械による支援を利用して上記問題を解決する方法が、前記特許文献1に記載されている。特許文献1記載の方法によれば、図2のチェックリストの内容を所定の形式で電子化されたチェックルールとして予め登録しておくことで、作業者がワードプロセッサなどを利用して文書を作成している最中に、文書の記載内容に合致するチェック項目だけを自動選択し、ガイダンスとして作業者の画面上に表示ことが可能である。同装置による文書作成支援の例を図3に示す。
上記特許文献1記載の文書作成支援装置は、あらかじめ作成された複数のチェックルールに従って動作している。チェックルールの例を図4に示す。このチェックルールはメッセージとチェック条件とから構成されている。上記の文書作成支援装置は、文書に記載された内容がチェック条件と合致するときに、対応するメッセージをガイダンスとしてユーザに提示している。
図4に例示するチェックルールは、チェック対象文書に「外部供給電源」の記載があり、かつ、章(節)見出しである「3.1 電源回路部」に「回路」の記載が含まれるため、チェック条件が合致している。そのため、このチェックルールのメッセージ「異種電源の接続に問題はないか」がガイダンスとして表示されている。
このようなしくみで動作する文書作成支援装置では、いかに手間なくチェックルールを作成・保守できるかが重要である。
図4の左側のフローは、チェックルール作成作業の例を示している。チェックリストの改訂により新たなチェック項目として「異種電源の接続に問題はないか」が追加されたため、これに対応するチェックルールを作業者が作成する。
このチェック項目自体は、「異種電源」が使われているときに注意を促すものであるが、実際には文書中で異種電源を使っていることが明記されないため、「給電切替」「交互通電」などの記載があるときにメッセージが表示されるように配慮してチェック条件が作成されている。
図4の左側のフローは、チェックルール作成作業の例を示している。チェックリストの改訂により新たなチェック項目として「異種電源の接続に問題はないか」が追加されたため、これに対応するチェックルールを作業者が作成する。
このチェック項目自体は、「異種電源」が使われているときに注意を促すものであるが、実際には文書中で異種電源を使っていることが明記されないため、「給電切替」「交互通電」などの記載があるときにメッセージが表示されるように配慮してチェック条件が作成されている。
このように、文書作成中に的確なメッセージを表示させるためには、文書中でどのように記載されるかを考慮してチェック条件を作り込む必要があり、チェックルールの作成作業は、手間と、業務内容についての深い知識を要する作業となっている。
業務において文書に記載される内容や注意すべき事項は一般に日々変化するため、チェックルール作成作業を継続的に実施するとなると、装置の開発者が常にサポートするわけにはいかず、ユーザ(ユーザ部署)が自身で実施する必要がある。
以上から、上記の文書作成支援装置では、チェックルールの作成を支援するツールが不可欠である。
業務において文書に記載される内容や注意すべき事項は一般に日々変化するため、チェックルール作成作業を継続的に実施するとなると、装置の開発者が常にサポートするわけにはいかず、ユーザ(ユーザ部署)が自身で実施する必要がある。
以上から、上記の文書作成支援装置では、チェックルールの作成を支援するツールが不可欠である。
次に、この発明による支援処理の概要を説明する。
図5において、チェックルール作成作業者は、チェック項目「異種電源の接続に問題はないか」に対応するチェックルールを新規に作成しようとしている。
このとき作業者は、この発明によるチェックルール作成支援機能に対して、キーワード「異種電源」を入力する。すると本装置は、過去に作成されたチェックルールを調べて、メッセージに「異種電源」を含むチェックルール群のチェック条件において、偏って出現している部分構造を抽出し、チェック条件の候補として作業者に提示する。
図5において、チェックルール作成作業者は、チェック項目「異種電源の接続に問題はないか」に対応するチェックルールを新規に作成しようとしている。
このとき作業者は、この発明によるチェックルール作成支援機能に対して、キーワード「異種電源」を入力する。すると本装置は、過去に作成されたチェックルールを調べて、メッセージに「異種電源」を含むチェックルール群のチェック条件において、偏って出現している部分構造を抽出し、チェック条件の候補として作業者に提示する。
図5では部分構造の候補として、網掛のふき出しで囲んだ部分木が抽出され、作業者に提示されている。
作業者は、提示された部分構造が適当であると判断すれば、これをコピーして新規に作成中のチェックルールの条件に流用する。以上の操作を必要に応じキーワードを変えて繰り返したり、コピーした部分構造を適宜修正することにより、チェック条件の全部ないし大部分を作成することができる。
すなわちこの発明によれば、作成済みのチェックルールが一定量存在する場合に、それを流用することで新規チェックルールを簡単に作成することが可能である。
なお、この発明で前提としている一定量の作成済みチェックルールは、初期的には、文書作成支援装置の開発者と、同装置を導入する部署の業務識者とが協力して、運用開始前に、チェックリストからまとめて作成・登録することを想定している。この初期チェックルール作成作業の容易性は、運用開始後ほど要求されない。
作業者は、提示された部分構造が適当であると判断すれば、これをコピーして新規に作成中のチェックルールの条件に流用する。以上の操作を必要に応じキーワードを変えて繰り返したり、コピーした部分構造を適宜修正することにより、チェック条件の全部ないし大部分を作成することができる。
すなわちこの発明によれば、作成済みのチェックルールが一定量存在する場合に、それを流用することで新規チェックルールを簡単に作成することが可能である。
なお、この発明で前提としている一定量の作成済みチェックルールは、初期的には、文書作成支援装置の開発者と、同装置を導入する部署の業務識者とが協力して、運用開始前に、チェックリストからまとめて作成・登録することを想定している。この初期チェックルール作成作業の容易性は、運用開始後ほど要求されない。
この発明の実施の形態1による文書作成支援装置の構成を図1に示す。
機能ブロック101〜103はチェックルールを作成するための基本機能を構成しているチェックルール作成基本機能部である。
メッセージ編集部101は、ユーザのキーボード、マウスなどの入力操作により、チェックルールのメッセージ部分を編集する。
チェック条件編集部102は、ユーザのキーボード、マウスなどの入力操作により、チェックルールのチェック条件部分を編集する。
チェックルール記憶部103は、過去に作成されたチェックルールを格納している。
機能ブロック101〜103はチェックルールを作成するための基本機能を構成しているチェックルール作成基本機能部である。
メッセージ編集部101は、ユーザのキーボード、マウスなどの入力操作により、チェックルールのメッセージ部分を編集する。
チェック条件編集部102は、ユーザのキーボード、マウスなどの入力操作により、チェックルールのチェック条件部分を編集する。
チェックルール記憶部103は、過去に作成されたチェックルールを格納している。
一方、機能ブロック104〜106はチェックルールの作成を容易化する支援機能を構成するチェックルール作成支援機能部である。
チェックルール検索入力部104は、ユーザの入力する検索条件を受け付けるためのブロックである。本検索条件は、チェックルール記憶部103から、ユーザが作成しようとするルールに関係しそうなものを検索するキーとしてキーワードやキーワード列が用いられる。
チェックルール弁別部105は、チェックルール記憶部103のチェックルールを、チェックルール検索入力部104からの検索条件に合致するものと、合致しないものに弁別する。
部分構造抽出部106は、弁別されたチェックルールから、チェック条件の部分構造の出現頻度を調べて、一方に偏って出現するチェック条件の部分構造を出力する。
チェックルール検索入力部104は、ユーザの入力する検索条件を受け付けるためのブロックである。本検索条件は、チェックルール記憶部103から、ユーザが作成しようとするルールに関係しそうなものを検索するキーとしてキーワードやキーワード列が用いられる。
チェックルール弁別部105は、チェックルール記憶部103のチェックルールを、チェックルール検索入力部104からの検索条件に合致するものと、合致しないものに弁別する。
部分構造抽出部106は、弁別されたチェックルールから、チェック条件の部分構造の出現頻度を調べて、一方に偏って出現するチェック条件の部分構造を出力する。
次に動作について説明する。
新規チェックルールを作成するとき、作業者はチェックルールのメッセージとチェック条件の両方を作成する。本実施の形態において、作成する順番はいずれが先であっても構わない。
メッセージとなるテキストは、作業者がメッセージ編集部101より、キーボードやマウスを使って入力する。入力されたメッセージは、チェックルール記憶部103に保存される。
チェック条件は、作業者がチェック条件編集部102より、キーボードやマウス入力で作成する。作成されたチェック条件はチェックルール記憶部103に保存される。
チェック条件は、以下いずれかの方法で作業者が作成する。
(方法1)照合条件を構成する木構造のノードなどを、1つ1つ新規に作成する方法。
(方法2)過去に作成したチェックルールを検索して絞り込み、流用して作成する方法。
(方法2a)検索して絞り込んだチェックルールが数件の場合、その中から目視により流用できそうなチェック条件を探し、一部ないし全部をコピーして作成する方法。
(方法2b)検索して絞り込んだチェックルールが多数件あって方法2aが困難な場合、装置に解析させて、流用できそうなチェック条件の部分構造を抽出し、得られた部分構造からコピーして作成する方法。
新規チェックルールを作成するとき、作業者はチェックルールのメッセージとチェック条件の両方を作成する。本実施の形態において、作成する順番はいずれが先であっても構わない。
メッセージとなるテキストは、作業者がメッセージ編集部101より、キーボードやマウスを使って入力する。入力されたメッセージは、チェックルール記憶部103に保存される。
チェック条件は、作業者がチェック条件編集部102より、キーボードやマウス入力で作成する。作成されたチェック条件はチェックルール記憶部103に保存される。
チェック条件は、以下いずれかの方法で作業者が作成する。
(方法1)照合条件を構成する木構造のノードなどを、1つ1つ新規に作成する方法。
(方法2)過去に作成したチェックルールを検索して絞り込み、流用して作成する方法。
(方法2a)検索して絞り込んだチェックルールが数件の場合、その中から目視により流用できそうなチェック条件を探し、一部ないし全部をコピーして作成する方法。
(方法2b)検索して絞り込んだチェックルールが多数件あって方法2aが困難な場合、装置に解析させて、流用できそうなチェック条件の部分構造を抽出し、得られた部分構造からコピーして作成する方法。
方法1で作成する場合は、チェック条件編集部102に対する作業者のキーボード入力やマウス入力だけで作成可能である。
一方、方法2で作成する場合は、機能ブロック104〜106を用いる。
まず、作業者は、チェックルール検索入力部104において、過去に作成され、チェックルール記憶部103に格納されたチェックルールを絞り込むための検索キーを入力する。検索キーは、図5に例示したようなキーワードやキーワード列でよい。あるいは、チェックルールに分類カテゴリや属性などの情報が付いている場合はそうした情報を検索キーとして利用してもよい。
検索キーが入力されると、チェックルール弁別部105は、チェックルール記憶部103に記憶されたチェックルールを検索キーと比較照合し、検索キーとマッチするものとマッチしないものとに弁別する。
なお、キーワードやキーワード列を検索キーとするとき、比較照合の対象はチェックルールのメッセージだけに限定せず、チェック条件を含めても良い。
検索キーにマッチしたチェックルールの一覧は作業者に表示される。
一方、方法2で作成する場合は、機能ブロック104〜106を用いる。
まず、作業者は、チェックルール検索入力部104において、過去に作成され、チェックルール記憶部103に格納されたチェックルールを絞り込むための検索キーを入力する。検索キーは、図5に例示したようなキーワードやキーワード列でよい。あるいは、チェックルールに分類カテゴリや属性などの情報が付いている場合はそうした情報を検索キーとして利用してもよい。
検索キーが入力されると、チェックルール弁別部105は、チェックルール記憶部103に記憶されたチェックルールを検索キーと比較照合し、検索キーとマッチするものとマッチしないものとに弁別する。
なお、キーワードやキーワード列を検索キーとするとき、比較照合の対象はチェックルールのメッセージだけに限定せず、チェック条件を含めても良い。
検索キーにマッチしたチェックルールの一覧は作業者に表示される。
このとき、マッチしたチェックルールの件数が少なければ、作業者は個々のチェックルールの内容を確認することが可能である。その結果、もし流用できそうなチェック条件が見つかったら、その一部ないし全部をコピーして、新規に作成するルールにペーストする。ペーストした部分構造は適宜修正することができる。
逆に、マッチしたチェックルールの件数が多い場合は目視で内容を一つ一つ確認することが困難になる。そこで部分構造抽出部106により、統計的な方法で流用できそうな部分構造を抽出し作業者に提示する。
逆に、マッチしたチェックルールの件数が多い場合は目視で内容を一つ一つ確認することが困難になる。そこで部分構造抽出部106により、統計的な方法で流用できそうな部分構造を抽出し作業者に提示する。
以下、チェックルール作成支援機能部による部分構造抽出処理の内容を図6を用いて説明する。
チェックルール記憶部103には、過去に作成された全てのチェックルールが入っている。これをチェックルールの集合R0とする。
Step1では、作業者(ユーザ)がチェックルール検索入力部104からキーワード「異種電源」を入力する。
Step2では、チェックルール弁別部105が作業者(ユーザ)が入力したキーワード「異種電源」をチェックルール記憶部103に格納された各チェックルールのメッセージと比較照合して、全集合R0を、キーワード「異種電源」を含むチェックルールの含有集合R1とキーワード「異種電源」を含まない否含有集合R2とに分ける。
Step3では、部分構造抽出部106が含有集合R1および否含有集合R2における、チェック条件の部分構造の出現頻度(=その部分構造を含むチェックルールの数)を調べる。
チェックルール記憶部103には、過去に作成された全てのチェックルールが入っている。これをチェックルールの集合R0とする。
Step1では、作業者(ユーザ)がチェックルール検索入力部104からキーワード「異種電源」を入力する。
Step2では、チェックルール弁別部105が作業者(ユーザ)が入力したキーワード「異種電源」をチェックルール記憶部103に格納された各チェックルールのメッセージと比較照合して、全集合R0を、キーワード「異種電源」を含むチェックルールの含有集合R1とキーワード「異種電源」を含まない否含有集合R2とに分ける。
Step3では、部分構造抽出部106が含有集合R1および否含有集合R2における、チェック条件の部分構造の出現頻度(=その部分構造を含むチェックルールの数)を調べる。
ここでチェック条件の部分構造とは、図6中の三角形で示される任意の部分木であり、図5においては、●で示される任意のノードを起点とし、それより右側にある子孫ノードを含む部分木である。右側にある子孫ノードとは、本実施の形態においては単純にリーフノードまでを含む完全な部分木のみを指すこととするが、不完全な部分木を含む網羅的な探索を行なうことにより抽出漏れを防ぐことが可能である。部分木の例を図7に示す。
部分木の出現頻度を数えるとき、等価な構造を持つ木構造は全てひとまとめにして頻度を数える。本実施の形態においては、図8の木構造1と木構造2のように、兄弟ノードの順番は異なっても良いが、ノードのラベルは完全一致する場合を等価な木構造として扱う。しかし、これに限定するものではなく、例えば別途定義した同義語辞書を利用することにより、木構造3も木構造1や木構造2と等価として判定して、抽出精度を高めることが可能である。
部分木の出現頻度を数えるとき、等価な構造を持つ木構造は全てひとまとめにして頻度を数える。本実施の形態においては、図8の木構造1と木構造2のように、兄弟ノードの順番は異なっても良いが、ノードのラベルは完全一致する場合を等価な木構造として扱う。しかし、これに限定するものではなく、例えば別途定義した同義語辞書を利用することにより、木構造3も木構造1や木構造2と等価として判定して、抽出精度を高めることが可能である。
部分構造抽出部106による部分木の出現頻度カウント処理の流れを図9に示す。
本処理は、上述のチェックルール含有集合R1、否含有集合R2に対してそれぞれ実施する。あるいは、本処理を予めチェックルールの全集合R0において実施しておき、含有集合R1、否含有集合R2との対応付けは別に持たせる方法であってもよく、その場合は作業者に対するレスポンスを高めることができる。
本処理は、上述のチェックルール含有集合R1、否含有集合R2に対してそれぞれ実施する。あるいは、本処理を予めチェックルールの全集合R0において実施しておき、含有集合R1、否含有集合R2との対応付けは別に持たせる方法であってもよく、その場合は作業者に対するレスポンスを高めることができる。
ステップS1では、部分木の出現頻度を記憶するカウント用ハッシュテーブルを初期化する(クリアする)。
ステップS2では終了判定を行なう。ステップS3以降の処理が、対象としている全てのチェックルールについて完了していれば処理を終了する。未完了であればステップS3に進む。
ステップS3では、未処理のチェックルールを1つ、チェックルール記憶部103から読み出す。
ステップS4では、重複判定用ハッシュテーブルを初期化する(クリアする)。このハッシュテーブルは、1つのチェックルールから等価な部分木を複数回カウントしないようにするために用いる。
ステップS5では終了判定を行なう。ステップS6以降の処理が、当該チェックルールのチェック条件に含まれるすべてのノードについて完了していたら、ステップS2に戻る。未完了であれば、ステップS6に進む。
ステップS2では終了判定を行なう。ステップS3以降の処理が、対象としている全てのチェックルールについて完了していれば処理を終了する。未完了であればステップS3に進む。
ステップS3では、未処理のチェックルールを1つ、チェックルール記憶部103から読み出す。
ステップS4では、重複判定用ハッシュテーブルを初期化する(クリアする)。このハッシュテーブルは、1つのチェックルールから等価な部分木を複数回カウントしないようにするために用いる。
ステップS5では終了判定を行なう。ステップS6以降の処理が、当該チェックルールのチェック条件に含まれるすべてのノードについて完了していたら、ステップS2に戻る。未完了であれば、ステップS6に進む。
ステップS6では、未処理のノードを1つ取り出す。
ステップS7では、当該ノードを起点とし、当該ノード以下のすべてのリーフノードを含む完全な部分木を取り出す。
ステップS8では、重複判定を行なう。もし、当該部分木と等価な部分木が重複判定用ハッシュテーブルに登録されていたら、以降の処理をスキップしてステップS5に戻る。一方、もしハッシュテーブルに登録されていない場合はステップS9に進む。
ステップS9では、当該部分木を重複判定用ハッシュテーブルに登録する。
ステップS10では、カウント用ハッシュテーブルに、当該部分木と等価なエントリがあるか調べる。もしエントリがあれば、ステップS11に進み、その頻度カウントを1増加させてから、ステップS5に戻り、処理を繰り返す。もしエントリがなければ、ステップS12に進み、当該部分木をカウント用ハッシュに登録して頻度カウントを1に設定し、ステップS5に戻って処理を繰り返す。
ステップS7では、当該ノードを起点とし、当該ノード以下のすべてのリーフノードを含む完全な部分木を取り出す。
ステップS8では、重複判定を行なう。もし、当該部分木と等価な部分木が重複判定用ハッシュテーブルに登録されていたら、以降の処理をスキップしてステップS5に戻る。一方、もしハッシュテーブルに登録されていない場合はステップS9に進む。
ステップS9では、当該部分木を重複判定用ハッシュテーブルに登録する。
ステップS10では、カウント用ハッシュテーブルに、当該部分木と等価なエントリがあるか調べる。もしエントリがあれば、ステップS11に進み、その頻度カウントを1増加させてから、ステップS5に戻り、処理を繰り返す。もしエントリがなければ、ステップS12に進み、当該部分木をカウント用ハッシュに登録して頻度カウントを1に設定し、ステップS5に戻って処理を繰り返す。
ある部分構造(部分木)が含有集合R1に偏って出現しているか否かは、例えば公知のΧ2乗検定により下記の通り判定することができる。ただし、必ずしもこれに限定するものではなく、例えば公知の相互情報量を求めて予め設定した閾値と比較して判定することも可能である。
本検定におけるΧ2乗値は次式1で計算される。式中、|R0|, |R0+|, |R0-|はそれぞれ、チェックルールの全集合R0に含まれるチェックルールの個数、全集合R0において該部分構造を含むチェックルールの個数、および、該部分構造を含まないチェックルールの個数を表わしている。同様に、|R1|, |R1+|, |R1-|は、チェックルールの含有集合R1に含まれるチェックルールの個数、含有集合R1において該部分構造を含むチェックルールの個数、および、該部分構造を含まないチェックルールの個数を表わしている。
本検定におけるΧ2乗値は次式1で計算される。式中、|R0|, |R0+|, |R0-|はそれぞれ、チェックルールの全集合R0に含まれるチェックルールの個数、全集合R0において該部分構造を含むチェックルールの個数、および、該部分構造を含まないチェックルールの個数を表わしている。同様に、|R1|, |R1+|, |R1-|は、チェックルールの含有集合R1に含まれるチェックルールの個数、含有集合R1において該部分構造を含むチェックルールの個数、および、該部分構造を含まないチェックルールの個数を表わしている。
例えば、|R0| が500個あり、ある部分構造について|R0+| が50個、|R0-| が450個あり、「異種電源」で検索したときには、|R1| が20個、|R1+| が10個、|R1-|が10個であったとする。このとき、Χ2乗値は 35.5 となる。この場合の自由度は1であり、自由度1におけるΧ2乗値35.5は、有意水準5%(片側)におけるΧ2乗値3.841よりも大きい。このことから、この部分構造は、メッセージ中に「異種電源」を含むチェックルールに偏って多く使われていることが分かる。
以上のようにして抽出した部分構造を、チェックルール作成作業時に、チェック条件の候補として提示する。作業者は提示された候補の中に適当な部分構造があれば、それをコピーして新規作成中のチェックルールに流用することにより、チェック条件の要素を1つ1つ作成し構成することなく、簡単にチェック条件を作成することが可能となる。
なお、上述の実施の形態においては、検定により出現頻度に有意差がある部分構造を抽出・提示する方法を示したが、例えば提示する候補の個数を予めN個と定め、Χ2乗値や相互情報量などのスコアで上位N個を提示する方法でも良い。
また、上述の実施の形態においては、チェックルールの含有集合R1を求める際に、作業者が検索キーとして入力したキーワードだけを用いて絞り込んだが、既にチェック条件編集部に部分構造を入力している場合には、含有集合R1の中でさらに入力済みの該部分構造を含むチェックルールの集合 R1' (⊆ R1)を用いるようにすることができる。このようにすることで、該入力済みの部分構造と組み合わせて使うとき適当な部分構造を候補として提示することが可能であり、作業者の作業負荷をさらに軽減することが可能である。
なお、上述の実施の形態においては、検定により出現頻度に有意差がある部分構造を抽出・提示する方法を示したが、例えば提示する候補の個数を予めN個と定め、Χ2乗値や相互情報量などのスコアで上位N個を提示する方法でも良い。
また、上述の実施の形態においては、チェックルールの含有集合R1を求める際に、作業者が検索キーとして入力したキーワードだけを用いて絞り込んだが、既にチェック条件編集部に部分構造を入力している場合には、含有集合R1の中でさらに入力済みの該部分構造を含むチェックルールの集合 R1' (⊆ R1)を用いるようにすることができる。このようにすることで、該入力済みの部分構造と組み合わせて使うとき適当な部分構造を候補として提示することが可能であり、作業者の作業負荷をさらに軽減することが可能である。
実施の形態2.
本実施の形態によるチェックルール作成支援装置の構成を図10に示す。なお、図1と同じ番号を付与した機能ブロックは同等の機能を有するものであるため、以下では説明を省略する。
部分構造タグ設定部301は、チェックルール記憶部103が保持するチェックルールのチェック条件において、任意の部分構造に対し注釈(名前)を設定することができるようになっている。
部分構造タグ記憶部302は、注釈と部分木の関係を記憶している。完全な部分木のみを注釈の付与対象とする場合は、例えばノードIDと注釈テキストをペアで記憶するようなデータを持たせれば良い。
本実施の形態によるチェックルール作成支援装置の構成を図10に示す。なお、図1と同じ番号を付与した機能ブロックは同等の機能を有するものであるため、以下では説明を省略する。
部分構造タグ設定部301は、チェックルール記憶部103が保持するチェックルールのチェック条件において、任意の部分構造に対し注釈(名前)を設定することができるようになっている。
部分構造タグ記憶部302は、注釈と部分木の関係を記憶している。完全な部分木のみを注釈の付与対象とする場合は、例えばノードIDと注釈テキストをペアで記憶するようなデータを持たせれば良い。
注釈の設定例を図11に示す。図中、破線で囲まれた部分木に注釈として「異種電源使用時」が設定されている。この注釈は、この部分木が「異種電源使用時」に文書とマッチすることを示している。
注釈の付与作業は、実施の形態1で述べたように「異種電源」で検索し、部分構造抽出処理で部分木を得たときに実施すれば良いが、あるいは、チェック条件を新規に作成するときや、閲覧している最中など、任意のタイミングで付与して良い。
このような注釈を付けておくことにより、チェック条件の可読性が向上するため、流用する部分木を目視で探すのが容易になる。
また、チェックルール弁別部105がキーワード検索を行なう際に、注釈も検索対象に含めるようにしておけば、所望の部分木をより高い精度で抽出することが可能になるため、流用によるチェック条件の作成を更に容易にすることができる。
注釈の付与作業は、実施の形態1で述べたように「異種電源」で検索し、部分構造抽出処理で部分木を得たときに実施すれば良いが、あるいは、チェック条件を新規に作成するときや、閲覧している最中など、任意のタイミングで付与して良い。
このような注釈を付けておくことにより、チェック条件の可読性が向上するため、流用する部分木を目視で探すのが容易になる。
また、チェックルール弁別部105がキーワード検索を行なう際に、注釈も検索対象に含めるようにしておけば、所望の部分木をより高い精度で抽出することが可能になるため、流用によるチェック条件の作成を更に容易にすることができる。
実施の形態3.
実施の形態1では、過去作成されたチェックルールにおける部分構造の出現頻度に基づいて、提示する部分構造を決定した。これに対し、本実施の形態では、チェックルールに関するヒューリスティックな重みづけを与える方法について述べる。
本実施の形態によるチェックルール作成支援装置の構成を図11に示す。なお、図1と同じ番号を付与した機能ブロックは同等の機能を有するものであるため、以下では説明を省略する。
実施の形態1では、過去作成されたチェックルールにおける部分構造の出現頻度に基づいて、提示する部分構造を決定した。これに対し、本実施の形態では、チェックルールに関するヒューリスティックな重みづけを与える方法について述べる。
本実施の形態によるチェックルール作成支援装置の構成を図11に示す。なお、図1と同じ番号を付与した機能ブロックは同等の機能を有するものであるため、以下では説明を省略する。
実行時評価記憶部501は、過去に、チェックルールが文書作成支援装置に読み込まれて、実際にメッセージとして提示されたときの、作業者による評価(ユーザフィードバック)を記憶している。これを実現する方法は前出の特許文献1に記載されており、メッセージの下部に「確認OK」「保留」「不要」の評価入力ボタンを配置して、メッセージ(チェックルール)の内容が有用であるかや、提示タイミングが適当であったかの評価を収集する方法が述べられている。
部分構造抽出部502は実行時評価記憶部501に記憶された作業者による評価を参照して部分構造に対するスコアを求める。
部分構造抽出部502は実行時評価記憶部501に記憶された作業者による評価を参照して部分構造に対するスコアを求める。
このような実行時評価記憶部501に記憶された実行時評価の最も単純な利用方法としては、前記実施の形態1において、部分構造抽出部502で部分構造に対するスコアを求める際に用いた式1のルールRの頻度 |R| の代わりに、 |R| * numAcc(R) を用いることができる。ここで numAcc(R) は過去にルールRでメッセージを提示したときに適当であったと評価を受けた回数を表わす。
このような実行時評価による重みづけを行なって部分構造を抽出することにより、実行時に適切なガイダンスを提示可能なチェックルールを作業者が容易に作成できるよう支援できる。
このような実行時評価による重みづけを行なって部分構造を抽出することにより、実行時に適切なガイダンスを提示可能なチェックルールを作業者が容易に作成できるよう支援できる。
なお、上述の例ではルールの実行時評価でルール数(頻度)に重み付けする方法を説明したが、実施の形態はこれに限定するものではなく、ルールの任意の属性に応じた重み付けが可能である。例えば誰が作成したルールかによって重みづけをして、本人やベテランが作ったルールから優先的に部分構造を抽出するようにしたり、あるいは、ルールの作成日時によって重み付けを行うことで、新しいルールから優先的に部分構造を抽出することができる。
ルールの作成日時による重み付けを行なうときは、一例としては、上述のルール数 |R| の代わりに、|R_this_month| * 0.6 + |R_this_year| * 0.3 + |R_others| * 0.1 を用いればよい。ここで R_this_month はルール集合 R のうちで当月作成されたルールの集合を表わし、R_this_year は R 中で当年作成された R_this_month 以外のルールの集合を表わす。R_others はR中で R_this_month にも R_this_year にも含まれないルールの集合を表わす。また、0.6, 0.3, 0.1 は各部分集合のサイズに対し予め設定した重み係数である。
このようにルールの属性による重み付けを行なうことによっても、適切な部分構造を抽出し、チェックルール作成を支援することが出来る。
このようにルールの属性による重み付けを行なうことによっても、適切な部分構造を抽出し、チェックルール作成を支援することが出来る。
この発明は、製造業における製品の設計、製造、保守といった一連の業務で作成される技術文書、設計書、マニュアル等の文書における記載内容の不具合を抽出する文書作成支援装置に用いられるルール作成やルールの追加修正を支援する文書チェックルール作成支援装置に適用される。
101:メッセージ編集部、102:チェック条件編集部、103:チェックルール記憶部、104:チェックルール検索入力部、105:チェックルール弁別部、106、502、602:部分構造抽出部、301:部分構造タグ設定部、302:部分構造タグ記憶部、501:実行時評価記憶部、601:チェックルール属性記憶部。
Claims (7)
- 文書と照合するためのチェック条件と、該チェック条件が文書と合致したとき文書作成者に対し提示するメッセージとが合わされたチェックルールが予め作成されて格納されたチェックルール記憶部と、チェックルール記憶部のチェックルールを検索する検索条件を取得するチェックルール検索入力部と、チェックルール記憶部のチェックルールを、チェックルール検索入力部からの検索条件に合致するものと、合致しないものに弁別するチェックルール弁別部と、弁別されたチェックルールからチェック条件の部分構造を抽出する部分構造抽出部とを備えたことを特徴とする文書チェックルール作成支援装置。
- 前記チェックルールを検索する検索条件は1つまたは複数のキーワードであり、チェックルール弁別部はチェックルールのメッセージを該キーワードと照合して合致判定を行なうことを特徴とする請求項1記載の文書チェックルール作成支援装置。
- チェック条件の部分構造に対し任意名称のタグを付与する部分構造タグ設定部と、部分構造に付与されたタグを記憶する部分構造タグ記憶部とを備え、チェックルール弁別部は少なくともタグの内容と検索条件との合致判定を行なうことを特徴とする請求項1または請求項2に記載の文書チェックルール作成支援装置。
- 前記チェックルール記憶部はチェックルールの分類を記憶し、前記チェックルールを検索する検索条件はチェックルールの分類指定を含み、前記チェックルール弁別部はチェックルールの分類指定に応じた弁別をすることを特徴とする請求項1ないし請求項3の何れか1つに記載の文書チェックルール作成支援装置。
- チェックルールにより文書チェックを実施したときのユーザによる評価フィードバックを記憶した実行時評価記憶部を備え、前記部分構造抽出部はこの実行時評価記憶部の評価フィードバックを参照して重みづけを行ないチェック条件の部分構造を抽出することを特徴とする請求項1ないし請求項4の何れか1つに記載の文書チェックルール作成支援装置。
- チェックルールの作成者や作成日のチェックルール属性を記憶するチェックルール属性記憶部を備え、前記部分構造抽出部はチェックルール属性記憶部のチェックルール属性を参照して重みづけを行ないチェック条件の部分構造を抽出することを特徴とする請求項1ないし請求項5の何れか1つに記載の文書チェックルール作成支援装置。
- チェックルールのチェック条件を作成するチェック条件編集部を備え、前記部分構造抽出部はチェック条件編集部に入力されている部分構造が、チェックルール記憶部に格納されたチェックルール中で出現する頻度に基づいて、チェック条件の部分構造を抽出することを特徴とする請求項1ないし請求項6の何れか1つに記載の文書チェックルール作成支援装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008017748A JP2009181189A (ja) | 2008-01-29 | 2008-01-29 | 文書チェックルール作成支援装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008017748A JP2009181189A (ja) | 2008-01-29 | 2008-01-29 | 文書チェックルール作成支援装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009181189A true JP2009181189A (ja) | 2009-08-13 |
Family
ID=41035155
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008017748A Pending JP2009181189A (ja) | 2008-01-29 | 2008-01-29 | 文書チェックルール作成支援装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009181189A (ja) |
-
2008
- 2008-01-29 JP JP2008017748A patent/JP2009181189A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5992404B2 (ja) | 参考文献検証のための引用処理、提示および移送用のシステムおよび方法 | |
US9501455B2 (en) | Systems and methods for processing data | |
Halpin | Object-role modeling fundamentals: a practical guide to data modeling with ORM | |
US20100005049A1 (en) | Information extraction rule making support system, information extraction rule making support method, and information extraction rule making support program | |
JP2005352888A (ja) | 表記揺れ対応辞書作成システム | |
JP2008084242A (ja) | データベース作成装置およびデータベース活用支援装置 | |
JP2004220215A (ja) | 計算機を利用した業務誘導支援システムおよび業務誘導支援方法 | |
US20120179709A1 (en) | Apparatus, method and program product for searching document | |
JP2005038395A (ja) | データベース検索装置 | |
JP2007108889A (ja) | 知的財産管理システム、知的財産管理方法およびプログラム | |
JP2006023968A (ja) | 固有表現抽出方法および装置並びにそれらに用いるプログラム | |
JP2009181189A (ja) | 文書チェックルール作成支援装置 | |
JP2009251707A (ja) | 検索システム | |
JPH09245052A (ja) | 構造化文書処理装置 | |
KR101589705B1 (ko) | 구매요청도서 마크 데이터 구축방법 | |
TWI488058B (zh) | 顯示器用畫面資料編輯設備 | |
JP5039505B2 (ja) | 文書検索装置および文書検索支援方法 | |
JP6676792B2 (ja) | レビュア管理システムおよび方法 | |
JP2010140262A (ja) | 語句入力支援装置及びプログラム | |
JP5326781B2 (ja) | 抽出規則作成システム、抽出規則作成方法及び抽出規則作成プログラム | |
JP6712521B2 (ja) | 検索式提示システム、検索式提示方法、およびプログラム | |
JP2021086590A (ja) | 図形内文字列一覧表抽出管理ソフトウェア | |
JP2010134766A (ja) | 文書データ処理装置およびそのプログラム | |
JP3774431B2 (ja) | 辞書構築支援装置および辞書構築支援方法 | |
JP2008242716A (ja) | 改修項目調査漏れ防止支援システム |