JP7074785B2 - Ambiguous part correction support device and method - Google Patents

Ambiguous part correction support device and method Download PDF

Info

Publication number
JP7074785B2
JP7074785B2 JP2020006405A JP2020006405A JP7074785B2 JP 7074785 B2 JP7074785 B2 JP 7074785B2 JP 2020006405 A JP2020006405 A JP 2020006405A JP 2020006405 A JP2020006405 A JP 2020006405A JP 7074785 B2 JP7074785 B2 JP 7074785B2
Authority
JP
Japan
Prior art keywords
correction
ambiguity
ambiguous
document
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020006405A
Other languages
Japanese (ja)
Other versions
JP2021114120A (en
Inventor
裕一郎 鈴木
岐勇 飯島
紘 松田
大貴 東
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2020006405A priority Critical patent/JP7074785B2/en
Publication of JP2021114120A publication Critical patent/JP2021114120A/en
Application granted granted Critical
Publication of JP7074785B2 publication Critical patent/JP7074785B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、曖昧箇所訂正支援装置及び方法に関し、例えば、ソフトウェア関連文書内の数値的に曖昧な内容を含む文章の一部又は全部(以下、これを曖昧箇所と呼ぶ)を明瞭な内容に訂正する訂正作業を支援する曖昧箇所訂正支援装置に適用して好適なものである。 The present invention relates to an ambiguous part correction support device and a method, for example, correcting a part or all of a sentence including numerically ambiguous contents in a software-related document (hereinafter, this is referred to as an ambiguous part) to clear contents. It is suitable for application to an ambiguous part correction support device that supports correction work.

従来、メーカなどでは、過去の製品に不具合が発生した場合に、その製品の仕様書や取扱説明書、さらには開発時のメールや設計メモ及び又は設計資料などの技術文書を参照して対応したり、既存製品の新たなモデルを開発する際に、その既存製品の上記技術文書を参照することが広く行われている。 Conventionally, when a defect occurs in a past product, the manufacturer responds by referring to the specifications and instruction manual of the product, as well as technical documents such as development emails, design memos, and / or design materials. Or, when developing a new model of an existing product, it is widely practiced to refer to the above technical document of the existing product.

この場合において、技術文書に数値的に曖昧な表現が用いられている場合、読手が十分な理解を得られない問題がある。例えば、「システムがスローダウンしたとき、メモリを多めに増量する必要がある」という文章では、「多め」の意味が曖昧であり、メモリを具体的にどの程度増量すればよいのかが不明瞭である。 In this case, if numerically ambiguous expressions are used in the technical document, there is a problem that the reader cannot obtain a sufficient understanding. For example, in the sentence "When the system slows down, it is necessary to increase the amount of memory more", the meaning of "more" is ambiguous, and it is unclear how much memory should be increased concretely. be.

このため、このような表現が技術文書内に存在する場合、読手は、関連する他の技術文書から「多め」の具体的数値を探し出す必要があり、その作業が煩雑かつ多くの時間を要するという問題があった。また、かかる具体的数値を探し出せたとしても、その具体的数値を複数検出した場合、技術的知識のない若手技術者には、どの具体的数値が適切な値であるかを判断することは難しいという問題もあった。 For this reason, when such an expression exists in a technical document, the reader needs to search for "more" specific numerical values from other related technical documents, which is complicated and time-consuming. There was a problem. In addition, even if such a specific numerical value can be found, if multiple specific numerical values are detected, it is difficult for a young engineer without technical knowledge to determine which specific numerical value is an appropriate value. There was also the problem.

なお、下記特許文献1には、自然言語で記述された要求仕様に含まれる条件を自動で見つけ出し、存在し得る条件を網羅的に探索して抜け漏れている条件節を提示する技術が開示されている。 The following Patent Document 1 discloses a technique for automatically finding conditions included in requirement specifications described in natural language, comprehensively searching for possible conditions, and presenting missing condition clauses. ing.

特開2015-14827号公報Japanese Unexamined Patent Publication No. 2015-14827

ところで、上述のような技術文書の曖昧箇所については、ある程度の知識を備えたベテラン技術者が、関連する他の技術文書から具体的数値を探し出して、その曖昧箇所を明瞭化するよう訂正することが望ましい。しかしながら、ベテラン技術者であってもそのような訂正作業には多くの労力及び時間を要する問題がある。 By the way, regarding the ambiguity of the technical document as described above, a veteran engineer with some knowledge should search for specific numerical values from other related technical documents and correct the ambiguity so as to clarify the ambiguity. Is desirable. However, even a veteran technician has a problem that such correction work requires a lot of labor and time.

本発明は以上の点を考慮してなされたもので、文書内の曖昧箇所の内容を明瞭な内容に訂正する訂正作業を容易化及び適正化し得る曖昧箇所訂正支援装置及び方法を提案しようとするものである。 The present invention has been made in consideration of the above points, and an object of the present invention is to propose an ambiguity correction support device and a method capable of facilitating and optimizing the correction work for correcting the contents of ambiguities in a document to clear contents. It is a thing.

かかる課題を解決するため本発明においては、第1の文書内の数値的に曖昧な曖昧箇所を明瞭化するように訂正する訂正作業を支援する曖昧箇所訂正支援装置において、曖昧性を有する形容表現の複数の特定の単語がそれぞれ曖昧単語として事前に格納されると共に、述語動詞で表された動作の程度を表す数値を伴わなければ内容が曖昧となる複数の特定の主語及び当該述語動詞の組合せがそれぞれ曖昧構文として事前に格納された記憶装置と、複数の第2の文書から、If-Then形式で記述された文章の一部又は全部を多条件文としてそれぞれ抽出する多条件抽出部と、前記第1の文書から、前記記憶装置に格納されたいずれかの前記曖昧単語を含む文章若しくは文章の一部、又は、前記記憶装置に格納されたいずれかの前記曖昧構文を構成する前記主語及び前記述語動詞の組合せを含む文章若しくは文章の一部を前記曖昧箇所として抽出する曖昧箇所抽出部と、複数の前記第2の文書から抽出された前記多条件文のうちの前記曖昧箇所と主語が一致する前記多条件文を、当該曖昧箇所の訂正候補としてそれぞれ抽出する訂正候補抽出部と、前記曖昧箇所に含まれる動詞が表す動作の発生条件と、当該曖昧箇所について抽出された各前記訂正候補の前記発生条件との類似度合に基づいて、各前記訂正候補にスコアをそれぞれ付与する訂正候補スコア付け部と、各前記訂正候補を、付与された前記スコアに応じた表示形態で表示する表示部とを設けるようにした。 In order to solve such a problem, in the present invention, a verb expression having ambiguity in an ambiguity correction support device that supports a correction operation for correcting a numerically ambiguous ambiguity in a first document so as to clarify it. A combination of multiple specific subjects and the predicate verb, each of which is pre-stored as an ambiguous word and whose content is ambiguous without a numerical value indicating the degree of action represented by the predicate verb. A storage device that is pre-stored as an ambiguous syntax, and a multi-condition extractor that extracts part or all of a sentence described in If-Then format as a multi-condition sentence from a plurality of second documents. From the first document, a part of a sentence or sentence containing any of the ambiguous words stored in the storage device, or the subject and the subject constituting any of the ambiguous syntax stored in the storage device. An ambiguous part extraction unit that extracts a sentence or a part of a sentence including a combination of pre-descriptive word verbs as the ambiguous part, and the ambiguous part and the subject of the multiconditional sentences extracted from a plurality of the second documents. The correction candidate extraction unit that extracts the multi-condition sentence that matches the ambiguity as a correction candidate of the ambiguity, the condition of occurrence of the action represented by the verb included in the ambiguity, and each of the corrections extracted for the ambiguity. A correction candidate scoring unit that assigns a score to each of the correction candidates based on the degree of similarity of the candidate to the occurrence condition, and a display that displays each of the correction candidates in a display form according to the given score. I tried to provide a part.

また本発明においては、第1の文書内の数値的に曖昧な曖昧箇所を明瞭化するように訂正する訂正作業を支援する曖昧箇所訂正支援装置により実行される曖昧箇所訂正支援方法であって、前記曖昧箇所訂正支援装置は、曖昧性を有する形容表現の複数の特定の単語がそれぞれ曖昧単語として事前に格納されると共に、述語動詞で表された動作の程度を表す数値を伴わなければ内容が曖昧となる複数の特定の主語及び当該述語動詞の組合せがそれぞれ曖昧構文として事前に格納された記憶装置を有し、複数の第2の文書から、If-Then形式で記述された文章の一部又は全部を多条件文としてそれぞれ抽出する第1のステップと、前記第1の文書から、前記記憶装置に格納されたいずれかの前記曖昧単語を含む文章若しくは文章の一部、又は、前記記憶装置に格納されたいずれかの前記曖昧構文を構成する前記主語及び前記述語動詞の組合せを含む文章若しくは文章の一部を前記曖昧箇所として抽出する第2のステップと、複数の前記第2の文書から抽出された前記多条件文のうちの前記曖昧箇所と主語が一致する前記多条件文を、当該曖昧箇所の訂正候補としてそれぞれ抽出する第3のステップと、前記曖昧箇所に含まれる動詞が表す動作の発生条件と、当該曖昧箇所について抽出された各前記訂正候補の前記発生条件との類似度合に基づいて、各前記訂正候補にスコアをそれぞれ付与する第4のステップと、各前記訂正候補を、付与された前記スコアに応じた表示形態で表示する第5のステップとを設けるようにした。
Further, the present invention is an ambiguity correction support method executed by an ambiguity correction support device that supports a correction work for correcting a numerically ambiguous ambiguity in a first document so as to clarify it. In the ambiguity correction support device, a plurality of specific words of an ambiguous expression are stored in advance as ambiguity words, and the content is not accompanied by a numerical value indicating the degree of operation expressed by a predicate verb. A part of a sentence described in If-Then format from a plurality of second documents, each having a storage device in which a combination of a plurality of specific subjects and the predicate verbs to be ambiguous are pre-stored as an ambiguous syntax . Or a part of a sentence or sentence containing any of the ambiguous words stored in the storage device from the first step of extracting all of them as a multi-condition sentence, or the storage device. A second step of extracting a sentence or a part of a sentence including a combination of the subject and the predescriptive word verb that constitutes any of the ambiguities stored in the ambiguity as the ambiguity, and a plurality of the second documents. The third step of extracting the multi-conditional sentence whose subject matches the ambiguous part of the multi-conditional sentence extracted from is extracted as a correction candidate of the ambiguous part, and the verb included in the ambiguous part represent. A fourth step of assigning a score to each of the correction candidates based on the degree of similarity between the operation occurrence condition and the occurrence condition of each of the correction candidates extracted for the ambiguity, and each of the correction candidates. , A fifth step of displaying in a display form according to the given score is provided.

本発明の曖昧箇所訂正支援装置及び方法によれば、表示された各訂正候補の表示態様に基づいて、第1の文書内の曖昧箇所に述語動詞の修飾語として追加すべき数値として、第2の文書全体から最も適切な訂正候補の数値を選択及び決定することができる。 According to the ambiguity correction support device and method of the present invention, as a numerical value to be added as a modifier of the predicate verb to the ambiguity in the first document based on the display mode of each displayed correction candidate, the second The most appropriate correction candidate numbers can be selected and determined from the entire document.

本発明によれば、文書内の曖昧箇所を明瞭な表現に訂正する訂正作業を容易化及び適正化することができる。 According to the present invention, it is possible to facilitate and optimize the correction work for correcting an ambiguity in a document into a clear expression.

本実施の形態による曖昧箇所訂正支援システムの全体構成を示すブロック図である。It is a block diagram which shows the whole structure of the ambiguity correction support system by this embodiment. 多条件テーブルの構成例を示す図表である。It is a figure which shows the configuration example of a multi-condition table. 曖昧単語テーブルの構成例を示す図表である。It is a figure which shows the structural example of an ambiguous word table. 曖昧構文テーブルの構成例を示す図表である。It is a figure which shows the composition example of an ambiguous syntax table. 重みテーブルの構成例を示す図表である。It is a figure which shows the structural example of the weight table. 同一構文判定テーブルの構成例を示す図表である。It is a figure which shows the structural example of the same syntax judgment table. 製品名テーブルの構成例を示す図表である。It is a figure which shows the structural example of a product name table. 曖昧箇所提示画面の構成例を示す図である。It is a figure which shows the configuration example of the obscure part presentation screen. 曖昧箇所訂正支援画面の構成例を示す図である。It is a figure which shows the configuration example of the ambiguity correction support screen. 訂正候補詳細画面の構成例を示す図である。It is a figure which shows the configuration example of the correction candidate detail screen. 多条件テーブル作成処理の処理手順を示すフローチャートである。It is a flowchart which shows the process procedure of the multi-condition table creation process. 曖昧箇所訂正支援処理の処理手順を示すフローチャートである。It is a flowchart which shows the processing procedure of the ambiguity correction support processing. 曖昧単語抽出処理の処理手順を示すフローチャートである。It is a flowchart which shows the processing procedure of the ambiguous word extraction processing. 曖昧構文抽出処理の処理手順を示すフローチャートである。It is a flowchart which shows the processing procedure of the ambiguous syntax extraction processing. 訂正候補抽出処理の処理手順を示すフローチャートである。It is a flowchart which shows the processing procedure of the correction candidate extraction processing. 訂正候補スコア付け処理の処理手順を示すフローチャートである。It is a flowchart which shows the processing procedure of the correction candidate scoring process. 選択訂正候補学習処理の処理手順を示すフローチャートである。It is a flowchart which shows the processing procedure of the selection correction candidate learning process. 同様訂正箇所判定処理の処理手順を示すフローチャートである。Similarly, it is a flowchart which shows the processing procedure of the correction part determination process.

以下図面について、本発明の一実施の形態を詳述する。 Hereinafter, one embodiment of the present invention will be described in detail with reference to the drawings.

(1)本実施の形態による曖昧箇所訂正支援システムの構成
図1において、1は全体として本実施の形態による曖昧箇所訂正支援システムを示す。この曖昧箇所訂正支援システム1は、ネットワーク2を介して接続された曖昧箇所訂正支援装置3及びファイルサーバ4と、1又は複数のクライアント5とを備えて構成される。
(1) Configuration of Ambiguous Part Correction Support System According to the Present Embodiment In FIG. 1, 1 shows an ambiguous part correction support system according to the present embodiment as a whole. The ambiguity correction support system 1 includes an ambiguity correction support device 3 and a file server 4 connected via a network 2, and one or a plurality of clients 5.

曖昧箇所訂正支援装置3は、内部バス10を介して相互に接続されたCPU(Central Processing Unit)11、メインメモリ12、補助記憶装置13、ネットワークアダプタ14及び入出力部15と、入力装置16及び表示装置17とを備えた汎用のコンピュータ装置から構成される。 The ambiguity correction support device 3 includes a CPU (Central Processing Unit) 11, a main memory 12, an auxiliary storage device 13, a network adapter 14, an input / output unit 15, and an input device 16 connected to each other via an internal bus 10. It is composed of a general-purpose computer device including a display device 17.

CPU11は、曖昧箇所訂正支援装置3全体の動作制御を司るプロセッサである。またメインメモリ12は、例えば揮発性の半導体メモリから構成され、CPU11のワークメモリとして利用される。 The CPU 11 is a processor that controls the operation of the entire ambiguity correction support device 3. Further, the main memory 12 is composed of, for example, a volatile semiconductor memory and is used as a work memory of the CPU 11.

補助記憶装置13は、ハードディスク装置やSSD(Solid State Drive)又はフラッシュメモリ等の大容量の不揮発性記憶媒体から構成され、各種プログラムや必要なデータが格納される。補助記憶装置13に格納されたプログラムがメインメモリ12にロードされ、このプログラムをCPU11が実行することにより、後述のような曖昧箇所訂正支援装置3全体としての各種処理が行われる。 The auxiliary storage device 13 is composed of a large-capacity non-volatile storage medium such as a hard disk device, SSD (Solid State Drive), or flash memory, and stores various programs and necessary data. The program stored in the auxiliary storage device 13 is loaded into the main memory 12, and the CPU 11 executes this program to perform various processes as a whole of the ambiguity correction support device 3 as described later.

ネットワークアダプタ14は、例えばNIC(Network Interface Card)などから構成され、ネットワーク2を介したファイルサーバ4やクライアント5との通信時におけるプロトコル制御を行う。 The network adapter 14 is composed of, for example, a NIC (Network Interface Card) and performs protocol control during communication with the file server 4 and the client 5 via the network 2.

入出力部15は、入力装置16及び表示装置17に対するインタフェースであり、ユーザ操作に応じて入力装置16から与えられるコマンドを曖昧箇所訂正支援装置3内部の信号フォーマットに変換したり、画像情報を対応する信号フォーマットに変換して表示装置17に出力する。 The input / output unit 15 is an interface to the input device 16 and the display device 17, and converts a command given from the input device 16 into a signal format inside the ambiguity correction support device 3 according to a user operation, and supports image information. It is converted into a signal format to be output and output to the display device 17.

入力装置16は、ユーザが必要な操作を行うために利用するデバイスであり、例えば、マウスやキーボードなどから構成される。入力装置16は、ユーザ操作に応じたコマンドを入出力部15に出力する。また表示装置17は、例えば、液晶ディスプレイや有機EL(Electro Luminescence)ディスプレイなどから構成され、入出力部15から与えられた画像情報に応じた画面や画像を表示する。 The input device 16 is a device used for a user to perform a necessary operation, and is composed of, for example, a mouse or a keyboard. The input device 16 outputs a command corresponding to the user operation to the input / output unit 15. Further, the display device 17 is composed of, for example, a liquid crystal display or an organic EL (Electro Luminescence) display, and displays a screen or an image corresponding to the image information given by the input / output unit 15.

ファイルサーバ4は、文書ファイルFLを蓄積及び管理するファイルシステム機能が搭載された汎用のサーバ装置であり、内部バス20を介して接続されたCPU21、補助記憶装置22、ネットワークアダプタ23及び入出力部24と、入力装置25及び表示装置26とを備えて構成される。 The file server 4 is a general-purpose server device equipped with a file system function for storing and managing document files FL, and is a CPU 21, an auxiliary storage device 22, a network adapter 23, and an input / output unit connected via an internal bus 20. 24 is provided with an input device 25 and a display device 26.

これらCPU21、補助記憶装置22、ネットワークアダプタ23、入出力部24、入力装置25及び表示装置26は、それぞれ曖昧箇所訂正支援装置3のCPU11、補助記憶装置13、ネットワークアダプタ14、入出力部15、入力装置16及び表示装置17と同様の機能及び構成を有するものであるため、ここでの詳細説明は省略する。 The CPU 21, auxiliary storage device 22, network adapter 23, input / output unit 24, input device 25, and display device 26 are the CPU 11 of the ambiguity correction support device 3, the auxiliary storage device 13, the network adapter 14, and the input / output unit 15, respectively. Since it has the same functions and configurations as the input device 16 and the display device 17, detailed description here will be omitted.

ファイルサーバ4の補助記憶装置22には、各種プログラムのほか、各文書ファイルFLのデータと、文書ファイルFLごとのファイル情報FLIなどが格納される。なお、ファイル情報は、対応する文書ファイルFLに基づく文書に対応する製品のバージョンや当該文書の作成日及び作成者の情報や、その文書が関連する製品の製品名などのその文書のメタ情報を含む情報である。 In addition to various programs, the auxiliary storage device 22 of the file server 4 stores data of each document file FL, file information FLI for each document file FL, and the like. The file information includes meta information of the document such as the version of the product corresponding to the document based on the corresponding document file FL, the creation date and creator information of the document, and the product name of the product to which the document is related. Information included.

クライアント5は、ユーザが文書ファイルFLをファイルサーバ4に読み書きしたり、所望する文書内の曖昧箇所の訂正作業の支援を曖昧箇所訂正支援装置3に要求するために利用するコンピュータ装置である。 The client 5 is a computer device used by a user to read / write a document file FL to / from a file server 4 or to request an ambiguity correction support device 3 to support an ambiguity correction work in a desired document.

このクライアント5は、内部バス30を介して相互に接続されたCPU31、メインメモリ32、ネットワークアダプタ33及び入出力部34と、入力装置35及び表示装置36とを備えて構成される。 The client 5 includes a CPU 31, a main memory 32, a network adapter 33, an input / output unit 34, and an input device 35 and a display device 36, which are connected to each other via an internal bus 30.

これらCPU31、メインメモリ32、ネットワークアダプタ33、入出力部34、入力装置35及び表示装置36は、それぞれ曖昧箇所訂正支援装置3のCPU11、メインメモリ12、ネットワークアダプタ14、入出力部15、入力装置16及び表示装置17と同様の機能及び構成を有するものであるため、ここでの詳細説明は省略する。 The CPU 31, main memory 32, network adapter 33, input / output unit 34, input device 35, and display device 36 are the CPU 11, main memory 12, network adapter 14, input / output unit 15, and input device of the ambiguity correction support device 3, respectively. Since it has the same functions and configurations as those of 16 and the display device 17, detailed description here will be omitted.

(2)曖昧箇所訂正支援機能
次に、曖昧箇所訂正支援装置3に搭載された曖昧箇所訂正支援機能について説明する。この曖昧箇所訂正支援機能は、クライアント5を介してユーザにより指定された対象とする文書(以下、これを対象文書と呼ぶ)内の数値的に曖昧な表現箇所(曖昧箇所)の記載を、数値的に明瞭化するようユーザが訂正する訂正作業を支援する機能である。
(2) Ambiguous part correction support function Next, the ambiguous part correction support function mounted on the ambiguous part correction support device 3 will be described. This ambiguity correction support function numerically describes the numerically ambiguous expression part (ambiguous part) in the target document (hereinafter referred to as the target document) designated by the user via the client 5. It is a function that supports the correction work that the user corrects so as to clarify the situation.

なお、以下においては、ファイルサーバ4に格納された文書ファイルFLに基づく文書(以下、これを蓄積文書と呼ぶ)や、ユーザにより指定される対象文書は、ソフトウェア製品の開発段階でやり取りされたメールや設計メモ又は設計資料などであるものとする。また対象文書の曖昧箇所を明瞭化するように訂正する訂正作業を実行するユーザは、ある程度の知識を有するベテラン技術者であるものとする。 In the following, the document based on the document file FL stored in the file server 4 (hereinafter referred to as a stored document) and the target document specified by the user are emails exchanged at the development stage of the software product. And design memos or design materials. In addition, the user who executes the correction work to correct the ambiguity of the target document so as to clarify it shall be a veteran engineer who has some knowledge.

以上のような曖昧箇所訂正支援機能を実現するための手段として、曖昧箇所訂正支援装置3の補助記憶装置13には、多条件テーブル作成プログラム40、曖昧単語抽出プログラム41、曖昧構文抽出プログラム42、訂正候補抽出プログラム43、訂正候補スコア付けプログラム44、訂正箇所・訂正内容表示プログラム45、選択訂正候補学習プログラム46、訂正結果表示プログラム47及び同様訂正箇所判定プログラム48と、多条件テーブル50、曖昧単語テーブル51、曖昧構文テーブル52、重みテーブル53、同一構文判定テーブル54及び製品名テーブル55とが格納されている。 As a means for realizing the ambiguity correction support function as described above, the auxiliary storage device 13 of the ambiguity correction support device 3 includes a multi-condition table creation program 40, an ambiguity word extraction program 41, and an ambiguity syntax extraction program 42. Correction candidate extraction program 43, correction candidate scoring program 44, correction part / correction content display program 45, selection correction candidate learning program 46, correction result display program 47 and similar correction part determination program 48, multi-condition table 50, ambiguous word. A table 51, an ambiguous syntax table 52, a weight table 53, the same syntax determination table 54, and a product name table 55 are stored.

多条件テーブル作成プログラム40は、蓄積文書内の各文章に対して係り受け解析をそれぞれ行うことにより、各蓄積文書から「If-Then形式」で記述された文章の一部又は全部を「多条件文」として抽出し、抽出した多条件文に関する必要な情報を多条件テーブル50に登録する機能を有するプログラムである。 The multi-condition table creation program 40 performs a dependency analysis on each sentence in the stored document, thereby performing "multi-condition" for a part or all of the sentences described in "If-Then format" from each stored document. It is a program having a function of extracting as a "sentence" and registering necessary information about the extracted multi-conditional sentence in the multi-condition table 50.

なお、ここでの「If-Then形式」とは、ソフトウェア関連の文書において多く用いられる「主語」、「動詞」、動詞が表す動作の程度を表す「数値」及び動詞が表す動作の「発生条件(~とき、~時)」、を含む表現形式であり、例えば、「初回起動をするときには、メモリを4GB以上に増やす」や、「KBE-500エラー発生時、メモリを16GBに増量する」などの文章がこれに該当する。前者の例では、「初回起動をするとき」が発生条件、「メモリ」が主語、「4GB以上」が数値、「増やす」が動詞にそれぞれ該当し、後者の例では「KBE-500エラー発生時」が発生条件、「メモリ」が主語、「16GBに」が数値、「増量する」が動詞にそれぞれ該当する。 The "If-Then format" here means "subject", "verb", "numerical value" indicating the degree of action represented by the verb, and "occurrence condition" of the action represented by the verb, which are often used in software-related documents. It is an expression format that includes "(~ time, ~ hour)", for example, "Increase memory to 4GB or more when starting for the first time", "Increase memory to 16GB when KBE-500 error occurs", etc. The sentence of corresponds to this. In the former example, "when starting for the first time" corresponds to the occurrence condition, "memory" corresponds to the subject, "4GB or more" corresponds to the numerical value, and "increase" corresponds to the verb. "" Corresponds to the occurrence condition, "memory" corresponds to the subject, "16GB to" corresponds to the numerical value, and "increase" corresponds to the verb.

曖昧単語抽出プログラム41は、「多い」、「少ない」、「長期間」及び「少し」などの曖昧性を有する形容表現の単語(以下、これを曖昧単語と呼ぶ)を含む文章又は文章の一部分を曖昧箇所として対象文書から抽出する機能を有するプログラムである。 The ambiguous word extraction program 41 is a sentence or a part of a sentence including a word of an ambiguous expression (hereinafter, referred to as an ambiguous word) having ambiguity such as "more", "less", "long term" and "a little". It is a program that has a function to extract from the target document as an ambiguous part.

また曖昧構文抽出プログラム42は、例えば「メモリを増やす」のように、述語動詞で表された動作の程度を表す数値(例えば「4GBに」)を伴わなければ内容が曖昧となる文章又は文章の一部分を曖昧箇所として対象文書から抽出する機能を有するプログラムである。 Further, the ambiguous syntax extraction program 42 is a sentence or sentence whose content is ambiguous unless it is accompanied by a numerical value (for example, "to 4GB") indicating the degree of operation expressed by a predicate verb, such as "increase memory". It is a program that has a function to extract a part from the target document as an ambiguous part.

訂正候補抽出プログラム43は、曖昧単語抽出プログラム41や曖昧構文抽出プログラム42により抽出された対象文書内の曖昧箇所ごとに、その曖昧箇所を数値的に明瞭な記述に訂正する際の参考とすべき多条件文を訂正候補として多条件テーブル50から抽出する機能を有するプログラムである。具体的に、訂正候補抽出プログラム43は、多条件テーブル50に登録された幾つかの多条件文の中から、その主語が対象文書から抽出した曖昧箇所の主語と一致する多条件文をすべて特定し、これら多条件文をその曖昧箇所の訂正候補としてそれぞれ抽出する。 The correction candidate extraction program 43 should be used as a reference when correcting the ambiguity into a numerically clear description for each ambiguity in the target document extracted by the ambiguity word extraction program 41 or the ambiguity syntax extraction program 42. This is a program having a function of extracting a multi-condition sentence from the multi-condition table 50 as a correction candidate. Specifically, the correction candidate extraction program 43 identifies all the multi-conditional sentences whose subject matches the subject of the ambiguous part extracted from the target document from among some multi-conditional sentences registered in the multi-condition table 50. Then, each of these multi-conditional statements is extracted as a correction candidate for the ambiguous part.

例えば、対象文書における曖昧箇所が「メモリを多く使用する」というものであり、多条件テーブル50に「初回起動をするとき、メモリを4GB以上に増やす」という多条件文と、「KBE-500エラー発生時、メモリを16GBに増量する」という多条件文とが格納されていた場合、訂正候補抽出プログラム43は、これらの多条件文をかかる曖昧箇所の訂正候補として抽出する。 For example, the ambiguous part in the target document is "uses a lot of memory", and in the multi-condition table 50, there is a multi-condition statement "increase the memory to 4GB or more when starting for the first time" and "KBE-500 error". When the multi-conditional statement "Increase the memory to 16GB when it occurs" is stored, the correction candidate extraction program 43 extracts these multi-conditional statements as correction candidates of the ambiguous part.

訂正候補スコア付けプログラム44は、訂正候補抽出プログラム43により対象文書内の各曖昧箇所についてそれぞれ抽出された訂正候補ごとに、その訂正候補に含まれる数値を対応する曖昧箇所の述語動詞の修飾語として追加することの適正度合を表すスコア(以下、これを訂正候補スコアと呼ぶ)をそれぞれ算出し、算出した訂正候補スコアをその訂正候補に付与する機能を有するプログラムである。 The correction candidate scoring program 44 uses the numerical value included in the correction candidate as a modifier of the predicate verb of the corresponding ambiguity for each correction candidate extracted for each ambiguity in the target document by the correction candidate extraction program 43. It is a program having a function of calculating a score indicating the appropriateness of addition (hereinafter, this is referred to as a correction candidate score) and assigning the calculated correction candidate score to the correction candidate.

訂正箇所・訂正内容表示プログラム45は、対象文書内のユーザにより指定された曖昧箇所の各訂正候補に関する情報(多条件テーブル50に格納されている対応する多条件文の情報)や、これら訂正候補の訂正候補スコアに基づいて、図9について後述する曖昧箇所訂正支援画面70や図10について後述する訂正候補詳細画面100を表示装置17に表示する機能を有するプログラムである。ユーザは、対象文書内の対応する曖昧箇所についてどの訂正候補の数値を利用して内容を明瞭化するかを、この曖昧箇所訂正支援画面70や訂正候補詳細画面100を用いて判断及び選択したり、選択した訂正候補の数値を利用してかかる曖昧箇所を実際に訂正することができる。 The correction part / correction content display program 45 includes information on each correction candidate (corresponding multi-condition statement information stored in the multi-condition table 50) of the ambiguous part specified by the user in the target document, and these correction candidates. Based on the correction candidate score of FIG. 9, the program has a function of displaying the ambiguous portion correction support screen 70 described later for FIG. 9 and the correction candidate detail screen 100 described later for FIG. 10 on the display device 17. The user can use the ambiguity correction support screen 70 and the correction candidate detail screen 100 to determine and select which correction candidate numerical value is used to clarify the content of the corresponding ambiguity in the target document. , The ambiguous part can be actually corrected by using the numerical value of the selected correction candidate.

選択訂正候補学習部46は、曖昧箇所訂正支援画面70(図9)上でユーザにより設定された、当該曖昧箇所訂正支援画面70に情報を表示すべき訂正候補のフィルタリング条件を抽出して図5について後述する重みテーブル53に登録する機能を有するプログラムである。重みテーブル53に登録された情報は、その後、訂正候補の訂正候補スコアを算出する際に利用される。 The selection correction candidate learning unit 46 extracts the filtering conditions of the correction candidates for which information should be displayed on the ambiguity correction support screen 70 set by the user on the ambiguity correction support screen 70 (FIG. 9), and FIG. Is a program having a function of registering in the weight table 53, which will be described later. The information registered in the weight table 53 is subsequently used when calculating the correction candidate score of the correction candidate.

また訂正結果表示部47は、ユーザにより対象文書内の各曖昧箇所について行われた訂正作業の作業結果(つまり訂正後の曖昧箇所)を表示装置17に表示する機能を有するプログラムである。訂正結果表示部47は、対象文書内のユーザにより訂正されなかった曖昧箇所については、訂正候補スコアが最も高い訂正候補を用いてその曖昧箇所を訂正(つまり、その訂正候補を述語動詞の修飾語として追加するよう訂正)する。 Further, the correction result display unit 47 is a program having a function of displaying the work result (that is, the ambiguous part after correction) of the correction work performed for each ambiguity in the target document on the display device 17. The correction result display unit 47 corrects the ambiguity that was not corrected by the user in the target document by using the correction candidate having the highest correction candidate score (that is, the correction candidate is a modifier of the predicate verb). Correct to add as).

さらに同様訂正箇所判定部48は、ファイルサーバ4に蓄積された各蓄積文書から、対象文書内の訂正された各曖昧箇所と同じ構文(名詞及び述語動詞の組合わせ)の文章の一部又は全部を蓄積文書の曖昧箇所として抽出し、その曖昧箇所の訂正候補をユーザに提示する機能を有するプログラムである。 Further, similarly, the correction part determination unit 48 performs a part or all of the sentence of the same syntax (combination of noun and predicative verb) as each corrected ambiguity part in the target document from each stored document stored in the file server 4. Is a program having a function of extracting as an ambiguous part of a stored document and presenting a correction candidate of the ambiguous part to a user.

一方、多条件テーブル50は、上述のように多条件テーブル作成プログラム40により蓄積文書から抽出された上述の多条件文に関する必要な情報を記憶及び管理するために利用されるテーブルであり、図2に示すように、発生条件欄50A、主語欄50B、数値欄50C、動作欄50D、原文欄50E、製品名欄50F、バージョン欄50G、作成日欄50H及び作成者欄50Iを備えて構成される。多条件テーブル50では、1つの行が蓄積文書から抽出された1つの多条件文に対応する。 On the other hand, the multi-condition table 50 is a table used for storing and managing necessary information regarding the above-mentioned multi-condition statement extracted from the stored document by the multi-condition table creation program 40 as described above, and is used in FIG. As shown in, the generation condition column 50A, the subject column 50B, the numerical value column 50C, the operation column 50D, the original text column 50E, the product name column 50F, the version column 50G, the creation date column 50H, and the creator column 50I are provided. .. In the multi-condition table 50, one row corresponds to one multi-condition statement extracted from the stored document.

そして原文欄50Eには、蓄積文書から抽出された多条件文が格納される。また主語欄50Bには、その多条件文において主語に該当する部分の文節が格納され、動作欄50Dには、その多条件文において述語動詞に該当する部分の文節が格納される。さらに数値欄50Cには、その多条件文において述語動詞により表される動作の程度を表す数値の文節が格納され、発生条件欄50Aには、対応する多条件文において述語動詞により表される動作が発生するための発生条件が格納される。 Then, in the original text column 50E, a multi-conditional sentence extracted from the stored document is stored. Further, the subject column 50B stores the phrase of the part corresponding to the subject in the multi-conditional sentence, and the action column 50D stores the phrase of the part corresponding to the predicate verb in the multi-conditional sentence. Further, the numerical value column 50C stores a numerical clause indicating the degree of the action represented by the predicate verb in the multi-conditional sentence, and the generation condition column 50A stores the action represented by the predicate verb in the corresponding multi-conditional sentence. Occurrence condition is stored.

例えば、図2に示すように、原文欄50Eに格納された多条件文が「初回起動をするとき、メモリを4GB以上に増やす」というものであった場合、主語欄50Bには「メモリを」、動作欄50Dには「増やす」、数値欄50Cには「4GB以上に」が格納され、発生条件欄50Aには「初回起動をするとき」が格納される。 For example, as shown in FIG. 2, when the multi-conditional sentence stored in the original text column 50E is "Increase the memory to 4 GB or more at the first startup", "Memory" is displayed in the subject column 50B. , "Increase" is stored in the operation column 50D, "4GB or more" is stored in the numerical value column 50C, and "when the first startup is performed" is stored in the generation condition column 50A.

また製品名欄50F及びバージョン欄50Gには、それぞれその多条件文を抽出した蓄積文書が関連する製品の製品名及びバージョン(製品バージョン)が格納され、作成日欄50H及び作成者欄50Iには、それぞれその蓄積文書の作成日及び作成者が格納される。なお、これら製品名、バージョン、作成日及び作成者の情報は、ファイルサーバ4に格納された対応する蓄積文書のファイル情報FLI(図1)から多条件テーブル作成プログラム40により取得されて多条件テーブル50に登録される。 Further, in the product name column 50F and the version column 50G, the product name and version (product version) of the product related to the stored document from which the multi-conditional sentence is extracted are stored, and in the creation date column 50H and the creator column 50I, respectively. , The creation date and creator of the stored document are stored, respectively. The product name, version, creation date, and creator information are acquired by the multi-condition table creation program 40 from the file information FLI (FIG. 1) of the corresponding stored document stored in the file server 4 and are multi-condition tables. Registered in 50.

従って、図2の例の場合、「初回起動をするとき、メモリを4GB以上に増やす」という原文を含む蓄積文書は、「Product1」という製品名の「7.0.0」というバージョンのソフトウェアに関する文書であり、「2010/07/05」に「A」という人が作成したものであることが示されている。 Therefore, in the case of the example of FIG. 2, the stored document including the original text "Increase the memory to 4 GB or more at the first startup" is a document related to the software version "7.0.0" with the product name "Product1". Yes, it is shown in "2010/07/05" that it was created by a person named "A".

曖昧単語テーブル51は、事前に登録された曖昧単語を記憶保持するために利用されるテーブルであり、図3に示すように、「多い」、「少ない」、「長期間」及び「少し」などの曖昧単語が格納される。 The ambiguous word table 51 is a table used for storing and retaining pre-registered ambiguous words, and as shown in FIG. 3, "more", "less", "long-term", "a little", etc. Ambiguous word is stored.

なお、この曖昧単語テーブル51は、ユーザが手作業により作成するようにしてもよく、また曖昧箇所訂正支援装置3が自動的に作成するようにしてもよい。後者の場合、ユーザが種となる「ディスク」、「メモリ」及び「通信速度」などの名詞を曖昧箇所訂正支援装置3に与え、曖昧箇所訂正支援装置3が、ファイルサーバ4に蓄積された各蓄積文書内でかかる名詞を検索し、その名詞に係り受けしている形容表現の単語を曖昧単語として抽出して曖昧単語テーブル51に登録するようにすればよい。 The ambiguous word table 51 may be manually created by the user, or may be automatically created by the ambiguous part correction support device 3. In the latter case, the user gives a noun such as "disk", "memory", and "communication speed" to the ambiguity correction support device 3, and the ambiguity correction support device 3 is stored in the file server 4. The noun may be searched for in the stored document, and the word of the adjective expression dependent on the noun may be extracted as an ambiguous word and registered in the ambiguous word table 51.

また曖昧構文テーブル52は、事前に登録された曖昧構文を記憶保持するために利用されるテーブルであり、図4に示すように、主語欄52A及び述語動詞欄52Bを備えて構成される。曖昧構文テーブル52では、1つの行が曖昧構文を構成する1つの名詞に対応する。そして主語欄52Aには、対応する曖昧構文における主語が格納され、述語動詞欄52Bには、その曖昧構文における述語動詞が格納される。 Further, the ambiguous syntax table 52 is a table used for storing and holding a pre-registered ambiguous syntax, and is configured to include a subject column 52A and a predicate verb column 52B as shown in FIG. In the ambiguous syntax table 52, one row corresponds to one noun constituting the ambiguous syntax. The subject column 52A stores the subject in the corresponding ambiguous syntax, and the predicate verb column 52B stores the predicate verb in the ambiguous syntax.

なお、この曖昧構文テーブル52は、ユーザが手作業により作成するようにしてもよく、また曖昧箇所訂正支援装置3が自動的に作成するようにしてもよい。後者の場合、ユーザが種となる名詞を曖昧箇所訂正支援装置3に与え、曖昧箇所訂正支援装置3が、ファイルサーバ4に蓄積された各蓄積文書内でかかる名詞を検索し、その名詞に係り受けしている述語動詞と、その名詞との組み合わせを曖昧構文として曖昧構文テーブル52に登録するようにすればよい。 The ambiguity syntax table 52 may be manually created by the user, or may be automatically created by the ambiguity correction support device 3. In the latter case, the user gives a noun as a seed to the ambiguity correction support device 3, and the ambiguity correction support device 3 searches for such a noun in each stored document stored in the file server 4, and is related to the noun. The combination of the received predicative verb and its noun may be registered in the ambiguous syntax table 52 as an ambiguous syntax.

重みテーブル53は、ユーザが、表示装置17に表示された図9について後述する曖昧箇所訂正支援画面70を用いて訂正候補を絞り込む際に指定したフィルタリング条件を記憶及び管理するために利用されるテーブルである。 The weight table 53 is a table used for storing and managing the filtering conditions specified by the user when narrowing down the correction candidates using the ambiguity correction support screen 70 described later for FIG. 9 displayed on the display device 17. Is.

実際上、本曖昧箇所訂正支援装置3では、ユーザは、対象文書内のそのとき対象としている曖昧箇所の各訂正候補の内容を図9の曖昧箇所訂正支援画面70や図10の訂正候補詳細画面100を用いてそれぞれ確認する際、これら訂正候補の中から所望する訂正候補を絞り込むために、訂正候補の抽出元の蓄積文書が関連する製品の製品名及びバージョンや、その蓄積文書の作成日及び作成者、並びに、その蓄積文書のドキュメント種別(メール、設計メモ及び設計資料など)をフィルタリング条件として設定することができる。重みテーブル53は、このように設定されたフィルタリング条件を記憶及び管理するためのテーブルである。 In practice, in the ambiguity correction support device 3, the user can change the content of each correction candidate of the ambiguity target at that time in the target document to the ambiguity correction support screen 70 of FIG. 9 and the correction candidate detail screen of FIG. When confirming each using 100, in order to narrow down the desired correction candidates from these correction candidates, the product name and version of the product to which the stored document from which the correction candidate is extracted is related, the creation date of the stored document, and the date of creation of the stored document and The creator and the document type (email, design memo, design material, etc.) of the stored document can be set as filtering conditions. The weight table 53 is a table for storing and managing the filtering conditions set in this way.

この重みテーブル53は、図5に示すように、識別ID欄53A、曖昧文章ID欄53B、第1の製品名欄53C、第1のバージョン欄53D、第1の作成日欄53E、第1の作成者欄53F、ドキュメント種別欄53G、訂正元文章ID欄53H、第2の製品名欄53I、第2のバージョン欄53J、第2の作成日欄53K及び第2の作成者欄53Lを備えて構成される。重みテーブル53では、1つの行が対象文書内の1つの曖昧箇所に対して設定された各フィルタリング条件の内容に対応する。 As shown in FIG. 5, the weight table 53 includes an identification ID column 53A, an ambiguous sentence ID column 53B, a first product name column 53C, a first version column 53D, a first creation date column 53E, and a first. It has a creator column 53F, a document type column 53G, a correction source sentence ID column 53H, a second product name column 53I, a second version column 53J, a second creation date column 53K, and a second creator column 53L. It is composed. In the weight table 53, one row corresponds to the content of each filtering condition set for one ambiguity in the target document.

そして識別ID欄53Aには、重みテーブル53においてその行の情報に対して付与された識別IDが格納され、曖昧文章ID欄53Bには、その対象文書内の各文章に対してそれぞれ付与されたその文章に固有の識別ID(文書ID)のうち、曖昧表現の訂正が行われた曖昧箇所を含む文章の文章IDが格納される。 The identification ID column 53A stores the identification ID assigned to the information in the row in the weight table 53, and the ambiguous sentence ID column 53B is assigned to each sentence in the target document. Among the identification IDs (document IDs) unique to the text, the text ID of the text including the ambiguous part where the ambiguous expression has been corrected is stored.

また第1の製品名欄53Cには、対応するフィルタリング条件として、訂正候補の抽出元の蓄積文書が関連する製品の製品名が設定されていた場合には「1」が格納され、当該フィルタリング条件としてかかる製品名が設定されていなかった場合には「0」が格納される。 Further, in the first product name column 53C, "1" is stored as the corresponding filtering condition when the product name of the product related to the stored document of the extraction source of the correction candidate is set, and the filtering condition is stored. If such a product name is not set, "0" is stored.

同様に、第1のバージョン欄53Dには、対応するフィルタリング条件として、訂正候補の抽出元の蓄積文書が関連する製品のバージョンが設定されていた場合には「1」が格納され、当該フィルタリング条件としてかかるバージョンが設定されていなかった場合には「0」が格納される。 Similarly, in the first version column 53D, "1" is stored as the corresponding filtering condition when the version of the product related to the stored document of the extraction source of the correction candidate is set, and the filtering condition is stored. If such a version is not set, "0" is stored.

また第1の作成日欄53Eには、対応するフィルタリング条件として訂正候補の抽出元の蓄積文書の作成日が設定されていた場合には「1」が格納され、当該フィルタリング条件としてかかる作成日が設定されていなかった場合には「0」が格納される。 Further, in the first creation date column 53E, if the creation date of the stored document of the extraction source of the correction candidate is set as the corresponding filtering condition, "1" is stored, and the creation date is set as the filtering condition. If it is not set, "0" is stored.

さらに第1の作成者欄53Fには、対応するフィルタリング条件として訂正候補の抽出元の蓄積文書の作成者が設定されていた場合には「1」が格納され、当該フィルタリング条件としてかかる作成者が設定されていなかった場合には「0」が格納される。 Further, in the first creator column 53F, if the creator of the stored document of the extraction source of the correction candidate is set as the corresponding filtering condition, "1" is stored, and the creator is stored as the filtering condition. If it is not set, "0" is stored.

さらにドキュメント種別欄53Gには、対応するフィルタリング条件として訂正候補の抽出元の蓄積文書のドキュメント種別が設定されていた場合には「1」が格納され、当該フィルタリング条件としてかかるドキュメント種別が設定されていなかった場合には「0」が格納される。 Further, in the document type column 53G, "1" is stored when the document type of the stored document from which the correction candidate is extracted is set as the corresponding filtering condition, and the document type is set as the filtering condition. If not, "0" is stored.

訂正元文章ID欄53Hには、最終的に選択された訂正候補の抽出元の蓄積文書(以下、これを最終選択訂正候補抽出元文書と呼ぶ)におけるその訂正候補を含む文章の文章IDが格納される。 In the correction source sentence ID column 53H, the sentence ID of the sentence including the correction candidate in the accumulated document of the extraction source of the finally selected correction candidate (hereinafter, this is referred to as the final selection correction candidate extraction source document) is stored. Will be done.

また第2の製品名欄53Iには、かかる最終選択訂正候補抽出元文書が関連する製品の製品名が格納され、第2のバージョン欄53Jには、当該製品の製品バージョンが格納される。さらに第2の作成日欄53Kには、最終選択訂正候補抽出元文書の作成日が格納され、第2の作成者欄53Lには、最終選択訂正候補抽出元文書の作成者が格納される。 Further, the product name of the product to which the final selection correction candidate extraction source document is related is stored in the second product name column 53I, and the product version of the product is stored in the second version column 53J. Further, the creation date of the final selection correction candidate extraction source document is stored in the second creation date column 53K, and the creator of the final selection correction candidate extraction source document is stored in the second creator column 53L.

従って、図5の例の場合、対象文書における「145987234」という文章IDが付与された文章の曖昧箇所について適切な訂正候補を抽出する際、ユーザは、曖昧箇所訂正支援画面70(図9)において「製品名」、「バージョン」をフィルタリング条件として設定しており、この曖昧箇所について最終的に数値が適用された訂正候補を含む蓄積文書内の文章の文章IDが「076342456」で、最終選択訂正候補抽出元文書が関連する製品の製品名は「Product1」、その製品バージョンは「10.0.0」、また最終選択訂正候補抽出元文書の作成日は「2010/05/17」、作成者は「A」であったことが示されている。 Therefore, in the case of the example of FIG. 5, when extracting an appropriate correction candidate for the ambiguous part of the sentence to which the sentence ID "145987234" is given in the target document, the user uses the ambiguous part correction support screen 70 (FIG. 9). "Product name" and "Version" are set as filtering conditions, and the text ID of the text in the accumulated document including the correction candidate to which the numerical value is finally applied to this ambiguous part is "076342456", and the final selection correction The product name of the product to which the candidate extraction source document is related is "Product1", the product version is "10.0.0", the creation date of the final selection correction candidate extraction source document is "2010/05/17", and the creator is " It is shown that it was "A".

同一構文判定テーブル54は、ユーザにより訂正された対象文書内の曖昧箇所の構文(曖昧構文)を記憶及び管理するために利用されるテーブルであり、図6に示すように、主語欄54A及び述語動詞欄54Bを備えて構成される。同一構文判定テーブル54では、1つの行がユーザにより訂正された1つの曖昧箇所の構文に対応する。そして主語欄54Aには、対応する曖昧構文における主語が格納され、述語動詞欄54Bには、その曖昧構文における述語動詞が格納される。 The same syntax determination table 54 is a table used for storing and managing the syntax (ambiguous syntax) of the ambiguous part in the target document corrected by the user, and as shown in FIG. 6, the subject column 54A and the predicate It is configured with a verb column 54B. In the same syntax determination table 54, one row corresponds to the syntax of one ambiguity corrected by the user. The subject column 54A stores the subject in the corresponding ambiguous syntax, and the predicate verb column 54B stores the predicate verb in the ambiguous syntax.

製品名テーブル55は、現在までに販売等した製品のバージョン範囲を管理するために利用されるテーブルであり、図7に示すように、番号欄55A、製品名欄55B及びバージョン範囲欄55Cを備えて構成される。製品名テーブル55では、1つの行が1つの製品名に対応する。 The product name table 55 is a table used for managing the version range of products sold so far, and includes a number column 55A, a product name column 55B, and a version range column 55C as shown in FIG. 7. It is composed of. In the product name table 55, one row corresponds to one product name.

そして番号欄55Aには、この製品名テーブル55において各製品名に対してそれぞれ付与された識別番号が格納され、製品名欄55Bには、対応する製品の製品名が格納される。またバージョン範囲欄55Cには、その製品のバージョンの範囲が格納される。従って、図7の例の場合、製品名テーブルにおいて「1」という識別番号が付与された「Product1」という製品名の製品のバージョン範囲は「3.0.0~9.2.0」であることが示されている。 The identification number assigned to each product name in the product name table 55 is stored in the number column 55A, and the product name of the corresponding product is stored in the product name column 55B. Further, the version range of the product is stored in the version range column 55C. Therefore, in the case of the example of FIG. 7, it is shown that the version range of the product with the product name "Product1" to which the identification number "1" is given in the product name table is "3.0.0 to 9.2.0". ing.

なお製品名テーブル55は、ユーザが予め手作業により作成するようにしてもよく、また本曖昧箇所訂正支援装置3が自動的に作成するようにしてもよい。後者の場合、曖昧箇所訂正支援装置3は、各蓄積文書の文書ファイル情報FLI(図1)からその蓄積文書が関連する製品の製品名及びバージョンを抽出し、抽出したこれらの情報に基づいてこれまでの各製品の製品名及びそのバージョン範囲を検出して、これを製品名テーブル55に登録するようにすればよい。 The product name table 55 may be manually created by the user in advance, or may be automatically created by the ambiguity correction support device 3. In the latter case, the ambiguity correction support device 3 extracts the product name and version of the product to which the stored document is related from the document file information FLI (FIG. 1) of each stored document, and based on the extracted information. The product name of each product up to and the version range thereof may be detected and registered in the product name table 55.

(3)各種画面の構成
図8は、訂正候補スコア付けプログラム44(図1)の処理結果に基づいて訂正箇所・訂正内容表示プログラム45(図1)により曖昧箇所訂正支援装置3(図1)の表示装置17(図1)に表示される曖昧箇所提示画面60の構成例を示す。この曖昧箇所提示画面60では、対象文書のテキストが表示されると共に、曖昧単語抽出プログラム41(図1)や曖昧構文抽出プログラム42(図1)により抽出された当該テキスト内の曖昧箇所が着色又はマーキングなどの方法により強調表示される。なお、図8は、かかるテキストの曖昧箇所がマーキングされた例を示している。
(3) Configuration of various screens FIG. 8 shows an ambiguous part correction support device 3 (FIG. 1) by the correction part / correction content display program 45 (FIG. 1) based on the processing result of the correction candidate scoring program 44 (FIG. 1). An example of the configuration of the ambiguous portion presentation screen 60 displayed on the display device 17 (FIG. 1) is shown. On the ambiguity presentation screen 60, the text of the target document is displayed, and the ambiguity in the text extracted by the ambiguity word extraction program 41 (FIG. 1) or the ambiguity syntax extraction program 42 (FIG. 1) is colored or It is highlighted by a method such as marking. Note that FIG. 8 shows an example in which the ambiguity of the text is marked.

そして曖昧箇所提示画面60内の強調表示された1つの曖昧箇所をクリックにより指定すると、この曖昧箇所提示画面60に重ねて図9に示す曖昧箇所訂正支援画面70が表示される。この曖昧箇所訂正支援画面70は、曖昧箇所提示画面60でユーザが指定した曖昧箇所(以下、これをユーザ指定曖昧箇所と呼ぶ)の内容を数値的に明瞭化する訂正作業を支援する画面であり、グラフ表示フィルタリング領域71と、フィルタリングパラメータ領域72とを備えて構成される。 Then, when one highlighted ambiguity portion in the ambiguity portion presentation screen 60 is designated by clicking, the ambiguity portion correction support screen 70 shown in FIG. 9 is displayed on the ambiguity portion presentation screen 60. The ambiguity correction support screen 70 is a screen that supports correction work for numerically clarifying the contents of the ambiguity designated by the user on the ambiguity presentation screen 60 (hereinafter, this is referred to as a user-specified ambiguity). , The graph display filtering area 71 and the filtering parameter area 72 are provided.

グラフ表示フィルタリング領域71は、3次元グラフ表示領域80及びグラフ表示調整領域81から構成される。そして3次元グラフ表示領域80には、訂正候補スコアをz軸、訂正候補の数値をx軸、後述するフィルタリングパラメータ設定領域72において選択されたフィルタリング条件の項目をy軸とする3次元座標(以下、これを3次元グラフと呼ぶ)83が表示される。なお、図9は、フィルタリングパラメータ設定領域72において選択されたフィルタリング条件の項目が「バージョン」であった場合の例である。この場合、x軸には、ユーザ指定曖昧箇所について抽出された各訂正候補にそれぞれ含まれる「数値」の最小値から最大値の範囲内で目盛りが表示される。 The graph display filtering area 71 is composed of a three-dimensional graph display area 80 and a graph display adjustment area 81. Then, in the three-dimensional graph display area 80, three-dimensional coordinates (hereinafter, the correction candidate score is the z-axis, the correction candidate numerical value is the x-axis, and the item of the filtering condition selected in the filtering parameter setting area 72 described later is the y-axis). , This is called a three-dimensional graph) 83 is displayed. Note that FIG. 9 is an example in which the item of the filtering condition selected in the filtering parameter setting area 72 is “version”. In this case, a scale is displayed on the x-axis within the range of the minimum value to the maximum value of the "numerical value" included in each correction candidate extracted for the user-specified ambiguity.

また3次元グラフ83内には、ユーザ指定曖昧箇所について訂正候補抽出プログラム43(図1)により抽出された各訂正候補にそれぞれ対応する直方体形状のブロック84が対応するxy座標位置にそれぞれ表示される。この際、x軸方向及びy軸方向の値がいずれも同じ訂正候補が複数存在する場合、これら訂正候補にそれぞれ対応する各ブロック84は、同じxy座標位置に積み上げられて表示される。 Further, in the three-dimensional graph 83, the rectangular parallelepiped block 84 corresponding to each correction candidate extracted by the correction candidate extraction program 43 (FIG. 1) for the user-specified ambiguity is displayed at the corresponding xy coordinate position. .. At this time, when there are a plurality of correction candidates having the same values in the x-axis direction and the y-axis direction, the blocks 84 corresponding to the correction candidates are stacked and displayed at the same xy coordinate position.

また各ブロック84は、それぞれ対応する訂正候補について訂正候補スコア付けプログラム44(図1)により付与された訂正候補スコアに応じた高さでそれぞれ表示される。これにより3次元グラフ83では、ブロック84の積上げ個数と、各ブロック84の高さとに基づいて、どのブロック84に対応する訂正候補の「数値」が適正であるかをユーザが視覚的に瞬時に判断できるようになされている。 Further, each block 84 is displayed at a height corresponding to the correction candidate score given by the correction candidate scoring program 44 (FIG. 1) for the corresponding correction candidate. As a result, in the three-dimensional graph 83, the user can visually and instantly visually determine which block 84 the "numerical value" of the correction candidate corresponding to which block 84 is appropriate based on the number of stacked blocks 84 and the height of each block 84. It is made to be able to judge.

またグラフ表示調整領域81には、訂正候補スコア範囲調整スライドバー85及び記述文章数調整スライドバー86と、対応する各訂正候補をそれぞれ抽出した各蓄積文書のドキュメント種別(メール、設計メモ及び設計資料など)の種別名をそれぞれ表す文字列87と、これらドキュメント種別にそれぞれ対応付けられたチェックボックス(以下、これをドキュメント種別選択用チェックボックスと呼ぶ)88とがそれぞれ表示される。 Further, in the graph display adjustment area 81, a correction candidate score range adjustment slide bar 85, a description sentence number adjustment slide bar 86, and a document type (email, design memo, and design material) of each accumulated document from which each corresponding correction candidate is extracted are provided. A character string 87 representing each type name of (such as) and a check box 88 associated with each of these document types (hereinafter, this is referred to as a document type selection check box) 88 are displayed.

そしてユーザは、訂正候補スコア範囲調整スライドバー85をスライド操作することによって、ユーザ指定曖昧箇所について抽出された複数の訂正候補の中から対応するブロック84を3次元グラフ83に表示すべき訂正候補の訂正候補スコアの範囲を設定することができる。従って、3次元グラフ84には、訂正候補スコア範囲調整スライドバー85を用いて設定された範囲内の訂正候補スコアが付与された訂正候補に対応するブロック84のみが表示され、かかる範囲から外れた訂正候補スコアが付与された訂正候補に対応するブロック84は表示されない。 Then, the user slides the correction candidate score range adjustment slide bar 85 to display the corresponding block 84 from the plurality of correction candidates extracted for the user-specified ambiguity in the three-dimensional graph 83. The range of correction candidate scores can be set. Therefore, in the three-dimensional graph 84, only the block 84 corresponding to the correction candidate to which the correction candidate score within the range set by using the correction candidate score range adjustment slide bar 85 is given is displayed, and the block 84 is out of the range. The block 84 corresponding to the correction candidate to which the correction candidate score is given is not displayed.

またユーザは、記述文章数調整スライドバー86を操作することによって、3次元グラフ83内にブロック84を表示すべき、ブロック84の積上げ個数の最低数を設定することができる。なお、ここでの「積上げ個数」とは、同じxy座標に積み上げられたブロック84の数を指す。従って、例えば、積上げ個数が「1」に設定された場合には、対応するすべての訂正候補にそれぞれ対応するブロック84が3次元グラフ83内に表示される一方で、積上げ個数が「2」に設定された場合には、対応する訂正候補のうち、同じxy座標位置にブロック84が表示される他の訂正候補が存在しない訂正候補のブロック84は表示されない。同様に、積上げ数が「3」に設定された場合には、対応する訂正候補のうち、同じxy座標位置にブロック84が表示される他の訂正候補が2つ以上存在しない訂正候補のブロック84は表示されない。 Further, the user can set the minimum number of stacked blocks 84 to be displayed in the three-dimensional graph 83 by operating the slide bar 86 for adjusting the number of described sentences. The "stacked number" here refers to the number of blocks 84 stacked at the same xy coordinates. Therefore, for example, when the number of stacked items is set to "1", the block 84 corresponding to all the corresponding correction candidates is displayed in the three-dimensional graph 83, while the number of stacked items is set to "2". When set, among the corresponding correction candidates, the block 84 of the correction candidate in which the block 84 is displayed at the same xy coordinate position does not exist is not displayed. Similarly, when the number of stacks is set to "3", among the corresponding correction candidates, the block 84 is displayed at the same xy coordinate position. The block 84 of the correction candidate does not have two or more other correction candidates. Is not displayed.

さらにユーザは、所望するドキュメント種別選択用チェックボックス88をクリックして、当該ドキュメント種別選択用チェックボックス88の表示形態を対応するドキュメント種別が選択された状態(黒く塗り潰された状態)に設定することにより、ユーザ指定曖昧箇所について抽出された複数の訂正候補の中から対応するブロック84を3次元グラフ83内に表示すべき当該訂正候補の抽出元の蓄積文書のドキュメント種別を選択することができる。例えば、図9の例の場合、ドキュメント種別として「メール(msg)」、「設計メモ(.txt)」及び「設計資料(.doc/docx)」のみが選択されているため、3次元グラフ83内には、ユーザ指定曖昧箇所について抽出された複数の訂正候補のうち、これらのドキュメント種別の蓄積文書から抽出された各訂正候補にそれぞれ対応するブロック84のみが表示される。 Further, the user clicks the desired document type selection check box 88 and sets the display form of the document type selection check box 88 to the state in which the corresponding document type is selected (the state filled in black). Therefore, it is possible to select the document type of the stored document from which the correction candidate is extracted, in which the corresponding block 84 should be displayed in the three-dimensional graph 83 from the plurality of correction candidates extracted for the user-specified ambiguity. For example, in the case of the example of FIG. 9, since only "mail (msg)", "design memo (.txt)" and "design document (.doc / docx)" are selected as the document types, the three-dimensional graph 83 Of the plurality of correction candidates extracted for the user-specified ambiguity, only the block 84 corresponding to each correction candidate extracted from the accumulated document of these document types is displayed.

一方、フィルタリングパラメータ領域72は、訂正候補について取得される対応する蓄積文書のメタ情報の各項目にそれぞれ対応させて区分されている。本実施の形態の場合、これらの項目として、図2のように「製品名」、「バージョン」、「作成日」及び「作成者」の4つの項目があるため、図9では、フィルタリングパラメータ領域72がこれら4つの項目(以下、これをフィルタリング条件項目と呼ぶ)にそれぞれ対応させて4つの領域部分72A~72Dに区分された例を示している。 On the other hand, the filtering parameter area 72 is divided so as to correspond to each item of the meta information of the corresponding stored document acquired for the correction candidate. In the case of the present embodiment, there are four items as these items, "product name", "version", "creation date", and "creator" as shown in FIG. 2. Therefore, in FIG. 9, the filtering parameter area is shown. 72 shows an example in which each of these four items (hereinafter, referred to as a filtering condition item) is divided into four region portions 72A to 72D.

そしてフィルタリングパラメータ領域72内の「製品名」に対応する領域部分72Aには、ユーザ指定曖昧箇所について抽出された複数の訂正候補の抽出元の各蓄積文書がそれぞれ関連している各製品の製品名をそれぞれ表す文字列90と、これら製品名とそれぞれ対応付けられたチェックボックス91とが表示される。そしてユーザは、これらのチェックボックス91の中から所望するチェックボックス91をクリックしてそのチェックボックス91の表示形態を対応する製品名が選択された状態(黒く塗り潰された状態)に設定することにより、ユーザ指定曖昧箇所について抽出された複数の訂正候補の中から、3次元グラフ83内に対応するブロック84を表示させるべき訂正候補が抽出された抽出元の蓄積文書が関連する製品の製品名をフィルタリング条件として設定することができる。図9では、かかる製品名として「Product1」、「Product2」及び「Product4」という3つの製品の製品名が検出され、これらの製品名の中から「Product1」という製品名がフィルタリング条件として設定された例が示されている。 Then, in the area portion 72A corresponding to the "product name" in the filtering parameter area 72, the product name of each product to which each stored document of the extraction source of the plurality of correction candidates extracted for the user-specified ambiguity is related. A character string 90 representing each of these product names and a check box 91 associated with each of these product names are displayed. Then, the user clicks the desired check box 91 from these check boxes 91 and sets the display form of the check box 91 to the state in which the corresponding product name is selected (the state filled in black). , The product name of the product related to the stored document of the extraction source from which the correction candidates for which the corresponding block 84 should be displayed in the three-dimensional graph 83 are extracted from the plurality of correction candidates extracted for the user-specified ambiguity. It can be set as a filtering condition. In FIG. 9, the product names of the three products "Product1", "Product2" and "Product4" were detected as such product names, and the product name "Product1" was set as the filtering condition from these product names. An example is shown.

またフィルタリングパラメータ領域72内の「バージョン」に対応する領域部分72Bには、バージョン範囲設定スライドバー92が表示される。そしてユーザは、このバージョン範囲設定スライドバー92を利用して、ユーザ指定曖昧箇所について抽出された複数の訂正候補の抽出元の各蓄積文書がそれぞれ対応する製品のバージョン範囲の中から、対応するブロック84を3次元グラフ83内に表示させるべき訂正候補の抽出元の蓄積文書が対応する製品のバージョン範囲を指定することができる。図9では、ユーザ指定曖昧箇所について抽出された複数の訂正候補の抽出元の各蓄積文書がそれぞれ対応する製品のバージョン範囲が「V1.0.0」~「V10.0.0」であったため、このバージョン範囲内で対応するブロック84を3次元グラフ83内に表示させるべき訂正候補の抽出元の各蓄積文書のバージョン範囲を指定できるようスライドバーの目盛りが表記された例が示されている。 Further, the version range setting slide bar 92 is displayed in the area portion 72B corresponding to the “version” in the filtering parameter area 72. Then, the user uses this version range setting slide bar 92 to block the corresponding block from the corresponding product version range of each stored document of the extraction source of the plurality of correction candidates extracted for the user-specified ambiguity. It is possible to specify the version range of the product corresponding to the stored document of the extraction source of the correction candidate to be displayed in the three-dimensional graph 83. In FIG. 9, since the version range of the product corresponding to each stored document of the extraction source of the plurality of correction candidates extracted for the user-specified ambiguous part was "V1.0.0" to "V10.0.0", this version range. An example is shown in which the scale of the slide bar is shown so that the version range of each stored document of the extraction source of the correction candidate whose corresponding block 84 should be displayed in the three-dimensional graph 83 can be specified.

さらにフィルタリングパラメータ領域72内の「作成日」に対応する領域部分72Cには、作成日範囲設定スライドバー93が表示される。そしてユーザは、この作成日範囲設定スライドバー93を利用して、ユーザ指定曖昧箇所について抽出された複数の訂正候補の抽出元の各蓄積文書の作成日の中から、対応するブロック84を3次元グラフ83内に表示させるべき訂正候補の抽出元の各蓄積文書の作成日の範囲を指定することができる。図9では、ユーザ指定曖昧箇所について抽出された複数の訂正候補の抽出元の各蓄積文書の作成日がすべて「2000」年以降であったため、この範囲内で対応するブロック84を3次元グラフ83内に表示させるべき訂正候補の抽出元の各蓄積文書の作成日の範囲を指定できるよう作成日範囲設定スライドバー93の目盛りが表記された例が示されている。 Further, the creation date range setting slide bar 93 is displayed in the region portion 72C corresponding to the “creation date” in the filtering parameter region 72. Then, the user uses the creation date range setting slide bar 93 to three-dimensionally select the corresponding block 84 from the creation dates of each stored document of the extraction source of the plurality of correction candidates extracted for the user-specified ambiguity. It is possible to specify the range of the creation date of each stored document of the extraction source of the correction candidate to be displayed in the graph 83. In FIG. 9, since the creation date of each stored document of the extraction source of the plurality of correction candidates extracted for the user-specified ambiguous part was all after "2000", the corresponding blocks 84 within this range are shown in the three-dimensional graph 83. An example is shown in which the scale of the creation date range setting slide bar 93 is shown so that the creation date range of each stored document of the extraction source of the correction candidate to be displayed can be specified.

さらにフィルタリングパラメータ領域72内の「作成者」に対応する領域部分72Dには、ユーザ指定曖昧箇所について抽出された複数の訂正候補の抽出元の各蓄積文書の作成者の氏名をそれぞれ表す文字列94と、これら氏名にそれぞれ対応付けられたチェックボックス95とが表示される。そしてユーザは、これら作成者の氏名の中から所望する作成者に対応するチェックボックス95をクリックして当該チェックボックス95の表示形態を対応する作成者を選択した状態(黒く塗り潰された状態)に設定することにより、ユーザ指定曖昧箇所について抽出された複数の訂正候補の中から、3次元グラフ83内に対応するブロック84を表示させるべき訂正候補が抽出された抽出元の蓄積文書の作成者をフィルタリング条件として設定することができる。図9では、かかる作成者として「A」、「B」、「C」及び「D」という4人の作成者が検出され、これら4人すべての作成者がフィルタリング条件として設定された例が示されている。 Further, in the area portion 72D corresponding to the "creator" in the filtering parameter area 72, a character string 94 representing the name of the creator of each stored document from which a plurality of correction candidates extracted for the user-specified ambiguity are extracted. And the check box 95 associated with each of these names are displayed. Then, the user clicks the check box 95 corresponding to the desired creator from among the names of these creators, and selects the corresponding creator for the display form of the check box 95 (the state filled in black). By setting, the creator of the storage document of the extraction source from which the correction candidates for which the corresponding block 84 should be displayed in the three-dimensional graph 83 is extracted from the plurality of correction candidates extracted for the user-specified ambiguous part is selected. It can be set as a filtering condition. FIG. 9 shows an example in which four creators "A", "B", "C", and "D" are detected as such creators, and all four creators are set as filtering conditions. Has been done.

またフィルタリングパラメータ領域72の「製品名」、「バージョン」、「作成日」及び「作成者」の各フィルタリング条件項目にそれぞれ対応する領域部分72A~72Dには、それぞれY軸設定用のチェックボックス96A~96Dが表示される。そしてユーザは、これらのチェックボックス96A~96Dの中から所望する1つのフィルタリング条件項目に対応するチェックボックス96A~96Dをクリックしてその表示形態を対応する項目を選択した状態(黒く塗り潰された状態)に設定することにより、そのフィルタリング条件項目を3次元グラフ83のy軸に設定することができる。図9の例では、「バージョン」の項目が3次元グラフ83のy軸に設定された例を示している。 Further, in the area portions 72A to 72D corresponding to the filtering condition items of "product name", "version", "creation date" and "creator" of the filtering parameter area 72, check boxes 96A for setting the Y-axis are respectively. ~ 96D is displayed. Then, the user clicks the check boxes 96A to 96D corresponding to one desired filtering condition item from these check boxes 96A to 96D, and selects the item corresponding to the display form (the state filled in black). ), The filtering condition item can be set on the y-axis of the three-dimensional graph 83. The example of FIG. 9 shows an example in which the item of "version" is set on the y-axis of the three-dimensional graph 83.

さらにフィルタリングパラメータ領域72の「製品名」、「バージョン」、「作成日」及び「作成者」の各フィルタリング条件項目にそれぞれ対応する領域部分72A~72Dには、それぞれアンケート用のチェックボックス(以下、これをアンケート用チェックボックスと呼ぶ)97A~97Dが表示される。そしてユーザは、これらアンケート用チェックボックス97A~97Dの中からユーザ指定曖昧箇所を訂正する際に特に参照したフィルタリング条件項目に対応するアンケート用チェックボックス97A~97Dをクリックしてその表示状態を対応するフィルタリング条件項目を選択した状態(黒く塗り潰された状態)に設定することにより、後述のようにユーザ指定曖昧箇所について抽出された複数の訂正候補の中から当該ユーザ指定曖昧箇所を訂正する際に特に参照したフィルタリング条件項目を本曖昧箇所訂正支援装置3(図1)に学習させることができる。 Further, in the area portions 72A to 72D corresponding to each of the filtering condition items of "product name", "version", "creation date" and "creator" of the filtering parameter area 72, check boxes for questionnaires (hereinafter referred to as "check boxes") are used. This is called a questionnaire check box) 97A to 97D are displayed. Then, the user clicks the questionnaire check boxes 97A to 97D corresponding to the filtering condition item particularly referred to when correcting the user-specified ambiguity from the questionnaire check boxes 97A to 97D to correspond to the display state. By setting the filtering condition item to the selected state (filled in black), especially when correcting the user-specified ambiguous part from a plurality of correction candidates extracted for the user-specified ambiguous part as described later. The referenced filtering condition items can be learned by the ambiguity correction support device 3 (FIG. 1).

なお、グラフ表示フィルタリング領域71のグラフ表示調整領域81で設定された条件や、フィルタリングパラメータ領域72の「製品名」、「バージョン」、「作成日」及び「作成者」の各フィルタリング条件項目にそれぞれ対応する領域部分72A~72Dで設定された各フィルタリング条件はアンド条件であり、すべての条件を満たす訂正候補に対応するブロック84のみが3次元グラフ83内に表示される。 The conditions set in the graph display adjustment area 81 of the graph display filtering area 71 and the filtering condition items of "product name", "version", "creation date", and "creator" of the filtering parameter area 72, respectively. Each filtering condition set in the corresponding area portions 72A to 72D is an AND condition, and only the block 84 corresponding to the correction candidate satisfying all the conditions is displayed in the three-dimensional graph 83.

他方、本曖昧箇所訂正支援装置3では、曖昧箇所訂正支援画面70の3次元グラフ83内に表示されたブロック84のうち、所望するブロック84をクリックして選択することにより、図10に示すような訂正候補詳細画面100を曖昧箇所訂正支援画面70に重ねて表示させることができる。 On the other hand, in the ambiguity correction support device 3, among the blocks 84 displayed in the three-dimensional graph 83 of the ambiguity correction support screen 70, the desired block 84 is clicked and selected, as shown in FIG. The correction candidate detail screen 100 can be superimposed on the ambiguous part correction support screen 70.

そして、この訂正候補詳細画面100には、曖昧箇所訂正支援画面70の3次元グラフ83内のユーザにより選択されたブロック(以下、これを選択ブロックと呼ぶ)84に対応する訂正候補の詳細情報が格納された訂正候補詳細情報表101が表示される。 Then, on the correction candidate detail screen 100, detailed information of the correction candidate corresponding to the block (hereinafter, this is referred to as a selection block) 84 selected by the user in the three-dimensional graph 83 of the ambiguity correction support screen 70 is displayed. The stored correction candidate detailed information table 101 is displayed.

実際上、訂正候補詳細情報表101は、抽出元文書ID欄101A、発生条件欄101B、主語欄101C、数値欄101D、動作欄101E、原文欄101F、製品名欄101G、バージョン欄101H、作成日欄101I、作成者欄101J及び訂正候補スコア欄101Kを備えて構成される。 In practice, the correction candidate detailed information table 101 includes the extraction source document ID column 101A, the occurrence condition column 101B, the subject column 101C, the numerical value column 101D, the operation column 101E, the original text column 101F, the product name column 101G, the version column 101H, and the creation date. It is composed of a column 101I, a creator column 101J, and a correction candidate score column 101K.

そして抽出元文書ID欄101Aには、ファイルサーバ4に蓄積されたすべての蓄積文書内のすべての文章に対してそれぞれ付与された識別ID(以下、これを文章IDと呼ぶ)のうち、選択ブロック84に対応する訂正候補が抽出された蓄積文書内の当該訂正候補を含む文章に対して付与された文章IDが表示される。 Then, in the extraction source document ID column 101A, a selection block is selected from among the identification IDs (hereinafter, referred to as sentence IDs) assigned to all the sentences in all the stored documents stored in the file server 4. The sentence ID assigned to the sentence including the correction candidate in the accumulated document in which the correction candidate corresponding to 84 is extracted is displayed.

また発生条件欄101B、主語欄101C、数値欄101D、動作欄101E、原文欄101F、製品名欄101G、バージョン欄101H、作成日欄101I及び作成者欄101Jには、図2について上述した多条件テーブル50における選択ブロック84に対応する訂正候補の行の発生条件欄50A、主語欄50B、数値欄50C、動作欄50D、原文欄50E、製品名欄50F、バージョン欄50G、作成日欄50H及び作成者欄50Iにそれぞれ格納された情報と同じ情報が表示される。さらに訂正候補スコア欄101Kには、その訂正候補について訂正候補スコア付けプログラム44(図1)により算出された訂正候補スコアが表示される。 Further, in the generation condition column 101B, the subject column 101C, the numerical value column 101D, the operation column 101E, the original text column 101F, the product name column 101G, the version column 101H, the creation date column 101I and the creator column 101J, the above-mentioned multi-conditions with respect to FIG. Occurrence condition column 50A, subject column 50B, numerical column 50C, operation column 50D, original text column 50E, product name column 50F, version column 50G, creation date column 50H and creation of the row of correction candidate corresponding to the selection block 84 in the table 50. The same information as the information stored in each of the person columns 50I is displayed. Further, in the correction candidate score column 101K, the correction candidate score calculated by the correction candidate scoring program 44 (FIG. 1) for the correction candidate is displayed.

この際、訂正候補詳細情報表101では、製品名欄101G、バージョン欄101H、作成日欄101I及び作成者欄101Jのうち、曖昧箇所訂正支援画面70のフィルタリングパラメータ領域72における「製品名」、「バージョン」、「作成日」及び「作成者」の各フィルタリング条件項目にそれぞれ対応する領域部分72A~72D内のアンケート用チェックボックス97A~97Dが黒く塗り潰された状態に設定されているフィルタリング条件項目に対応する欄101G~101Iに表示された文字列が赤色で着色されるなどして強調表示される。 At this time, in the correction candidate detailed information table 101, among the product name column 101G, the version column 101H, the creation date column 101I, and the creator column 101J, the "product name" in the filtering parameter area 72 of the ambiguous part correction support screen 70, " For the filtering condition items in which the questionnaire check boxes 97A to 97D in the area parts 72A to 72D corresponding to the respective filtering condition items of "version", "creation date", and "creator" are set to be filled in black. The character strings displayed in the corresponding columns 101G to 101I are highlighted in red or the like.

さらに訂正候補詳細画面100の訂正候補詳細情報表101の上側には、「この訂正候補の数値を曖昧箇所の訂正内容に確定する」という文字列102と、チェックボックス(以下、これを訂正候補選択チェックボックスと呼ぶ)103とが表示される。そしてユーザは、この訂正候補詳細情報表101に詳細が表示された訂正候補の数値(数値欄101Dに表示された数値)を、ユーザ指定曖昧箇所における述語動詞の修飾語として追加する数値に指定する場合には、この訂正候補選択チェックボックス103をクリックするようにして、当該訂正候補選択チェックボックス103を有効な状態(訂正候補選択チェックボックス103が塗り潰された状態)に設定する。 Further, on the upper side of the correction candidate detailed information table 101 of the correction candidate detail screen 100, a character string 102 "determine the numerical value of this correction candidate as the correction content of the ambiguous part" and a check box (hereinafter, this is selected as a correction candidate). (Called a check box) 103 is displayed. Then, the user designates the numerical value of the correction candidate whose details are displayed in the correction candidate detailed information table 101 (the numerical value displayed in the numerical value column 101D) as the numerical value to be added as the modifier of the predicative verb in the user-specified ambiguity. In this case, the correction candidate selection check box 103 is clicked to set the correction candidate selection check box 103 to a valid state (the correction candidate selection check box 103 is filled).

この場合、ユーザが訂正候補詳細画面100の右上に表示された「×」マーク104をクリックしてこの訂正候補詳細画面100を閉じた段階で、対象文書におけるユーザ指定曖昧箇所内の適切な位置に、訂正候補詳細画面100の訂正候補詳細情報表101の数値欄101Dに表示された数値を述語動詞の修飾語として追加するようにして当該ユーザ指定曖昧箇所が訂正される。 In this case, when the user clicks the "x" mark 104 displayed on the upper right of the correction candidate detail screen 100 and closes the correction candidate detail screen 100, the user specifies an appropriate position in the user-specified ambiguity in the target document. The user-specified ambiguity is corrected by adding the numerical value displayed in the numerical value column 101D of the correction candidate detailed information table 101 of the correction candidate detail screen 100 as a modifier of the predicate verb.

なお、訂正候補選択チェックボックス103を有効な状態に設定せずに「×」マーク104をクリックすることによりこの訂正候補詳細画面100を閉じることもできるが、この場合にはかかる訂正は行われない。 It is also possible to close the correction candidate detail screen 100 by clicking the "x" mark 104 without setting the correction candidate selection check box 103 in the valid state, but in this case, such correction is not performed. ..

(4)文書訂正機能に関する各種処理
次に、かかる文書訂正機能に関連して曖昧箇所訂正支援装置3において実行される各種処理の具体的な処理内容について説明する。なお、以下においては、各種処理の処理主体を「プログラム」として説明するが、実際上はその「プログラム」に基づいてCPU11(図1)がその処理を実行することは言うまでもない。
(4) Various Processes Related to the Document Correction Function Next, specific processing contents of various processes executed by the ambiguity correction support device 3 related to the document correction function will be described. In the following, the processing subject of various processes will be described as a "program", but it goes without saying that the CPU 11 (FIG. 1) actually executes the processes based on the "program".

(4-1)多条件テーブル作成処理
図11は、多条件テーブル作成プログラム40(図1)により定期的に実行される多条件テーブル作成処理の具体的な処理内容を示す。多条件テーブル作成プログラム40は、この図11に示す処理手順に従って、定期的に最新の多条件テーブル50(図2)を作成する。
(4-1) Multi-condition table creation process FIG. 11 shows specific processing contents of the multi-condition table creation process that is periodically executed by the multi-condition table creation program 40 (FIG. 1). The multi-condition table creation program 40 periodically creates the latest multi-condition table 50 (FIG. 2) according to the processing procedure shown in FIG.

実際上、多条件テーブル作成プログラム40は、この多条件テーブル作成処理を開始すると、まず、ファイルサーバ4に蓄積された蓄積文書の中からステップS2以降が未処理の蓄積文書を1つ選択し(S1)、選択した蓄積文書(以下、これを選択蓄積文書と呼ぶ)の文書ファイルFL(図1)をファイルサーバ4から読み出す(S2)。また多条件テーブル作成プログラム40は、選択蓄積文書のファイル情報FLI(図1)をファイルサーバ4から読み出すことにより取得する(S3)。 In practice, when the multi-condition table creation program 40 starts this multi-condition table creation process, it first selects one unprocessed stored document from the stored documents stored in the file server 4 (step S2 and subsequent steps) ( S1), the document file FL (FIG. 1) of the selected stored document (hereinafter, this is referred to as a selected stored document) is read from the file server 4 (S2). Further, the multi-condition table creation program 40 acquires the file information FLI (FIG. 1) of the selected storage document by reading it from the file server 4 (S3).

続いて、多条件テーブル作成プログラム40は、変数iの値を1にセットし(S4)、選択蓄積文書を構成する文章のうちの、最初からi番目の文章に対する係り受け解析を実行する(S5)。 Subsequently, the multi-condition table creation program 40 sets the value of the variable i to 1 (S4), and executes the dependency analysis for the i-th sentence from the beginning among the sentences constituting the selected storage document (S5). ).

そして多条件テーブル作成プログラム40は、この係り受け解析により多条件文を検出できた場合には、検出した多条件文に関する必要な情報を多条件テーブル50に登録する(S6)。なお、この多条件文を多条件テーブル50に登録する際、選択蓄積文書が対応する製品のバージョン、選択蓄積文書の作成日及び作成者や、その選択蓄積文書が関連する製品名などの情報については、ステップS3で取得した選択蓄積文書のファイル情報FLIから取得する。 Then, when the multi-conditional statement can be detected by the dependency analysis, the multi-condition table creation program 40 registers necessary information regarding the detected multi-conditional sentence in the multi-condition table 50 (S6). When registering this multi-condition statement in the multi-condition table 50, information such as the product version supported by the selective storage document, the creation date and creator of the selective storage document, and the product name to which the selective storage document is related is obtained. Is acquired from the file information FLI of the selected storage document acquired in step S3.

次いで、多条件テーブル作成プログラム40は、選択蓄積文書を構成する文章のうち、ステップS5の係り受け解析が未実行の文章が存在するか否かを判断する(S7)。そして多条件テーブル作成プログラム40は、この判断で肯定結果を得ると、変数iの値をインクリメント(1増加)する(S8)。 Next, the multi-condition table creation program 40 determines whether or not there is a sentence for which the dependency analysis in step S5 has not been executed among the sentences constituting the selected storage document (S7). Then, when the multi-condition table creation program 40 obtains an affirmative result in this determination, the value of the variable i is incremented (increased by 1) (S8).

また多条件テーブル作成プログラム40は、ステップS5に戻り、この後、ステップS7で肯定結果を得るまでステップS5~ステップS8の処理を繰り返す。この繰返し処理により選択蓄積文書を構成するすべての文章に対する係る受け解析が実行され、文章内に多条件文がある場合にその多条件文に関する必要な情報が多条件テーブル50に順次登録される。 Further, the multi-condition table creation program 40 returns to step S5, and then repeats the processes of steps S5 to S8 until a positive result is obtained in step S7. By this iterative process, the receiving analysis is executed for all the sentences constituting the selected storage document, and when there is a multi-conditional sentence in the sentence, the necessary information about the multi-conditional sentence is sequentially registered in the multi-condition table 50.

そして多条件テーブル作成プログラム40は、やがて選択蓄積文書を構成するすべての文章に対する係り受け解析が完了することによりステップS7で否定結果を得ると、ステップS2以降が未処理の蓄積文書が存在するか否かを判断する(S9)。 Then, when the multi-condition table creation program 40 eventually obtains a negative result in step S7 by completing the dependency analysis for all the sentences constituting the selected storage document, is there an unprocessed storage document in step S2 and subsequent steps? It is determined whether or not (S9).

そして多条件テーブル作成プログラム40は、この判断で肯定結果を得ると、ステップS1に戻り、この後、ステップS1で選択する蓄積文書を未処理の他の蓄積文書に順次切り替えながら、ステップS1~ステップS9の処理を繰り返す。 Then, when the multi-condition table creation program 40 obtains an affirmative result in this determination, it returns to step S1, and then, while sequentially switching the stored document selected in step S1 to another unprocessed stored document, steps S1 to step S1 to step S1. The process of S9 is repeated.

そして多条件テーブル作成プログラム40は、やがてすべての蓄積文書のすべての文章に対する係り受け解析が完了することによりステップS9で否定結果を得ると、この多条件テーブル作成処理を終了する。 Then, when the multi-condition table creation program 40 eventually obtains a negative result in step S9 by completing the dependency analysis for all the sentences of all the stored documents, the multi-condition table creation process ends.

(4-2)曖昧箇所訂正支援処理
(4-2-1)全体の処理の流れ
一方、図12は、かかる曖昧箇所訂正支援機能に関連して、曖昧箇所訂正支援装置3において実行される一連の処理(以下、これを曖昧箇所訂正支援処理と呼ぶ)の流れを示す。曖昧箇所訂正支援装置3は、この図12に示す処理手順に従って、対象文書内の曖昧箇所を明瞭な記載に訂正する訂正作業を支援する。
(4-2) Ambiguous part correction support process (4-2-1) Overall processing flow On the other hand, FIG. 12 shows a series of operations executed by the ambiguous part correction support device 3 in relation to the ambiguous part correction support function. (Hereinafter, this is referred to as an ambiguous part correction support process). The ambiguity correction support device 3 supports the correction work of correcting the ambiguity in the target document to a clear description according to the processing procedure shown in FIG.

実際上、曖昧箇所訂正支援装置3においてユーザにより対象文書が指定されると、この図12に示す曖昧箇所訂正支援処理が開始され、まず、曖昧単語抽出プログラム41(図1)が、曖昧単語テーブル51(図3)を参照して、対象文書内の曖昧単語を抽出する曖昧単語抽出処理を実行する(S10)。このとき抽出された曖昧単語を含む箇所が対象文書内の曖昧箇所である。 In practice, when the target document is specified by the user in the ambiguity correction support device 3, the ambiguity correction support process shown in FIG. 12 is started, and first, the ambiguity word extraction program 41 (FIG. 1) starts the ambiguity word table. With reference to 51 (FIG. 3), an ambiguous word extraction process for extracting an ambiguous word in the target document is executed (S10). The part including the ambiguous word extracted at this time is the ambiguous part in the target document.

続いて、訂正候補抽出プログラム41(図1)が、曖昧構文テーブル52(図4)を参照して、対象文書内のいずれかの曖昧構文と主語及び述語動詞が一致する文章を抽出する曖昧構文抽出処理を実行する(S11)。このとき抽出された箇所も対象文書内の曖昧箇所である。 Subsequently, the correction candidate extraction program 41 (FIG. 1) refers to the ambiguous syntax table 52 (FIG. 4) and extracts an ambiguous syntax in which any ambiguous syntax in the target document matches the subject and the predicative verb. The extraction process is executed (S11). The part extracted at this time is also an ambiguous part in the target document.

次いで、訂正候補抽出プログラム42(図1)が、ステップS10及びステップS11でそれぞれ検出された対象文書内の曖昧箇所のそれぞれについて、その曖昧箇所の述語動詞で表された動作の程度を表す数値を含む訂正候補を多条件テーブル50から抽出する訂正候補抽出処理を実行する(S12)。 Next, the correction candidate extraction program 42 (FIG. 1) sets a numerical value indicating the degree of operation represented by the predicate verb of the ambiguity for each of the ambiguities in the target document detected in steps S10 and S11, respectively. The correction candidate extraction process for extracting the correction candidates including the correction candidates from the multi-condition table 50 is executed (S12).

この後、訂正候補スコア付け処理プログラム44(図1)が、ステップS12で抽出された各訂正候補に対して訂正候補スコアを算出して付与する訂正候補スコア付け処理を実行する(S13)。 After that, the correction candidate scoring processing program 44 (FIG. 1) executes a correction candidate scoring process for calculating and assigning a correction candidate score to each correction candidate extracted in step S12 (S13).

さらに、この後、訂正箇所・訂正内容表示プログラム45(図1)が、ステップS10及びステップS11で検出された対象文書内の曖昧箇所が強調表示された図8について上述した曖昧箇所提示画面60や、図9について上述した曖昧箇所訂正支援画面70及び図10について上述した訂正候補詳細画面100をユーザ操作に応じて順次表示する訂正箇所・訂正内容表示処理を実行する(S14)。 Further, after that, the correction part / correction content display program 45 (FIG. 1) displays the above-mentioned ambiguity part presentation screen 60 for FIG. 8 in which the ambiguity part in the target document detected in step S10 and step S11 is highlighted. , The above-mentioned ambiguous part correction support screen 70 with respect to FIG. 9 and the above-mentioned correction candidate detail screen 100 with respect to FIG. 10 are sequentially displayed according to a user operation, and a correction part / correction content display process is executed (S14).

続いて、選択訂正候補学習プログラム46(図1)が、対象文書内の各曖昧箇所についてユーザが曖昧箇所訂正支援画面70(図9)上で所望する訂正候補を絞り込む際に利用した各フィルタリング条件に応じた情報を重みテーブル53(図5)に登録する選択訂正候補学習処理を実行する(S15)。 Subsequently, each filtering condition used by the selective correction candidate learning program 46 (FIG. 1) when narrowing down the correction candidates desired by the user on the ambiguous part correction support screen 70 (FIG. 9) for each ambiguous part in the target document. The selection correction candidate learning process for registering the information corresponding to the above in the weight table 53 (FIG. 5) is executed (S15).

次いで、訂正結果表示プログラム47(図1)が、ユーザにより曖昧箇所訂正支援画面70(図9)及び訂正候補詳細画面100(図10)を用いて行われた訂正作業に従って対象文書の各曖昧箇所がそれぞれ訂正された、訂正後の対象文書のテキストを図8と同じ構成の訂正結果画面(図示せず)に表示する訂正結果表示処理を実行する(S16)。なお、かかる訂正結果画面では、ユーザにより訂正が行われなかった対象文書の曖昧箇所については、その曖昧箇所について抽出された訂正候補のうちの最も訂正候補スコアが高い訂正候補の数値が述語動詞の修飾語として追加するように自動訂正された状態で表示される。 Next, the correction result display program 47 (FIG. 1) performs each ambiguity portion of the target document according to the correction work performed by the user using the ambiguity portion correction support screen 70 (FIG. 9) and the correction candidate detail screen 100 (FIG. 10). Is executed (S16) to display the corrected text of the target document corrected by each of the above on the correction result screen (not shown) having the same configuration as that of FIG. 8 (S16). In the correction result screen, for the ambiguous part of the target document that has not been corrected by the user, the numerical value of the correction candidate having the highest correction candidate score among the correction candidates extracted for the ambiguous part is the predicate verb. It is displayed in a state where it is automatically corrected so that it can be added as a modifier.

さらに同様訂正箇所判定プログラム48が、ファイルサーバ4内の蓄積文書における、ユーザにより訂正された曖昧箇所と同じ構文(曖昧構文)の文章をユーザに提示すると共に、その文章の訂正候補を上述と同様に提示する同様訂正箇所判定処理を実行する(S17)。そして、この後、この曖昧箇所訂正支援処理が終了する。 Further, similarly, the correction part determination program 48 presents to the user a sentence having the same syntax (ambiguous syntax) as the ambiguous part corrected by the user in the stored document in the file server 4, and the correction candidate of the sentence is the same as described above. The correction portion determination process is executed in the same manner as presented in (S17). Then, after this, the ambiguity correction support process ends.

(4-2-2)曖昧単語抽出処理
図13は、図12について上述した曖昧箇所訂正支援処理のステップS10で曖昧単語抽出プログラム41により実行される上述の曖昧単語抽出処理の具体的な処理内容を示す。
(4-2-2) Ambiguity word extraction process FIG. 13 shows specific processing contents of the above-mentioned ambiguous word extraction process executed by the ambiguous word extraction program 41 in step S10 of the above-mentioned ambiguous part correction support process with respect to FIG. Is shown.

曖昧単語抽出プログラム41は、曖昧箇所訂正支援処理がステップS10に進むとこの図13に示す曖昧単語抽出処理を開始し、まず、対象文書のフォーマット形式をプレーンテキスト形式に変換する(S20)。 The ambiguous word extraction program 41 starts the ambiguous word extraction process shown in FIG. 13 when the ambiguous part correction support process proceeds to step S10, and first converts the format format of the target document into the plain text format (S20).

続いて、曖昧単語抽出プログラム41は、曖昧単語テーブル51に登録されている曖昧単語の中からステップS22以降が未処理の曖昧単語を1つ選択し(S21)、選択した曖昧単語(以下、これを選択曖昧単語と呼ぶ)を対象文書内で検索する(S22)。 Subsequently, the ambiguous word extraction program 41 selects one unprocessed ambiguous word from the ambiguous words registered in the ambiguous word table 51 (S21), and the selected ambiguous word (hereinafter, this). Is called a selected ambiguous word) in the target document (S22).

次いで、曖昧単語抽出プログラム41は、ステップS22の検索で選択曖昧単語を検出できたか否かを判断する(S23)。そして曖昧単語抽出プログラム41は、この判断で否定結果を得るとステップS25に進む。また曖昧単語抽出プログラム41は、ステップS23の判断で肯定結果を得ると、ステップS22の検索で選択曖昧単語を検出した対象文書内のすべての文章の文章IDをそれぞれ記憶する(S24)。 Next, the ambiguous word extraction program 41 determines whether or not the selected ambiguous word could be detected by the search in step S22 (S23). Then, when the ambiguous word extraction program 41 obtains a negative result in this determination, the process proceeds to step S25. Further, when the ambiguous word extraction program 41 obtains an affirmative result in the judgment of step S23, the ambiguous word extraction program 41 stores the sentence IDs of all the sentences in the target document in which the selected ambiguous word is detected by the search in step S22 (S24).

次いで、曖昧単語抽出プログラム41は、曖昧単語テーブル51に登録された曖昧単語のうちでステップS22以降が未処理の曖昧単語があるか否かを判断する(S25)。そして曖昧単語抽出プログラム41は、この判断で肯定結果を得るとステップS21に戻り、この後、ステップS21で選択する曖昧単語を曖昧単語テーブル51に登録された曖昧単語のうちのステップS22以降が未処理の他の曖昧単語に順次切り替えながらステップS21~ステップS25の処理を繰り返す。この繰返し処理により、対象文書内の曖昧単語テーブル51に登録されたいずれかの曖昧単語が出現する箇所がそれぞれ曖昧箇所として抽出され、これら曖昧箇所をそれぞれ含む文章の文章IDがそれぞれ記憶される。 Next, the ambiguous word extraction program 41 determines whether or not there is an unprocessed ambiguous word in the ambiguous words registered in the ambiguous word table 51 after step S22 (S25). Then, when the ambiguous word extraction program 41 obtains an affirmative result in this determination, it returns to step S21, and after that, the ambiguous word selected in step S21 is not included in step S22 or later among the ambiguous words registered in the ambiguous word table 51. The processing of steps S21 to S25 is repeated while sequentially switching to other ambiguous words in the processing. By this iterative process, each part where any of the ambiguous words registered in the ambiguous word table 51 in the target document appears is extracted as an ambiguous part, and the sentence ID of the sentence including each of these ambiguous parts is stored.

そして曖昧単語抽出プログラム41は、やがて曖昧単語テーブル51に登録されたいずれかの曖昧単語が出現する対象文書内のすべての文章の文章IDを検出し終えることによりステップS25で否定結果を得ると、この曖昧単語抽出処理を終了する。 Then, the ambiguous word extraction program 41 obtains a negative result in step S25 by completely detecting the sentence IDs of all the sentences in the target document in which any of the ambiguous words registered in the ambiguous word table 51 appears. This ambiguous word extraction process ends.

(4-2-3)曖昧構文抽出処理
一方、図14は、図12について上述した曖昧箇所訂正支援処理のステップS11で曖昧構文抽出プログラム42により実行される上述の曖昧構文抽出処理の具体的な処理内容を示す。
(4-2-3) Ambiguous Syntax Extraction Process On the other hand, FIG. 14 shows a specific example of the above-mentioned ambiguous syntax extraction process executed by the ambiguous syntax extraction program 42 in step S11 of the above-mentioned ambiguous part correction support process for FIG. Indicates the processing content.

曖昧構文抽出プログラム42は、曖昧箇所訂正支援処理がステップS11に進むとこの図14に示す曖昧構文抽出処理を開始し、まず、曖昧構文テーブル52に登録されている曖昧構文の中からステップS31以降が未処理の曖昧構文を1つ選択し(S30)、選択した曖昧構文(以下、これを選択曖昧構文と呼ぶ)と同じ主語及び述語動詞を含む文章を対象文書内で検索する(S31)。 When the ambiguity correction support process proceeds to step S11, the ambiguity syntax extraction program 42 starts the ambiguity syntax extraction process shown in FIG. 14, and first, from the ambiguity syntax registered in the ambiguity syntax table 52, steps S31 and subsequent steps are performed. Selects one unprocessed ambiguity syntax (S30), and searches the target document for sentences containing the same subject and predicate verb as the selected ambiguity syntax (hereinafter referred to as the selected ambiguity syntax) (S31).

次いで、曖昧構文抽出プログラム42は、ステップS31の検索で選択曖昧構文と同じ主語及び述語動詞を含む文章を検出できたか否かを判断する(S32)。そして曖昧構文抽出プログラム42は、ステップS32の判断で否定結果を得るとステップS34に進む。また曖昧構文抽出プログラム42は、ステップS32の判断で肯定結果を得ると、ステップS31の検索で検出した選択曖昧構文と同じ主語及び述語動詞を含むすべての対象文章内の文章の文章IDをそれぞれ記憶する(S33)。 Next, the ambiguous syntax extraction program 42 determines whether or not a sentence containing the same subject and predicate verb as the selected ambiguous syntax could be detected by the search in step S31 (S32). Then, the ambiguous syntax extraction program 42 proceeds to step S34 when a negative result is obtained by the determination in step S32. Further, when the ambiguous syntax extraction program 42 obtains an affirmative result in the judgment of step S32, it stores the sentence IDs of all the sentences in the target sentence including the same subject and predicate verb as the selected ambiguous syntax detected in the search in step S31. (S33).

次いで、曖昧構文抽出プログラム42は、曖昧構文テーブル52に登録された曖昧構文のうちでステップS31以降が未処理の曖昧構文があるか否かを判断する(S34)。そして曖昧構文抽出プログラム42は、この判断で肯定結果を得るとステップS30に戻り、この後、ステップS30で選択する曖昧構文を曖昧構文テーブル52に登録された曖昧構文のうちのステップS31以降が未処理の他の曖昧構文に順次切り替えながらステップS30~ステップS34の処理を繰り返す。この繰返し処理により、対象文書内の曖昧構文テーブル52に登録されたいずれかの曖昧構文と同じ主語及び述語動詞を含む対象文章内の箇所がそれぞれ曖昧箇所として順次検出され、これら曖昧箇所をそれぞれ含む文章の文章IDが順次記憶される。 Next, the ambiguous syntax extraction program 42 determines whether or not there is an unprocessed ambiguous syntax in the ambiguous syntax registered in the ambiguous syntax table 52 after step S31 (S34). Then, when the ambiguous syntax extraction program 42 obtains an affirmative result in this determination, it returns to step S30, and after that, the ambiguous syntax selected in step S30 is not included in step S31 or later among the ambiguous syntax registered in the ambiguous syntax table 52. The processing of steps S30 to S34 is repeated while sequentially switching to another ambiguous syntax of the processing. By this iterative process, parts in the target sentence containing the same subject and predicate verb as any of the ambiguous syntaxes registered in the ambiguous syntax table 52 in the target document are sequentially detected as ambiguous parts, and each of these ambiguous parts is included. The sentence ID of the sentence is sequentially stored.

そして曖昧構文抽出プログラム42は、やがて曖昧構文テーブル52に登録されたいずれかの曖昧構文と同じ主語及び述語動詞を含む対象文書内のすべて文章を検出し、その文章IDを記憶し終えることによりステップS34で否定結果を得ると、この曖昧構文抽出処理を終了する。 Then, the ambiguous syntax extraction program 42 eventually detects all sentences in the target document containing the same subject and predicate verb as any of the ambiguous constructs registered in the ambiguous syntax table 52, and finishes storing the sentence ID in the step. When a negative result is obtained in S34, this ambiguous syntax extraction process ends.

(4-2-4)訂正候補抽出処理
図15は、図12について上述した曖昧箇所訂正支援処理のステップS12で訂正候補抽出プログラム43により実行される上述の訂正候補抽出処理の具体的な処理内容を示す。
(4-2-4) Correction Candidate Extraction Processing FIG. 15 shows specific processing contents of the above-mentioned correction candidate extraction processing executed by the correction candidate extraction program 43 in step S12 of the above-mentioned ambiguity correction support processing with respect to FIG. Is shown.

訂正候補抽出プログラム43は、曖昧箇所訂正支援処理がステップS12に進むとこの図15に示す訂正候補抽出処理を開始し、まず、図13のステップS24又は図14のステップS33で文章IDを記憶した対象文書内の曖昧箇所のうち、ステップS41以降が未処理の曖昧箇所を1つ選択する(S40)。 The correction candidate extraction program 43 starts the correction candidate extraction process shown in FIG. 15 when the ambiguity correction support process proceeds to step S12, and first stores the sentence ID in step S24 of FIG. 13 or step S33 of FIG. Among the ambiguous parts in the target document, one unprocessed ambiguous part after step S41 is selected (S40).

続いて、訂正候補抽出プログラム43は、ステップS40で選択した曖昧箇所(以下、図15の説明において、これを選択曖昧箇所と呼ぶ)を読み込む(S41)。 Subsequently, the correction candidate extraction program 43 reads the ambiguity portion selected in step S40 (hereinafter, this is referred to as a selection ambiguity portion in the description of FIG. 15) (S41).

次いで、訂正候補抽出プログラム43は、多条件テーブル50(図2)に登録されている多条件文の中からステップS43以降が未処理の多条件文を1つ選択し(S42)、ステップS43で読み込んだ選択曖昧箇所の主語が、ステップS42で選択した多条件文(以下、これを選択多条件文と呼ぶ)の主語を含むか否かを判断する(S43)。 Next, the correction candidate extraction program 43 selects one multi-condition statement that has not been processed after step S43 from the multi-condition statements registered in the multi-condition table 50 (FIG. 2) (S42), and in step S43. It is determined whether or not the subject of the read selection ambiguity portion includes the subject of the multi-conditional sentence selected in step S42 (hereinafter, this is referred to as a selected multi-conditional sentence) (S43).

そして訂正候補抽出プログラム43は、この判断で否定結果を得るとステップS45に進む。また訂正候補抽出プログラム43は、ステップS43の判断で肯定結果を得ると、選択多条件文を選択曖昧箇所の訂正候補に追加し(S44)、この後、ステップS43以降が未処理の多条件文が多条件テーブル50に存在するか否かを判断する(S45)。 Then, when the correction candidate extraction program 43 obtains a negative result in this determination, the process proceeds to step S45. Further, when the correction candidate extraction program 43 obtains an affirmative result in the judgment of step S43, the selected multi-conditional sentence is added to the correction candidate of the selected ambiguous part (S44), and after that, the multi-conditional sentence unprocessed after step S43. Is determined whether or not is present in the multi-condition table 50 (S45).

訂正候補抽出プログラム43は、この判断で肯定結果を得るとステップS42に戻り、この後、ステップS42で選択する多条件文をステップS43以降が未処理の他の多条件文に順次切り替えながら、ステップS42~ステップS45を上述と同様に繰り返す。この繰返し処理により、選択曖昧箇所の訂正候補がすべて抽出されることになる。 When the correction candidate extraction program 43 obtains an affirmative result in this determination, it returns to step S42, and then, while sequentially switching the multi-conditional sentence selected in step S42 to another multi-conditional sentence that has not been processed in step S43 and thereafter, the step S42 to S45 are repeated in the same manner as described above. By this iterative process, all the correction candidates of the selection ambiguity part are extracted.

そして訂正候補抽出プログラム43は、やがてそのときの選択曖昧箇所に関して、多条件テーブル50に登録されているすべての多条件文についてステップS42~ステップS44の処理を実行し終えることによりステップS45で否定結果を得ると、図13のステップS24又は図14のステップS33で対応する文章の文章IDを記憶した対象文書内の曖昧箇所のうちでステップS41以降が未処理の曖昧箇所があるか否かを判断する(S46)。 Then, the correction candidate extraction program 43 eventually finishes executing the processes of steps S42 to S44 for all the multi-condition statements registered in the multi-condition table 50 with respect to the selection ambiguity at that time, so that the negative result in step S45. Is obtained, and it is determined whether or not there is an unprocessed ambiguity in the target document in which the sentence ID of the corresponding sentence is stored in step S24 of FIG. 13 or step S33 of FIG. (S46).

訂正候補抽出プログラム43は、この判断で否定結果を得るとステップS40に戻り、この後、ステップS40で選択する曖昧箇所を、図13のステップS24又は図14のステップS33で位置を記憶した対象文書内の他の曖昧箇所であって、ステップS41以降が未処理の他の曖昧箇所に順次切り替えながらステップS40~ステップS46の処理を繰り返す。この繰返し処理により、図13のステップS24又は図14のステップS33で文章IDを記憶した対象文書内の各曖昧箇所に対する訂正候補がそれぞれ抽出される。 When the correction candidate extraction program 43 obtains a negative result in this determination, it returns to step S40, and then, the target document in which the position of the ambiguous part selected in step S40 is stored in step S24 of FIG. 13 or step S33 of FIG. The processing of steps S40 to S46 is repeated while sequentially switching to other unprocessed ambiguities in the other ambiguities in step S41 and subsequent steps. By this iterative process, correction candidates for each ambiguous part in the target document in which the sentence ID is stored in step S24 of FIG. 13 or step S33 of FIG. 14 are extracted.

そして訂正候補抽出プログラム43は、これらの曖昧箇所に対する訂正候補をすべて抽出し終えることによりステップS46で否定結果を得ると、この訂正候補抽出処理を終了する。 Then, when the correction candidate extraction program 43 obtains a negative result in step S46 by completing the extraction of all the correction candidates for these ambiguous parts, the correction candidate extraction process ends.

(4-2-5)訂正候補スコア付け処理
図16は、図12について上述した曖昧箇所訂正支援処理のステップS13で訂正候補スコア付けプログラム44により実行される上述の訂正候補スコア付け処理の具体的な処理内容を示す。
(4-2-5) Correction Candidate Scoring Process FIG. 16 shows a specific example of the above-mentioned correction candidate scoring process executed by the correction candidate scoring program 44 in step S13 of the above-mentioned ambiguity correction support process for FIG. The processing content is shown.

訂正候補スコア付けプログラム44は、曖昧箇所訂正支援処理がステップS13に進むとこの図16に示す訂正候補スコア付け処理を開始し、まず、図13のステップS24又は図14のステップS33で対応する文章の文章IDを記憶した対象文書内の曖昧箇所のうち、ステップS51以降が未処理の曖昧箇所を1つ選択する(S50)。 The correction candidate scoring program 44 starts the correction candidate scoring process shown in FIG. 16 when the ambiguity correction support process proceeds to step S13, and first, the corresponding sentence in step S24 of FIG. 13 or step S33 of FIG. Among the ambiguous parts in the target document in which the sentence ID of is stored, one unprocessed ambiguous part is selected from step S51 onward (S50).

続いて、訂正候補スコア付けプログラム44は、ステップS50で選択した曖昧箇所(以下、図16の説明において、これを選択曖昧箇所と呼ぶ)について訂正候補抽出プログラム43により抽出された訂正候補のうち、ステップS52以降が未処理の訂正候補を1つ選択する(S51)。 Subsequently, the correction candidate scoring program 44 is among the correction candidates extracted by the correction candidate extraction program 43 for the ambiguity selected in step S50 (hereinafter, this is referred to as a selection ambiguity in the description of FIG. 16). Step S52 and subsequent steps select one unprocessed correction candidate (S51).

また訂正候補スコア付けプログラム44は、ステップS51で選択した訂正候補(以下、図15の説明において、これを選択訂正候補と呼ぶ)に対応する多条件文における発生条件を多条件テーブル50から取得し(S52)、選択曖昧箇所に記載された事象の発生条件と、ステップS52で取得した発生条件との類似度合を表す類似度スコアを算出する(S53)。 Further, the correction candidate scoring program 44 acquires from the multi-condition table 50 the occurrence conditions in the multi-condition sentence corresponding to the correction candidates selected in step S51 (hereinafter, this is referred to as a selective correction candidate in the description of FIG. 15). (S52), a similarity score representing the degree of similarity between the occurrence condition of the event described in the selection ambiguity and the occurrence condition acquired in step S52 is calculated (S53).

具体的に、訂正候補スコア付けプログラム44は、選択曖昧箇所に記載された事象の発生条件(第1の発生条件とする)と、ステップS52で取得した発生条件(第2の発生条件する)とをそれぞれdoc2vecで数値ベクトル化し、第1の発生条件の数値ベクトル(第1の数値ベクトルとする)と、第2の発生条件の数値ベクトル(第2の数値ベクトルとする)とに基づいて、次式

Figure 0007074785000001
のように、第1及び第2の数値ベクトルの内積を第1及び第2の数値ベクトルのベクトル長の乗算結果で除算することによりコサイン類似度を算出し、これをかかる類似度スコアとする。なおコサイン類似度は、0~1.0の範囲の値として算出され、値が1.0に近いほどより類似していることを意味する。 Specifically, the correction candidate scoring program 44 includes the occurrence condition of the event described in the selection ambiguity (the first occurrence condition) and the occurrence condition acquired in step S52 (the second occurrence condition). Is converted into a numerical vector with doc2vec, respectively, and based on the numerical vector of the first generation condition (referred to as the first numerical vector) and the numerical vector of the second generation condition (referred to as the second numerical vector), the following is performed. formula
Figure 0007074785000001
As described above, the cosine similarity is calculated by dividing the inner product of the first and second numerical vectors by the multiplication result of the vector lengths of the first and second numerical vectors, and this is used as the similarity score. The cosine similarity is calculated as a value in the range of 0 to 1.0, and the closer the value is to 1.0, the more similar it is.

また訂正候補スコア付けプログラム44は、選択曖昧箇所を含む文書(つまり対象文書)に対応する製品の製品名と、選択訂正候補に対応する製品の製品名とが一致するか否かを表す同一製品スコアを算出する(S54)。 Further, the correction candidate scoring program 44 is the same product indicating whether or not the product name of the product corresponding to the document including the selection ambiguity (that is, the target document) and the product name of the product corresponding to the selection correction candidate match. Calculate the score (S54).

具体的に、訂正候補スコア付けプログラム44は、まず、対象文書全体の記載内容からその対象文書に対応する製品の製品名を特定すると共に、選択訂正候補に対応する製品の製品名を多条件テーブル50の対応する行の製品名欄50F(図2)から取得し、これらの製品名が一致するか否かを判定する。そして訂正候補スコア付けプログラム44は、これらの製品名が一致する場合、次式

Figure 0007074785000002
のように、重みテーブル53(図5)における第1の製品名欄53(図5)に「1」が設定されているエントリの合計個数sumに1を加算した値を定数0.01に乗算するようにして同一製品スコアを算出する。 Specifically, the correction candidate scoring program 44 first identifies the product name of the product corresponding to the target document from the description contents of the entire target document, and sets the product name of the product corresponding to the selection correction candidate in a multi-condition table. It is obtained from the product name column 50F (FIG. 2) of the corresponding line of 50, and it is determined whether or not these product names match. Then, when these product names match, the correction candidate scoring program 44 has the following equation.
Figure 0007074785000002
In the weight table 53 (FIG. 5), the value obtained by adding 1 to the total number of entries in which "1" is set in the first product name column 53 (FIG. 5) is multiplied by the constant 0.01. And calculate the same product score.

さらに訂正候補スコア付けプログラム44は、対象文書に対応する製品のバージョンと、選択訂正候補に対応する多条件文が抽出された蓄積文書(以下、これを対応蓄積文書と呼ぶ)に対応する製品のバージョンとの差を表すスコアをバージョン差スコアとして算出する(S55)。 Further, the correction candidate scoring program 44 is a product corresponding to a product version corresponding to the target document and a stored document (hereinafter referred to as a corresponding stored document) in which a multi-conditional sentence corresponding to the selected correction candidate is extracted. A score representing the difference from the version is calculated as a version difference score (S55).

具体的に、訂正候補スコア付けプログラム44は、まず、対象文書に対応する製品のバージョン(以下、これを対象文書製品バージョンと呼ぶ)を対応するファイル情報FLI(図1)から取得すると共に、選択訂正候補を含む蓄積文書に対応する製品のバージョン(以下、これを該当蓄積文書製品バージョンと呼ぶ)を当該蓄積文書のファイル情報FLI(図1)から取得し、これら対象文書製品バージョン及び該当蓄積文書製品バージョンのバージョン差を次式のようにして算出する。

Figure 0007074785000003
Specifically, the correction candidate scoring program 44 first acquires the version of the product corresponding to the target document (hereinafter referred to as the target document product version) from the corresponding file information FLI (FIG. 1) and selects it. The product version corresponding to the stored document including the correction candidate (hereinafter referred to as the corresponding stored document product version) is obtained from the file information FLI (Fig. 1) of the stored document, and these target document product versions and the corresponding stored document are obtained. The version difference of the product version is calculated by the following formula.
Figure 0007074785000003

なお(3)式において、「最新バージョン値」は、対象文書製品バージョン及び該当蓄積文書製品バージョンの双方に共通して対応する製品の最新のバージョンを表す各整数をそのまま並べた値であり、「最古バージョン値」は、かかる製品の最古のバージョンを表す各整数をそのまま並べた値である。「最新バージョン値」及び「最古バージョン値」は製品名テーブル55(図7)から取得したかかる製品の最新バージョン及び最古バージョンの各値をそれぞれ利用して算出する。 In equation (3), the "latest version value" is a value obtained by arranging each integer representing the latest version of the product common to both the target document product version and the corresponding stored document product version as it is. The "oldest version value" is a value obtained by arranging each integer representing the oldest version of the product as it is. The "latest version value" and "oldest version value" are calculated by using the latest version and the oldest version values of the product acquired from the product name table 55 (FIG. 7), respectively.

例えば、「最古バージョン」は、対象文書製品バージョン及び該当蓄積文書製品バージョンの双方に共通して対応する製品の最新のバージョンが「7.0.1」の場合、「7.0.1」を構成する各整数である「7」、「0」及び「1」をそのまま並べた「701」(=7×102+0×101+2)が最新バージョンであり、当該製品の最古のバージョンが「1.0.2」の場合、「1.0.2」を構成する各整数である「1」、「0」及び「2」をそのまま並べた「102」(=1×102+0×101+2)が最古バージョンである。 For example, the "oldest version" is defined as "7.0.1" when the latest version of the product that corresponds to both the target document product version and the corresponding stored document product version is "7.0.1". The latest version is "701" (= 7 x 10 2 + 0 x 10 1 + 2) in which the integers "7", "0" and "1" are arranged as they are, and the oldest version of the product is "1.0. In the case of "2", "102" (= 1 x 10 2 + 0 x 10 1 + 2), in which "1", "0" and "2", which are the integers constituting "1.0.2", are arranged as they are, is the oldest. The version.

そして訂正候補スコア付けプログラム44は、算出したバージョン差に基づいて、次式

Figure 0007074785000004
のように、重みテーブル53における第1のバージョン欄53D(図5)に「1」が設定されているエントリの合計個数sumに1を加算した値をバージョン差に乗算するようにしてバージョン差スコアを算出する。 Then, the correction candidate scoring program 44 has the following equation based on the calculated version difference.
Figure 0007074785000004
As shown in the above, the version difference score is obtained by multiplying the version difference by the value obtained by adding 1 to the total number of entries sum in which "1" is set in the first version column 53D (FIG. 5) in the weight table 53. Is calculated.

加えて、訂正候補スコア付けプログラム44は、対象文書の作成日と、対応蓄積文書の作成日との近さに応じたスコアを作成日スコアとして算出する(S56)。 In addition, the correction candidate scoring program 44 calculates a score according to the closeness between the creation date of the target document and the creation date of the corresponding accumulated document as the creation date score (S56).

具体的に、訂正候補スコア付けプログラム44は、対象文書の作成日(以下、これを対象文書作成日と呼ぶ)を当該対象文書のメタ情報から取得すると共に、選択訂正候補を含む蓄積文書の作成日(以下、これを該当蓄積文書作成日と呼ぶ)を当該蓄積文書のファイル情報FLIから取得し、これら対象文書作成日及び該当第1及び該当蓄積文書作成日の作成日の日数差(以下、これを作成日差と呼ぶ)を次式のようにして算出する。

Figure 0007074785000005
Specifically, the correction candidate scoring program 44 acquires the creation date of the target document (hereinafter referred to as the target document creation date) from the meta information of the target document, and creates a stored document including the selection correction candidate. The date (hereinafter referred to as the corresponding storage document creation date) is acquired from the file information FLI of the relevant storage document, and the difference in the number of days between the target document creation date and the corresponding first and the corresponding storage document creation date (hereinafter referred to as the corresponding storage document creation date). This is called the creation date difference) is calculated by the following formula.
Figure 0007074785000005

なお(5)式において、「最古の蓄積文書作成日」は、ファイルサーバ4に蓄積された蓄積文書の作成日のうちの最古の蓄積文書の作成日であり、「最新の蓄積文書作成日」は、ファイルサーバに蓄積された蓄積文書の作成日のうちの最新の蓄積文書の作成日である。 In equation (5), the "oldest stored document creation date" is the oldest stored document creation date among the stored document creation dates stored in the file server 4, and the "latest stored document creation date" is used. "Date" is the creation date of the latest accumulated document among the creation dates of the accumulated documents accumulated in the file server.

そして訂正候補スコア付けプログラム44は、算出した作成日差に基づいて、次式

Figure 0007074785000006
のように、重みテーブル50における第1の作成日欄53Eに「1」が設定されているエントリの合計個数sumに1を加算した値を作成日差に乗算するようにして作成日スコアを算出する。 Then, the correction candidate scoring program 44 has the following equation based on the calculated creation date difference.
Figure 0007074785000006
As shown in the above, the creation date score is calculated by multiplying the creation date difference by the value obtained by adding 1 to the total number sum of the entries in which "1" is set in the first creation date column 53E in the weight table 50. do.

また訂正候補スコア付けプログラム44は、対象文書の作成者の信頼性に応じたスコアを作成者信頼性スコアとして算出する(S57)。 Further, the correction candidate scoring program 44 calculates a score according to the reliability of the creator of the target document as the creator reliability score (S57).

具体的に、訂正候補スコア付けプログラム44は、選択訂正候補を含む蓄積文書の作成者を当該蓄積文書のファイル情報FLIから取得し、次式

Figure 0007074785000007
のように、重みテーブル50のエントリのうち、当該作成者の名前が第2の作成者欄53L(図5)に格納され、かつ第1の作成者欄53F(図5)に「1」が格納されているエントリの合計数sumに定数0.001を乗算するようにしてその作成者の信頼作成者スコアを算出する。 Specifically, the correction candidate scoring program 44 acquires the creator of the stored document including the selected correction candidate from the file information FLI of the stored document, and uses the following equation.
Figure 0007074785000007
As in the entry of the weight table 50, the name of the creator is stored in the second creator column 53L (FIG. 5), and "1" is stored in the first creator column 53F (FIG. 5). Calculate the trust creator score of the creator by multiplying the total number of stored entries sum by the constant 0.001.

次いで、訂正候補スコア付けプログラム44は、上述のようにしてステップS52~ステップS57でそれぞれ算出した類似度スコア、同一製品スコア、バージョン差スコア、作成日スコア及び作成者信頼性スコアに基づいて選択訂正候補の訂正候補スコアを算出する(S58)。 Next, the correction candidate scoring program 44 selects and corrects based on the similarity score, the same product score, the version difference score, the creation date score, and the creator reliability score calculated in steps S52 to S57 as described above. The candidate correction candidate score is calculated (S58).

なお、本実施の形態においては、訂正候補スコア付けプログラム44は、類似度スコア、同一製品スコア、バージョン差スコア、作成日スコア及び作成者信頼性スコアをすべて合算した値を選択訂正候補のスコアとして算出する。この場合、上述のような各スコアの算出方法によれば、類似度スコアが最も大きな値となり、これに比べて他の同一製品スコア、バージョン差スコア、作成日スコア及び作成者信頼性スコアが微小な値となるため、類似度スコアの値(つまり発生条件の類似度合)が選択訂正候補の訂正候補スコアに大きく寄与することになる。 In the present embodiment, the correction candidate scoring program 44 uses the sum of the similarity score, the same product score, the version difference score, the creation date score, and the creator reliability score as the selection correction candidate score. calculate. In this case, according to the calculation method of each score as described above, the similarity score is the largest value, and the other same product score, version difference score, creation date score, and creator reliability score are smaller than this. Therefore, the value of the similarity score (that is, the degree of similarity of the occurrence conditions) greatly contributes to the correction candidate score of the selection correction candidate.

続いて、訂正候補スコア付けプログラム44は、それまでに選択曖昧箇所の各訂正候補についてそれぞれ算出した訂正候補スコアに基づいて、これら訂正候補を訂正候補スコアの降順にソートする(S59)。そして訂正候補スコア付けプログラム44は、この後、選択曖昧箇所について訂正候補抽出プログラム43により抽出された訂正候補のうち、ステップS52以降が未処理の訂正候補があるか否かを判断する(S60)。 Subsequently, the correction candidate scoring program 44 sorts these correction candidates in descending order of the correction candidate scores based on the correction candidate scores calculated for each correction candidate in the selected ambiguity portion (S59). Then, the correction candidate scoring program 44 then determines whether or not there are unprocessed correction candidates in steps S52 and subsequent steps among the correction candidates extracted by the correction candidate extraction program 43 for the selected ambiguity (S60). ..

訂正候補スコア付けプログラム44は、この判断で肯定結果を得るとステップS51に戻り、この後、ステップS51で選択する訂正候補を、訂正候補抽出プログラム53により選択曖昧箇所について抽出された訂正候補であって、ステップS52以降が未処理の他の訂正候補に順次切り替えながら、ステップS51~ステップS60の処理を繰り返す。この繰返し処理により正候補抽出プログラム43により選択曖昧箇所について抽出されたすべての訂正候補の訂正候補スコアがそれぞれ算出され、これら訂正候補がその訂正候補スコアに従って降順にソートされることになる。 When the correction candidate scoring program 44 obtains an affirmative result in this determination, the correction candidate returns to step S51, and then the correction candidates selected in step S51 are the correction candidates extracted for the selection ambiguity by the correction candidate extraction program 53. Then, the processes of steps S51 to S60 are repeated while the steps S52 and subsequent steps sequentially switch to other unprocessed correction candidates. By this iterative processing, the correction candidate scores of all the correction candidates extracted for the selection ambiguity by the positive candidate extraction program 43 are calculated, and these correction candidates are sorted in descending order according to the correction candidate scores.

そして訂正候補スコア付けプログラム44は、やがて正候補抽出プログラム43により選択曖昧箇所について抽出されたすべての訂正候補に対するスコア付け及びこれら訂正候補のソートを完了することによりステップS60で否定結果を得ると、対象文書内のすべての曖昧箇所についてステップS51以降の処理を実行し終えたか否かを判断する(S61)。 Then, the correction candidate scoring program 44 eventually obtains a negative result in step S60 by completing the scoring for all the correction candidates extracted for the selection ambiguity by the positive candidate extraction program 43 and the sorting of these correction candidates. It is determined whether or not the processing after step S51 has been executed for all the ambiguous parts in the target document (S61).

訂正候補スコア付けプログラム44は、この判断で肯定結果を得るとステップS50に戻り、この後、ステップS50で選択する曖昧箇所を、ステップS51以降が未処理の他の曖昧箇所に順次切り替えながら、ステップS50~ステップS61の処理を繰り返す。この繰返し処理により対象文書内の各曖昧箇所に対する上述の処理が実行されることになる。 When the correction candidate scoring program 44 obtains an affirmative result in this determination, it returns to step S50, and then, while sequentially switching the ambiguous part selected in step S50 to another unprocessed ambiguous part in step S51 and subsequent steps, the step The processes of S50 to S61 are repeated. By this iterative process, the above-mentioned process is executed for each ambiguous part in the target document.

そして訂正候補スコア付けプログラム44は、やがて対象文書内の各曖昧箇所に対する上述の処理を実行し終えることによりステップS61で否定結果を得ると、この訂正候補スコア付け処理を終了する。 Then, when the correction candidate scoring program 44 eventually obtains a negative result in step S61 by completing the above-mentioned processing for each ambiguous part in the target document, the correction candidate scoring process ends.

(4-2-6)選択訂正候補学習処理
図17は、図12について上述した曖昧箇所訂正支援処理のステップS15で選択訂正候補学習プログラム46(図1)により実行される上述の選択訂正候補学習処理の具体的な処理内容を示す。
(4-2-6) Selective Correction Candidate Learning Process FIG. 17 shows the above-mentioned selective correction candidate learning executed by the selective correction candidate learning program 46 (FIG. 1) in step S15 of the above-mentioned ambiguity correction support process for FIG. The specific processing contents of the processing are shown.

選択訂正候補学習プログラム46は、図10について上述した訂正候補詳細画面100で訂正候補選択チェックボックス103が有効な状態(訂正候補選択チェックボックス103が塗り潰された状態)となっている状態でこの訂正候補詳細画面100が閉じられると、この図17に示す選択候補訂正学習処理を開始する。 The selection correction candidate learning program 46 corrects this correction in a state in which the correction candidate selection check box 103 is valid (the correction candidate selection check box 103 is filled) on the correction candidate detail screen 100 described above with respect to FIG. When the candidate detail screen 100 is closed, the selection candidate correction learning process shown in FIG. 17 is started.

そして選択訂正候補学習プログラム46は、まず、訂正候補詳細画面100が閉じられた際の曖昧箇所訂正支援画面70(図9)のグラフ表示フィルタリング領域71(図9)のグラフ表示調整領域81(図9)で選択されていたドキュメント種別や、フィルタリングパラメータ領域72(図9)で設定されていた各フィルタリング条件の設定内容を取り込む(S70)。 Then, in the selection correction candidate learning program 46, first, the graph display adjustment area 81 (FIG. 9) of the graph display filtering area 71 (FIG. 9) of the ambiguity correction support screen 70 (FIG. 9) when the correction candidate detail screen 100 is closed. The document type selected in 9) and the setting contents of each filtering condition set in the filtering parameter area 72 (FIG. 9) are imported (S70).

続いて、選択訂正候補学習プログラム46は、重みテーブル50の未使用の行を1つ確保し、ステップS70で取り込んだ情報に基づいて、その行の各欄に必要な情報をそれぞれ格納する(S71)。そして選択訂正候補学習プログラム46は、この後、この選択訂正候補学習処理を終了する。 Subsequently, the selection correction candidate learning program 46 secures one unused row in the weight table 50, and stores necessary information in each column of the row based on the information fetched in step S70 (S71). ). Then, the selection correction candidate learning program 46 ends the selection correction candidate learning process.

(4-2-7)同様訂正箇所判定処理
図18は、図12について上述した曖昧箇所訂正支援処理のステップS17で同様訂正箇所判定プログラム48(図1)により実行される上述の同様訂正箇所判定処理の具体的な処理内容を示す。
(4-2-7) Similar correction location determination process FIG. 18 shows the above-mentioned similar correction location determination executed by the same correction location determination program 48 (FIG. 1) in step S17 of the above-mentioned ambiguous location correction support process for FIG. The specific processing contents of the processing are shown.

同様訂正箇所判定プログラム48は、曖昧箇所訂正支援処理がステップS17に進むとこの図18に示す同様訂正箇所判定処理を開始し、まず、対象文書内の訂正された各曖昧箇所に対する係り受け解析をそれぞれ実行する(S80)。 Similarly, when the ambiguous part correction support process proceeds to step S17, the corrected part determination program 48 starts the same corrected part determination process shown in FIG. 18, and first performs a dependency analysis for each corrected ambiguous part in the target document. Each is executed (S80).

続いて、同様訂正箇所判定プログラム48は、ステップS80の係り受け解析の解析結果に基づいて、対象文書内の訂正された曖昧箇所ごとの曖昧構文をそれぞれ抽出し、抽出した曖昧構文をすべて同一構文判定テーブル54に格納する(S81)。なお、このステップSにおける個々の曖昧箇所に対する曖昧構文の抽出手法は、図14について上述した曖昧構文抽出処理と同様の抽出手法を利用することができる。 Subsequently, similarly, the correction part determination program 48 extracts the ambiguity syntax for each corrected ambiguity part in the target document based on the analysis result of the dependency analysis in step S80, and all the extracted ambiguity syntaxes have the same syntax. It is stored in the determination table 54 (S81). As the method for extracting the ambiguity syntax for each ambiguity in step S, the same extraction method as the ambiguity syntax extraction process described above for FIG. 14 can be used.

次いで、同様訂正箇所判定プログラム48は、ファイルサーバ4(図1)に蓄積された各蓄積文書から、同一構文判定テーブル54に格納されたいずれかの曖昧構文と同じ曖昧構文の文章(つまり曖昧構文と主語及び述語動詞が同じ文章)を抽出する(S82)。 Next, similarly, the correction part determination program 48 is a sentence (that is, an ambiguous syntax) having the same ambiguous syntax as any of the ambiguous syntax stored in the same syntax determination table 54 from each stored document stored in the file server 4 (FIG. 1). And a sentence with the same subject and predicative verb) (S82).

そして同様訂正箇所判定プログラム48は、ステップS82で抽出した各文章について、それぞれ上述の曖昧箇所訂正支援処理(図12)のステップS12~ステップS16と同様の処理を実行する(S83)。これによりユーザは、ステップSで抽出した各文章を明瞭化する訂正作業を行うことができる。 Then, similarly, the correction portion determination program 48 executes the same processing as in steps S12 to S16 of the above-mentioned ambiguity correction support processing (FIG. 12) for each sentence extracted in step S82 (S83). As a result, the user can perform correction work for clarifying each sentence extracted in step S.

そして同様訂正箇所判定プログラム83は、この後、ステップS81で抽出した各文章に対する訂正作業が完了すると、この同様訂正箇所判定処理を終了する。 Then, when the correction work for each sentence extracted in step S81 is completed, the correction portion determination program 83 ends the same correction portion determination process.

(5)本実施の形態の効果
以上のように本実施の形態の曖昧箇所訂正支援装置3は、ファイルサーバ4に蓄積された蓄積文書から多条件文を抽出して多条件テーブル50を作成すると共に、対象文書から曖昧箇所を抽出し、抽出した曖昧箇所と主語が一致する多条件文をその曖昧箇所の訂正候補として多条件テーブル50から抽出し、曖昧箇所の発生条件と、各訂正候補の発生条件との類似度合に基づいて各訂正候補に訂正候補スコアを付与し、当該訂正候補スコアに応じた高さのブロック84を訂正箇所・訂正内容表示画面70の3次元グラフ83内に表示する。
(5) Effect of the present embodiment As described above, the ambiguity correction support device 3 of the present embodiment extracts the multi-condition sentence from the stored document stored in the file server 4 and creates the multi-condition table 50. At the same time, an ambiguity is extracted from the target document, and a multi-condition sentence whose subject matches the extracted ambiguity is extracted from the multi-condition table 50 as a correction candidate for the ambiguity. A correction candidate score is given to each correction candidate based on the degree of similarity with the occurrence condition, and the block 84 having a height corresponding to the correction candidate score is displayed in the three-dimensional graph 83 of the correction location / correction content display screen 70. ..

従って、ユーザは、かかる3次元グラフ83内に表示されたブロック84の積上げ個数や各ブロック84の高さに基づいて、対象文書内の対応する曖昧箇所に適用すべき訂正候補を選択及び決定することができる。よって、本曖昧箇所訂正支援装置3によれば、対象文書内の曖昧箇所に述語動詞の修飾語として追加すべき数値として、関連する蓄積文書全体の中から最も適切な数値を選択及び決定することができるため、対象文書内の曖昧箇所の記述を数値的に明瞭化する訂正作業を容易化及び適正化することができる。 Therefore, the user selects and determines correction candidates to be applied to the corresponding ambiguity in the target document based on the number of stacked blocks 84 displayed in the three-dimensional graph 83 and the height of each block 84. be able to. Therefore, according to the present ambiguity correction support device 3, the most appropriate numerical value is selected and determined from the entire related accumulated documents as the numerical value to be added as a modifier of the predicative verb to the ambiguity portion in the target document. Therefore, it is possible to facilitate and optimize the correction work for numerically clarifying the description of the ambiguous part in the target document.

(6)他の実施の形態
なお上述の実施の形態においては、曖昧箇所訂正支援画面70において、対象文書内の対応する曖昧箇所について抽出された各訂正候補の訂正候補スコアをそれぞれ対応するブロック84の高さで表現するようにした場合について述べたが、本発明はこれに限らず、各訂正候補の訂正候補スコアを色や大きさ、濃度などの他の表示態様で表現するようにしてもよい。また各訂正候補の訂正候補スコアをブロック84と対応付けて表示するようにしてもよい。
(6) Other Embodiments In the above-described embodiment, on the ambiguity correction support screen 70, the correction candidate scores of the correction candidates extracted for the corresponding ambiguities in the target document are converted into the corresponding blocks 84. However, the present invention is not limited to this, and the correction candidate score of each correction candidate may be expressed by other display modes such as color, size, and density. good. Further, the correction candidate score of each correction candidate may be displayed in association with the block 84.

また上述の実施の形態においては、曖昧箇所訂正支援装置3をファイルサーバ4とは別個に設けるようにした場合について述べたが、本発明はこれに限らず、ファイルサーバ4に曖昧箇所訂正支援装置3の機能を搭載するようにしてもよい。 Further, in the above-described embodiment, the case where the ambiguity correction support device 3 is provided separately from the file server 4 has been described, but the present invention is not limited to this, and the ambiguity correction support device is not limited to this. The function of 3 may be installed.

さらに上述の実施の形態においては、対象文書や蓄積文書がソフトウェア製品の開発段階でやり取りされたメールや設計メモ又は設計資料などである場合について述べたが、本発明はこれに限らず、対象文書や蓄積文書がソフトウェア製品以外の技術文書や他の種類の文書である場合にも本発明を適用することができる。 Further, in the above-described embodiment, the case where the target document or the stored document is an email, a design memo, a design document, or the like exchanged at the development stage of the software product has been described, but the present invention is not limited to this, and the target document is not limited to this. The present invention can also be applied when the stored document is a technical document other than a software product or a document of another type.

さらに上述の実施の形態においては、複数の蓄積文書から主語、述語動詞、述語動詞の程度を表す数値及び動詞が表す動作の発生条件を含む箇所を多条件文としてそれぞれ抽出する多条件抽出部としての多条件テーブル作成プログラム40と、対象文書内の曖昧箇所を抽出する曖昧箇所抽出部としての曖昧単語抽出プログラム41及び曖昧構文抽出プログラム42と、複数の蓄積文書から抽出された多条件文のうちの曖昧箇所と主語が一致する多条件文を、当該曖昧箇所の訂正候補としてそれぞれ抽出する訂正候補抽出部としての訂正候補抽出プログラム43と、曖昧箇所に含まれる動詞が表す動作の発生条件と、当該曖昧箇所について抽出された各訂正候補の前記発生条件との類似度合に基づいて、各訂正候補に訂正候補スコアをそれぞれ付与する訂正候補スコア付け部としての訂正候補スコア付けプログラム44と、各訂正候補を、付与された訂正候補スコアに応じた表示形態で表示する表示部としての訂正箇所・訂正内容表示プログラム45と、対象文書内の対象としている曖昧箇所について表示部により表示された訂正候補の中から、訂正候補を絞り込むためにユーザにより設定されたフィルタリング条件を保存する訂正候補学習部としての選択訂正候補学習プログラム46と、訂正結果表示プログラム47と、各蓄積文書から、対象文書内の訂正された曖昧箇所と同じ構文の文書の一部又は全部を当該蓄積文書内の曖昧箇所としてそれぞれ抽出し、当該曖昧箇所に対する訂正候補をユーザに提示する同様訂正箇所判定部としての同様訂正箇所判定プログラム48とを1つのコンピュータ装置(曖昧箇所訂正支援装置2)に実装するようにした場合について述べたが、本発明はこれに限らず、これらのプログラムを複数のコンピュータ装置に分散させて配置し、これらプログラムが協働して本実施の形態と同様の処理をそれぞれ実行するようにしてもよい。 Further, in the above-described embodiment, as a multi-condition extraction unit, each of a multi-condition extraction unit extracts a part including a numerical value indicating the degree of the subject, a predicate verb, the degree of the predicate verb, and a condition for generating an action represented by the verb from a plurality of accumulated documents. Of the multi-condition table creation program 40 of the above, the ambiguous word extraction program 41 and the ambiguous syntax extraction program 42 as the ambiguous part extraction unit for extracting the ambiguous part in the target document, and the multi-condition sentence extracted from a plurality of accumulated documents. A correction candidate extraction program 43 as a correction candidate extraction unit that extracts a multi-condition sentence whose subject matches the ambiguous part as a correction candidate of the ambiguous part, and a condition for generating an action represented by a verb included in the ambiguous part. A correction candidate scoring program 44 as a correction candidate scoring unit that assigns a correction candidate score to each correction candidate based on the degree of similarity of each correction candidate extracted for the ambiguity to the above-mentioned occurrence condition, and each correction. The correction part / correction content display program 45 as a display unit that displays the candidates in a display format according to the given correction candidate score, and the correction candidate displayed by the display unit for the target ambiguous part in the target document. From the selection correction candidate learning program 46 as a correction candidate learning unit that saves the filtering conditions set by the user to narrow down the correction candidates, the correction result display program 47, and the corrections in the target document from each stored document. A similar correction part determination program as a similar correction part determination unit that extracts a part or all of a document having the same syntax as the ambiguous part as an ambiguous part in the accumulated document and presents a correction candidate for the ambiguous part to the user. The case where 48 and 48 are mounted on one computer device (ambiguity correction support device 2) has been described, but the present invention is not limited to this, and these programs are distributed and arranged in a plurality of computer devices. These programs may cooperate with each other to execute the same processes as in the present embodiment.

本発明は文書内の曖昧箇所の記述を明瞭な記述に訂正する訂正作業を支援する種々の構成の曖昧箇所訂正支援装置に広く適用することができる。 The present invention can be widely applied to an ambiguity correction support device having various configurations that support a correction operation for correcting an ambiguity description in a document into a clear description.

1……曖昧箇所訂正支援システム、3……曖昧箇所訂正装置、4……ファイルサーバ、5……クライアント、11……CPU、16……入力装置、17……表示装置、40……多条件テーブル作成プログラム、41……曖昧単語抽出プログラム、42……曖昧構文抽出プログラム、43……訂正候補抽出プログラム、44……訂正候補スコア付けプログラム、45……訂正箇所・訂正内容表示プログラム、46……選択訂正候補学習プログラム、47……訂正結果表示プログラム、48……同様訂正箇所判定プログラム、50……多条件テーブル、51……曖昧単語テーブル、52……曖昧構文テーブル、53……重みテーブル、54……同一構文判定テーブル、55……製品名テーブル、60……曖昧箇所提示画面、70……曖昧箇所訂正支援画面、83……3次元グラフ、84……ブロック、100……訂正候補詳細画面、FL……文書ファイル、FLI……ファイル情報。 1 …… Ambiguous part correction support system 3 …… Ambiguous part correction device 4 …… File server 5 …… Client, 11 …… CPU, 16 …… Input device, 17 …… Display device, 40 …… Multi-condition Table creation program, 41 ... Ambiguous word extraction program, 42 ... Ambiguous syntax extraction program, 43 ... Correction candidate extraction program, 44 ... Correction candidate scoring program, 45 ... Correction part / correction content display program, 46 ... … Selective correction candidate learning program, 47 …… Correction result display program, 48 …… Similar correction part judgment program, 50 …… Multi-condition table, 51 …… Ambiguous word table, 52 …… Ambiguous syntax table, 53 …… Weight table , 54 ... Same syntax judgment table, 55 ... Product name table, 60 ... Ambiguous part presentation screen, 70 ... Ambiguous part correction support screen, 83 ... 3D graph, 84 ... Block, 100 ... Correction candidate Details screen, FL ... document file, FLI ... file information.

Claims (10)

第1の文書内の数値的に曖昧な曖昧箇所を明瞭化するように訂正する訂正作業を支援する曖昧箇所訂正支援装置において、
曖昧性を有する形容表現の複数の特定の単語がそれぞれ曖昧単語として事前に格納されると共に、述語動詞で表された動作の程度を表す数値を伴わなければ内容が曖昧となる複数の特定の主語及び当該述語動詞の組合せがそれぞれ曖昧構文として事前に格納された記憶装置と、
複数の第2の文書から、If-Then形式で記述された文章の一部又は全部を多条件文としてそれぞれ抽出する多条件抽出部と、
前記第1の文書から、前記記憶装置に格納されたいずれかの前記曖昧単語を含む文章若しくは文章の一部、又は、前記記憶装置に格納されたいずれかの前記曖昧構文を構成する前記主語及び前記述語動詞の組合せを含む文章若しくは文章の一部を前記曖昧箇所として抽出する曖昧箇所抽出部と、
複数の前記第2の文書から抽出された前記多条件文のうちの前記曖昧箇所と主語が一致する前記多条件文を、当該曖昧箇所の訂正候補としてそれぞれ抽出する訂正候補抽出部と、
前記曖昧箇所に含まれる動詞が表す動作の発生条件と、当該曖昧箇所について抽出された各前記訂正候補の前記発生条件との類似度合に基づいて、各前記訂正候補にスコアをそれぞれ付与する訂正候補スコア付け部と、
各前記訂正候補を、付与された前記スコアに応じた表示形態で表示する表示部と
を備えることを特徴とする曖昧箇所訂正支援装置。
In the ambiguity correction support device that supports the correction work to correct the numerically ambiguous ambiguity in the first document so as to clarify it.
Multiple specific words in an ambiguous adjective are pre-stored as ambiguous words, and the content is ambiguous without a numerical value representing the degree of action represented by the predicate verb. And a storage device in which the combination of the predicate verbs is pre-stored as an ambiguous syntax, respectively.
A multi-condition extraction unit that extracts a part or all of a sentence described in If-Then format as a multi-condition sentence from a plurality of second documents.
From the first document, a part of a sentence or sentence containing any of the ambiguous words stored in the storage device, or the subject and the subject constituting any of the ambiguous syntax stored in the storage device. An ambiguity extraction unit that extracts a sentence or a part of a sentence including a combination of pre-descriptive words and verbs as the ambiguity.
A correction candidate extraction unit that extracts the multi-conditional sentence whose subject matches the ambiguous part of the multi-conditional sentence extracted from the plurality of second documents as correction candidates of the ambiguous part, respectively.
Correction candidates that give a score to each of the correction candidates based on the degree of similarity between the occurrence condition of the action represented by the verb included in the ambiguity and the occurrence condition of each of the correction candidates extracted for the ambiguity. With the scoring section,
An ambiguity correction support device including a display unit that displays each of the correction candidates in a display form corresponding to the given score.
前記第1の文書内の対象としている前記曖昧箇所について前記表示部により表示された前記訂正候補の中から、前記訂正候補を絞り込むためにユーザにより設定されたフィルタリング条件を保存する訂正候補学習部をさらに備え、
前記訂正候補スコア付け部は、
前記訂正候補学習部により保存された前記フィルタリング条件の設定内容を利用して各前記訂正候補に前記スコアをそれぞれ付与する
ことを特徴とする請求項1に記載の曖昧箇所訂正支援装置。
A correction candidate learning unit that saves filtering conditions set by the user to narrow down the correction candidates from the correction candidates displayed by the display unit for the ambiguous portion targeted in the first document. Further prepare
The correction candidate scoring unit
The ambiguity correction support device according to claim 1, wherein the score is given to each of the correction candidates by using the setting contents of the filtering conditions saved by the correction candidate learning unit.
各前記第2の文書から、前記第1の文書内の訂正された前記曖昧箇所と同じ構文の文書の一部又は全部を当該第2の文書内の曖昧箇所としてそれぞれ抽出し、当該曖昧箇所に対する前記訂正候補をユーザに提示する同様訂正箇所判定部をさらに備える
ことを特徴とする請求項1に記載の曖昧箇所訂正支援装置。
From each of the second documents, a part or all of a document having the same syntax as the corrected ambiguity in the first document is extracted as an ambiguity in the second document, and the ambiguity is addressed. The ambiguous part correction support device according to claim 1, further comprising a correction part determination unit as well as presenting the correction candidate to the user.
前記表示部は、
各前記訂正候補にそれぞれ対応させて、前記第1の文書内の対象としている前記曖昧箇所について前記訂正候補抽出部により抽出された各前記訂正候補に含まれる数値に対応付けられた第1の軸と、前記訂正候補を絞り込むためにユーザにより指定されたフィルタリング条件の項目に対応付けられた第2の軸と、前記スコアに対応付けられた第3の軸とを有する3次元座標上に、対応する前記訂正候補の前記スコアに応じた前記表示形態のブロックをそれぞれ表示する
ことを特徴とする請求項1に記載の曖昧箇所訂正支援装置。
The display unit is
A first axis associated with a numerical value included in each of the correction candidates extracted by the correction candidate extraction unit for the ambiguity target in the first document corresponding to each of the correction candidates. Corresponds to the three-dimensional coordinates having the second axis associated with the item of the filtering condition specified by the user for narrowing down the correction candidates and the third axis associated with the score. The ambiguity correction support device according to claim 1, wherein each block of the display form corresponding to the score of the correction candidate is displayed.
前記表示部は、
いずれか1つの前記ブロックが前記ユーザにより指定された場合に、当該指定された前記ブロックに対応する前記訂正候補の詳細情報を表示する
ことを特徴とする請求項に記載の曖昧箇所訂正支援装置。
The display unit is
The ambiguity correction support device according to claim 4 , wherein when any one of the blocks is designated by the user, detailed information of the correction candidate corresponding to the designated block is displayed. ..
第1の文書内の数値的に曖昧な曖昧箇所を明瞭化するように訂正する訂正作業を支援する曖昧箇所訂正支援装置により実行される曖昧箇所訂正支援方法であって、
前記曖昧箇所訂正支援装置は、
曖昧性を有する形容表現の複数の特定の単語がそれぞれ曖昧単語として事前に格納されると共に、述語動詞で表された動作の程度を表す数値を伴わなければ内容が曖昧となる複数の特定の主語及び当該述語動詞の組合せがそれぞれ曖昧構文として事前に格納された記憶装置を有し、
複数の第2の文書から、If-Then形式で記述された文章の一部又は全部を多条件文としてそれぞれ抽出する第1のステップと、
前記第1の文書から、前記記憶装置に格納されたいずれかの前記曖昧単語を含む文章若しくは文章の一部、又は、前記記憶装置に格納されたいずれかの前記曖昧構文を構成する前記主語及び前記述語動詞の組合せを含む文章若しくは文章の一部を前記曖昧箇所として抽出する第2のステップと、
複数の前記第2の文書から抽出された前記多条件文のうちの前記曖昧箇所と主語が一致する前記多条件文を、当該曖昧箇所の訂正候補としてそれぞれ抽出する第3のステップと、
前記曖昧箇所に含まれる動詞が表す動作の発生条件と、当該曖昧箇所について抽出された各前記訂正候補の前記発生条件との類似度合に基づいて、各前記訂正候補にスコアをそれぞれ付与する第4のステップと、
各前記訂正候補を、付与された前記スコアに応じた表示形態で表示する第5のステップと
を備えることを特徴とする曖昧箇所訂正支援方法。
It is an ambiguity correction support method performed by an ambiguity correction support device that supports correction work for correcting numerically ambiguous ambiguities in a first document.
The ambiguity correction support device is
Multiple specific words in an ambiguous adjective are pre-stored as ambiguous words, and the content is ambiguous without a numerical value representing the degree of action represented by the predicate verb. And each combination of the predicate verbs has a storage device pre-stored as an ambiguous syntax.
The first step of extracting a part or all of a sentence described in If-Then format as a multi-condition sentence from a plurality of second documents, and
From the first document, a part of a sentence or sentence containing any of the ambiguous words stored in the storage device, or the subject and the subject constituting any of the ambiguous syntax stored in the storage device. The second step of extracting a sentence or a part of a sentence including a combination of pre-descriptive word verbs as the ambiguity, and
A third step of extracting the multi-conditional sentence whose subject matches the ambiguous part of the multi-conditional sentence extracted from the plurality of second documents as a correction candidate of the ambiguous part, respectively.
A fourth method of assigning a score to each of the correction candidates based on the degree of similarity between the condition of occurrence of the action represented by the verb included in the ambiguity and the condition of occurrence of each of the correction candidates extracted for the ambiguity. Steps and
A method for supporting ambiguity correction, which comprises a fifth step of displaying each of the correction candidates in a display form corresponding to the given score.
前記第1の文書内の対象としている前記曖昧箇所について表示した前記訂正候補の中から、前記訂正候補を絞り込むためにユーザにより設定されたフィルタリング条件を保存し、
前記第4のステップでは、
保存した前記フィルタリング条件の設定内容を利用して各前記訂正候補に前記スコアをそれぞれ付与する
ことを特徴とする請求項に記載の曖昧箇所訂正支援方法。
The filtering conditions set by the user to narrow down the correction candidates from the correction candidates displayed for the ambiguous part targeted in the first document are saved.
In the fourth step,
The ambiguity correction support method according to claim 6 , wherein the score is given to each of the correction candidates by using the saved setting contents of the filtering condition.
各前記第2の文書から、前記第1の文書内の訂正された前記曖昧箇所と同じ構文の文書の一部又は全部を当該第2の文書内の曖昧箇所としてそれぞれ抽出し、当該曖昧箇所に対する前記訂正候補をユーザに提示する第6のステップをさらに備える
ことを特徴とする請求項に記載の曖昧箇所訂正支援方法。
From each of the second documents, a part or all of a document having the same syntax as the corrected ambiguity in the first document is extracted as an ambiguity in the second document, and the ambiguity is addressed. The ambiguity correction support method according to claim 6 , further comprising a sixth step of presenting the correction candidate to the user.
前記第5のステップでは、
各前記訂正候補にそれぞれ対応させて、前記第1の文書内の対象としている前記曖昧箇所について抽出した各前記訂正候補に含まれる数値に対応付けられた第1の軸と、前記訂正候補を絞り込むためにユーザにより指定されたフィルタリング条件の項目に対応付けられた第2の軸と、前記スコアに対応付けられた第3の軸とを有する3次元座標上に、対応する前記訂正候補の前記スコアに応じた前記表示形態のブロックをそれぞれ表示する
ことを特徴とする請求項に記載の曖昧箇所訂正支援方法。
In the fifth step,
The first axis associated with the numerical value included in each of the correction candidates extracted for the ambiguity targeted in the first document corresponding to each of the correction candidates, and the correction candidate are narrowed down. The score of the corresponding correction candidate on a three-dimensional coordinate having a second axis associated with the item of the filtering condition specified by the user and a third axis associated with the score. The ambiguity correction support method according to claim 6 , wherein each of the blocks in the display form corresponding to the above is displayed.
前記第5のステップでは、
いずれか1つの前記ブロックが前記ユーザにより指定された場合に、当該指定された前記ブロックに対応する前記訂正候補の詳細情報を表示する
ことを特徴とする請求項に記載の曖昧箇所訂正支援方法。
In the fifth step,
The ambiguity correction support method according to claim 9 , wherein when any one of the blocks is designated by the user, detailed information of the correction candidate corresponding to the designated block is displayed. ..
JP2020006405A 2020-01-17 2020-01-17 Ambiguous part correction support device and method Active JP7074785B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020006405A JP7074785B2 (en) 2020-01-17 2020-01-17 Ambiguous part correction support device and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020006405A JP7074785B2 (en) 2020-01-17 2020-01-17 Ambiguous part correction support device and method

Publications (2)

Publication Number Publication Date
JP2021114120A JP2021114120A (en) 2021-08-05
JP7074785B2 true JP7074785B2 (en) 2022-05-24

Family

ID=77077029

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020006405A Active JP7074785B2 (en) 2020-01-17 2020-01-17 Ambiguous part correction support device and method

Country Status (1)

Country Link
JP (1) JP7074785B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102646448B1 (en) * 2021-11-12 2024-03-13 한국과학기술연구원 Apparatus and method for quantifying emotional state

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002024212A (en) 2000-07-12 2002-01-25 Mitsubishi Electric Corp Voice interaction system
JP2008112363A (en) 2006-10-31 2008-05-15 Toshiba Corp Document processor and document processing program
JP2012230614A (en) 2011-04-27 2012-11-22 Sony Corp Information processor, information processing method and program
JP2014038565A (en) 2012-08-20 2014-02-27 Fuji Xerox Co Ltd Document management device and program

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002024212A (en) 2000-07-12 2002-01-25 Mitsubishi Electric Corp Voice interaction system
JP2008112363A (en) 2006-10-31 2008-05-15 Toshiba Corp Document processor and document processing program
JP2012230614A (en) 2011-04-27 2012-11-22 Sony Corp Information processor, information processing method and program
JP2014038565A (en) 2012-08-20 2014-02-27 Fuji Xerox Co Ltd Document management device and program

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
太田 昌克 外3名,量的判断常識人工知能における定量化方式,電子情報通信学会技術研究報告,日本,社団法人電子情報通信学会,1994年03月04日,第93巻 第494号,pp.17-24

Also Published As

Publication number Publication date
JP2021114120A (en) 2021-08-05

Similar Documents

Publication Publication Date Title
CN108762743B (en) Data table operation code generation method and device
US7584177B2 (en) Determination of a desired repository
EP2317447B1 (en) In-context exact (ICE) matching
US20100325539A1 (en) Web based spell check
JP5473533B2 (en) In-context exact (ICE) match
JP6542612B2 (en) Test scenario generation support apparatus and test scenario generation support method
JP2016099741A (en) Information extraction support apparatus, method and program
JP2013246644A (en) Software object correction support device, software object correction support method and program
JP7074785B2 (en) Ambiguous part correction support device and method
JP2005107931A (en) Image search apparatus
JP5550959B2 (en) Document processing system and program
JP2009151676A (en) Data processor, data processing method, and program
JP2018190030A (en) Information processing server, control method for the same, and program, and information processing system, control method for the same, and program
US20200097552A1 (en) Synonym determination device and synonym determination method
JP6797038B2 (en) Software material selection support device and software material selection support program
JP2008210229A (en) Device, method and program for retrieving intellectual property information
JP5504212B2 (en) Test case automatic generation system, test case automatic generation method, and test case automatic generation program
JP5039505B2 (en) Document search apparatus and document search support method
JP6062735B2 (en) Software development support device, software development support method, software development support program
JP4703705B2 (en) Structured data search program and structured data search device
JP6662800B2 (en) Presentation device and presentation method
JP5348699B2 (en) Data classification system, data classification method and program
JP2007199987A (en) Patent information retrieval system
JP2006301809A (en) Data processing system
JP6437899B2 (en) Document proofreading support apparatus, document proofreading support method, and document proofreading support program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200730

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210928

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220412

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220512

R150 Certificate of patent or registration of utility model

Ref document number: 7074785

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150