JPH0262656A - Back-up device for elaboration of japanese word document - Google Patents

Back-up device for elaboration of japanese word document

Info

Publication number
JPH0262656A
JPH0262656A JP63214615A JP21461588A JPH0262656A JP H0262656 A JPH0262656 A JP H0262656A JP 63214615 A JP63214615 A JP 63214615A JP 21461588 A JP21461588 A JP 21461588A JP H0262656 A JPH0262656 A JP H0262656A
Authority
JP
Japan
Prior art keywords
node
inappropriate
inappropriate expression
expressions
characteristic data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63214615A
Other languages
Japanese (ja)
Inventor
Yoshihiko Hayashi
良彦 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP63214615A priority Critical patent/JPH0262656A/en
Publication of JPH0262656A publication Critical patent/JPH0262656A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To keep the uniform quality of documents by performing the elaborating working based on the warning messages which are produced and displayed according to the passages of the detected improper expressions and the types of these expressions. CONSTITUTION:An improper expression inspecting part 3 decides the activation state of an initiation node of an improper expression detecting rule network contained in an improper expression inspecting rule dictionary 4 based on the characteristic data collected by a characteristic data collecting part 2. Then the part 3 activates or inactivates successively the nodes included in the rule network based on the connecting relation among those nodes, the described activating conditions of nodes, and the node value calculating method. Each termination node in the network corresponds to an improper expression, and the termination node that is finally activated means that the improper expression corresponding to the relevant node is detected. Furthermore a position is held in a sentence of an improper expression as the value of the termination node. Thus it is possible to obtain even the positions of the improper expressions in the sentences.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、日本語文書を入力して処理する日本語文書処
理システムにおいて、すでに入力された日本語文書の推
敲作業を支援する日本語文書推敲支援装置に関する。
[Detailed Description of the Invention] [Industrial Application Field] The present invention is a Japanese document processing system that inputs and processes Japanese documents. Regarding an elaboration support device.

〔産業上の利用分野〕[Industrial application field]

従来の日本語文書処理システムにおける文書推敲に関す
る技術は1文書中に含まれる送り仮名の誤りの検出や1
表記の不統一の検出や、同音異義語の存在の検出など、
単語レベルの誤りを検出する技術が主であり、文レベル
での不適性表現の検出を行い、それに基づく適切なメツ
セージをユーザに提示するための実用的な技術は存在し
ない。
Technologies related to document editing in conventional Japanese document processing systems include detection of errors in okurikana included in one document,
Detecting inconsistencies in spelling, detecting the presence of homophones, etc.
The main technology is to detect errors at the word level, and there is no practical technology for detecting inappropriate expressions at the sentence level and presenting an appropriate message to the user based on the detected inappropriate expressions.

また、例えば日経バイト1988年3月号[次世代ワー
プロの決め手となるか 構成支援/可読性評価ツール」
に記載のように、文章の読みやすさを評価するための可
読性評価の技術が開発されているが1文章全体にわたっ
ての可読性を文章中の漢字の占める割合や文の平均的長
さなどの統計的な特徴から一次元の数値として表現する
にすぎない、〔発明が解決しようとする課題〕 上記のように、従来は文書推敲技術として1文レベルの
不適性表現を検出し、それに対応する適切なメツセージ
をユーザに提示する実用的な技術が存在しないため、推
敲作業を行うユーザは、文書中の不適性表現の推敲を網
羅的に行うことができないという問題があった。また、
可読性の評価結果も、文章中の漢字の占める割合や文の
平均的長さなどから単なる数値でしか提示されないため
Also, for example, Nikkei Baito March 1988 issue [Will it be the deciding factor for the next generation word processor? Composition support/readability evaluation tool"
As described in , readability evaluation technology has been developed to evaluate the readability of sentences. [Problem to be solved by the invention] As described above, conventional document editing technology has been used to detect inappropriate expressions at the level of one sentence and to develop appropriate responses to them. Since there is no practical technique for presenting a message to a user, there is a problem in that the user performing the editing work is unable to comprehensively review inappropriate expressions in a document. Also,
Readability evaluation results are only presented as numerical values based on factors such as the proportion of kanji in a sentence and the average length of a sentence.

特定の分野の文書を対象とするような推敲支援機能の実
現は不可能であった。
It has been impossible to implement a redaction support function that targets documents in a specific field.

本発明の目的は1日本語文書処理システムにおいて、ユ
ーザによる不適性表現の網羅的な推敲作業を支援し、且
つ、文書の特定対象分野に適合した日本語文書推敲支援
装置を提供することにある。
An object of the present invention is to provide a Japanese document elaboration support device that supports a user's comprehensive elaboration of inappropriate expressions in a Japanese document processing system, and is adapted to a specific target field of documents. .

〔課題を解決するための手段〕 本発明の日本語文書推敲支援装置においては。[Means to solve the problem] In the Japanese document elaboration support device of the present invention.

対象とする日本語文書を構成する各文に対する形態素解
析結果、構文解析結果を入力として、各日本文に対する
推敲支援上の特性データを収集する特性データ収集部と
、該収集された特性データ及びあらかじめ登録された不
適性表現検出規則に基づいて各日本文中に含まれる推敲
作業を必要とする不適性表現を含む箇所と不適性表現の
タイプを検出する不適性表現検定部と、該不適性表現検
出規則を格納する不適性表現検出規則辞書と、上記検出
された不適性表現箇所及び不適性表現タイプに基づいて
警告メツセージを生成する警告メツセージ生成部と、該
警告メツセージ生成規則を格納する警告メツセージ生成
規則辞書を備えている。
A characteristic data collection unit that collects characteristic data for elaboration support for each Japanese sentence by inputting morphological analysis results and syntactic analysis results for each sentence composing the target Japanese document, and a characteristic data collection unit that collects characteristic data for elaboration support for each Japanese sentence, An inappropriate expression testing unit that detects the type of inappropriate expression and the portion containing inappropriate expressions that require elaboration in each Japanese sentence based on registered inappropriate expression detection rules, and the inappropriate expression detection unit. an inappropriate expression detection rule dictionary that stores rules; a warning message generator that generates a warning message based on the detected inappropriate expression location and inappropriate expression type; and a warning message generator that stores the warning message generation rule. Equipped with a rule dictionary.

〔作 用〕[For production]

日本語文書推敲支援装置へは、推敲対象の日本語文書を
構成する各日本文に対して形態素解析、構文解析の処理
をすでに行った文書が入力される。
A document that has already been subjected to morphological analysis and syntactic analysis on each Japanese sentence constituting the Japanese document to be revised is input to the Japanese document revision support device.

特性データ収集部は、処理対象文書を構成する各日本文
に対して、文中から不適性表現が存在する可能性を示す
特性データを収集する。不適性表現検定部は、まず、特
性データ収集部によって収集された特性データに従って
、不適性表現検出規則辞書中の不適性表現検出規則ネッ
トワークの始端ノードの活性化状態を決定する。その後
、不適性表現検定部は、不適性表現検出規則辞書中の不
適性表現検出規則ネットワークの各ノードの接続関係、
ノードに記述されているノードの活性化条件及びノード
の値の計算方法に基づいて、順次ネットワーク中の各ノ
ードを活性化または非活性化させていく、ネットワーク
中の各終端ノードは、1つの不適性表現に対応しており
、最終的に活性化された終端ノードは、そのノードに対
応する不適性表現が検出されたことを意味する。また、
終端ノードの値として、該不適性表現の文中での位置を
保持させることにより、文中での該不適性表現の位置を
も得ることができる。
The characteristic data collection unit collects characteristic data indicating the possibility that inappropriate expressions exist in each Japanese sentence constituting the document to be processed. The inappropriate expression testing section first determines the activation state of the start node of the inappropriate expression detection rule network in the inappropriate expression detection rule dictionary according to the characteristic data collected by the characteristic data collection section. After that, the inappropriate expression testing unit determines the connection relationship of each node of the inappropriate expression detection rule network in the inappropriate expression detection rule dictionary,
Each terminal node in the network activates or deactivates each node in the network sequentially based on the node activation condition described in the node and the node value calculation method. A terminal node that corresponds to an appropriate expression and is finally activated means that an inappropriate expression corresponding to that node has been detected. Also,
By holding the position of the inappropriate expression in the sentence as the value of the terminal node, the position of the inappropriate expression in the sentence can also be obtained.

以上のようにして検出された不適性表現情報(不適性表
現のタイプ、不適性表現の位置)は。
The inappropriate expression information (type of inappropriate expression, position of inappropriate expression) detected as described above is as follows.

警告メツセージ生成部に送られる。警告メツセージ生成
部は、不適性表現検定部から送られた不適性表現情報に
基づいて、警告メツセージ生成規則辞書中の警告メツセ
ージ生成規則を適用してユーザに提示するための警告メ
ツセージを生成する。
Sent to the warning message generator. The warning message generation section generates a warning message to be presented to the user by applying the warning message generation rules in the warning message generation rule dictionary based on the inappropriate expression information sent from the inappropriate expression verification section.

この生成された警告メツセージを出力部を介して。This generated warning message through the output section.

デイスプレィ装置などの表示装置に表示することにより
、ユーザに警告メツセージを通知することができる。 
本装置によれば、文書中に存在する不適性表現に対して
、その不適性表現のタイプ及びその位置が警告メツセー
ジとしてユーザに通知されるため、ユーザは、その警告
メツセージの内容に従って、該不適性表現を適切な表現
へと推敲することができる。また、特定の分野の文書を
対象とするような場合、その分野に固有な表現やその分
野では使用することが禁止されているような表現に対応
する不適性表現検出規則を不適性表現検出規則辞書に登
録するだけで、適用分野に特化した日本語文書推敲支援
装置とすることができる。
By displaying the warning message on a display device such as a display device, the user can be notified of the warning message.
According to this device, the type and position of inappropriate expressions that exist in a document are notified to the user as a warning message, so the user can follow the content of the warning message. Be able to refine aptitude expressions into appropriate expressions. In addition, when targeting documents in a specific field, inappropriate expression detection rules that correspond to expressions unique to that field or expressions that are prohibited to be used in that field may be changed to inappropriate expression detection rules. Just by registering it in a dictionary, it can be used as a Japanese document editing support device specialized for the field of application.

〔実施例〕〔Example〕

以下、本発明の一実施例について図面により説明する。 An embodiment of the present invention will be described below with reference to the drawings.

 第1図は、本発明の日本語文書推敲支援装置の一実施
例を示すブロック図である。該日本語文書推敲支援装置
は、入力部1.特性データ収集部2、不適性表現検定部
3.不適性表現検出規則辞書4、警告メツセージ生成部
5.警告メツセージ生成規則辞書6、出力部7から構成
される。
FIG. 1 is a block diagram showing an embodiment of the Japanese document elaboration support device of the present invention. The Japanese document elaboration support device includes an input section 1. Characteristic data collection unit 2, inappropriateness expression testing unit 3. Inappropriate expression detection rule dictionary 4, warning message generation unit 5. It is composed of a warning message generation rule dictionary 6 and an output section 7.

不適表現検出規則辞書4は、ネットワーク状に構成され
た不適性表現検出規則があらかじめ登録されている規則
辞書である。警告メツセージ生成規則辞書6は、各不適
性表現項目に1対1に対応した警告メツセージ生成規則
があらかじめ登taれている規則辞書である。
The inappropriate expression detection rule dictionary 4 is a rule dictionary in which inappropriate expression detection rules configured in a network are registered in advance. The warning message generation rule dictionary 6 is a rule dictionary in which warning message generation rules corresponding one-to-one to each unsuitability expression item are registered in advance.

入力部1からは、推敲対象の日本語文書を構成する各日
本文に対して形態素解析、構文解析の処理をすでに行っ
た文書が入力されるものとする。
It is assumed that a document is input from the input unit 1, in which each Japanese sentence constituting the Japanese document to be revised has been subjected to morphological analysis and syntactic analysis.

形態素解析は、漢字と仮名のベタ書きされた日本文に対
して、単語単位への分割を行うものであり。
Morphological analysis is the process of dividing Japanese sentences written in solid kanji and kana into word units.

この処理の過程で同時に文節も認定される。構文解析は
、形態素解析で得られた単語分割及び文節の情報を基に
、文全体の構文構造を木構造の形式に解析する処理であ
る0例として、[私は彼が作成した報告書を読む、」に
対する形態素解析結果及び構文解析結果を図示すると第
2図(a)、 (b)のようになる0通常、日本語文書
処理システムには。
During this process, phrases are also recognized at the same time. Syntactic analysis is the process of analyzing the syntactic structure of the entire sentence into a tree structure based on the word segmentation and clause information obtained from morphological analysis. Figures 2 (a) and (b) show the morphological analysis and syntactic analysis results for ``Read''.Normally, in a Japanese document processing system.

このような形態素解析や構文解析の処理機能が具備され
ており、その形態解析及び構文解析結果が入力部1から
入力される。
The processing functions for such morphological analysis and syntactic analysis are provided, and the results of the morphological analysis and syntactic analysis are inputted from the input unit 1.

特性データ収集部2は、処理対象文書を構成する各日本
文に対して1文中から不適性表現が存在する可能性を示
す特性データを収集する。
The characteristic data collection unit 2 collects characteristic data indicating the possibility that inappropriate expressions exist in each Japanese sentence constituting the processing target document.

不適性表現検定部3は、まず、特性データ収集部2によ
って収集された特性データに従って、不適性表現検定規
則辞書4中の不適性表現検出規則ネットワークの始端ノ
ードの活性化状態を決定する。その後、不適性表現検定
部3は、不適性表現検出規則ネットワーク中の各ノード
の接続関係、ノードに記述されているノードの活性化条
件及びノードの値の計算方法に基づいて、順次ネットワ
ーク中の各ノードを活性化または非活性化させていく、
ネットワーク中の各終端ノードは、1つの不適性表現に
対応しており、最終的に活性化された終端ノードは、そ
のノードに対応する不適性表現が検出されたことを意味
する。また、終端ノードの値として、該不適性表現の文
中での位置を保持させることにより1文中での該不適性
表現の位置をも得ることができる。
The inappropriate expression testing section 3 first determines the activation state of the start node of the inappropriate expression detection rule network in the inappropriate expression testing rule dictionary 4 according to the characteristic data collected by the characteristic data collecting section 2. Thereafter, the inappropriate expression testing unit 3 sequentially examines each node in the network based on the connection relationship of each node in the inappropriate expression detection rule network, the activation condition of the node described in the node, and the method of calculating the value of the node. Activate or deactivate each node,
Each end node in the network corresponds to one inadequacy expression, and a terminal node that is finally activated means that the inadequacy expression corresponding to that node has been detected. Furthermore, by holding the position of the inappropriate expression in the sentence as the value of the terminal node, the position of the inappropriate expression in one sentence can also be obtained.

以上のようにして検出された不適性表現情報(不適性表
現のタイプ、不適性表現の位置)は。
The inappropriate expression information (type of inappropriate expression, position of inappropriate expression) detected as described above is as follows.

警告メツセージ生成部5に送られる。警告メツセージ生
成部5は、不適性表現検定部3から送られた不適性表現
情報に基づいて、警告メツセージ生成規則辞書6中に格
納されている対応する警告メツセージ生成規則を適用°
することにより、ユーザに提示するための警告メツセー
ジを生成する。
The message is sent to the warning message generating section 5. The warning message generation unit 5 applies the corresponding warning message generation rule stored in the warning message generation rule dictionary 6 based on the inappropriate expression information sent from the inappropriate expression verification unit 3.
This generates a warning message to present to the user.

生成された警告メツセージは、出力部7を介してデイス
プレィ装置などの表示装置に表示される。
The generated warning message is displayed on a display device such as a display device via the output unit 7.

これによりユーザに警告メツセージを通知することがで
きる。
This allows the user to be notified of a warning message.

以下、具体例について説明する。こ−で、処理対象の日
本語文書中に以下の2文が含まれているとする。
A specific example will be explained below. Now, assume that the Japanese document to be processed contains the following two sentences.

■ 分散処理システムの建設が容易にできます。■ Easily construct a distributed processing system.

■ 入出力装置を並列に動作できます。■ Input/output devices can be operated in parallel.

■の例文は、副詞(この例では、「容易に」と動詞[で
きる」が連続していて文意の誤解を招きやすく、かつ1
名詞(この例では、「分散処理システム」)と格助詞「
の」からなる文節がす変名詞(この例では、「建設」)
と格助詞「が」からなる文節を修飾し、かつ、後者の文
節が動詞「できる」を修飾するという不適性表現である
。また、■の例文は、自動詞(この例では、「動作する
」)をあたかも他動詞であるかのように使用するという
不適性表現である。これらは、推敲されて1次のように
書き換えられるべきものとする。
The example sentence of
The noun (in this example, "distributed processing system") and the case particle "
A clause consisting of "no" is a noun (in this example, "construction")
This is an inappropriate expression that modifies a clause consisting of the case particle "ga" and the latter clause modifies the verb "dekiru". Furthermore, the example sentence ■ is an inappropriate expression in which an intransitive verb (in this example, ``act'') is used as if it were a transitive verb. These should be refined and rewritten as first-order.

■′分散処理システムを容易に建設することができます
■′Distributed processing systems can be easily constructed.

■′入出力装置を並列に動作させることができます。■'I/O devices can be operated in parallel.

第3図に■の例文に対する形態素解析結果及び構文解析
結果を、第4図に■の例文に対する形態素解析結果及び
構文解析結果を示す、このように。
Fig. 3 shows the morphological analysis results and syntactic analysis results for the example sentences of ■, and Fig. 4 shows the morphological analysis results and syntactic analysis results for the example sentences of ■.

推敲対象文書を構成する各日本文は、形態素解析によっ
て文節及び単語単位の認定が行われ、構文解析によって
文全体の構文構造が木構造の形式に解析されているとす
る。
It is assumed that each Japanese sentence constituting the document to be revised has been identified in clause and word units through morphological analysis, and the syntactic structure of the entire sentence has been analyzed into a tree structure through syntactic analysis.

入力部1は、■及び■の例文について、第3図及び第4
図に示すような形態素解析結果及び構文解析結果を入力
して特性データ収集部2に転送する。
The input unit 1 inputs the example sentences of ■ and ■ in Figures 3 and 4.
Morphological analysis results and syntactic analysis results as shown in the figure are input and transferred to the characteristic data collection section 2.

特性データ収集部2は、対象文書中の1文単位に当該文
に対する形態素解析結果及び構文解析結果に基づいて、
文中の不適性表現の存在可能性を示す特性データを抽出
する。特性データ収集部2は、複数のそれぞれ独立した
部分からなっている。
The characteristic data collection unit 2 analyzes the results of each sentence in the target document based on the morphological analysis and syntactic analysis results for the sentence.
Characteristic data indicating the possibility of the existence of inappropriate expressions in a sentence is extracted. The characteristic data collection section 2 consists of a plurality of independent parts.

その1つ1つの部分は、1つ以上の不適性表現項目と対
応している。すなわち、1つの部分により収集される特
性データは、関連する不適性表現の存在可能性を示して
いる。
Each part corresponds to one or more inappropriate expression items. That is, the characteristic data collected by one part indicates the possible existence of an associated expression of inadequacy.

■の例文に対しては1次の1つの特性データが得られる
ものとする。
It is assumed that one first-order characteristic data can be obtained for the example sentence (2).

■−1:動詞「できる」を含む文節の番号■の桝−文に
対しては5次の1つの特性データが得られるものとする
■-1: Number of clauses containing the verb "dekiru" It is assumed that one characteristic data of the fifth order can be obtained for the box-sentence of ■.

■−1=自動詞を含む文節の番号 特性データ収集部2によって収集される各特性データは
、不適性表現検出規則辞書4中に格納されている不適性
表現検出規則ネットワークの1つ以上の始端ノードと関
係付けられている。
-1 = Number of clauses containing intransitive verbs Each characteristic data collected by the characteristic data collection unit 2 is collected from one or more starting nodes of the inappropriate expression detection rule network stored in the inappropriate expression detection rule dictionary 4. is associated with.

第5図に、不適性表現検出規則辞書4中に格納されてい
る不適性表現検出規則ネットワークの概念図を示す、第
5図にみられるように、不適性表現検出規則ネットワー
クは、ノード及びノード間の接続を示すリンクからなる
。ノードには、始端ノード、中間ノード、終端ノードの
3種類がある。
FIG. 5 shows a conceptual diagram of the inappropriate expression detection rule network stored in the inappropriate expression detection rule dictionary 4. As seen in FIG. 5, the inappropriate expression detection rule network consists of nodes and nodes. Consists of links that indicate connections between There are three types of nodes: starting nodes, intermediate nodes, and terminal nodes.

これらのノードは、すべて同一の構造をしている。All these nodes have the same structure.

なお、始端ノードは特性データ収集ポイントに、終端ノ
ードは不適性表現項目に対応している。
Note that the start node corresponds to the characteristic data collection point, and the end node corresponds to the unsuitability expression item.

第6図に不適性表現検出規則ネットワーク中の各ノード
の構造の概念図を示す、第6図にみられるように、ノー
ドは、5つのデータ格納領域からなる。ノードIDは、
ノードを一意に識別するための記号である。ノード値は
、ノードの持つ値である。入力ツートリストは、該ノー
ドへの接続関係を持つノードからのリンクのリストであ
る。出力ツートリストは、該ノードからの接続関係を持
つノードへのリンクのリストである。前ノード活性化条
件は、該ノードへの接続関係を持つノードがどのような
状態にある時に該ノードが活性化する可能性があるかを
示す該ノード活性化のための前提条件である。ノード値
計算記述は、ノード活性化のための前提条件たる前ノー
ド活性化条件が満たされたときに、どのようにして該ノ
ードのノード値を計算するかの手続きを記述したもので
ある。この計算手続きにおいては、一般にその中に活性
化のための条件判定を含んでいる。そのため、そのよう
な場合、前ノード活性化条件が満たされたからといって
必ず該ノードが活性化されるわけではない、この計算手
続きが起動されることによって、計算された該ノードの
ノード値は、前述のノード値格納領域に格納される。
FIG. 6 shows a conceptual diagram of the structure of each node in the inappropriate expression detection rule network. As seen in FIG. 6, each node consists of five data storage areas. The node ID is
This is a symbol for uniquely identifying a node. A node value is a value that a node has. The input tool list is a list of links from nodes that have a connection relationship to the node. The output tourist list is a list of links from this node to nodes that have a connection relationship. The previous node activation condition is a precondition for activating the node, which indicates in what state the node having a connection relationship with the node is likely to be activated. The node value calculation description describes a procedure for calculating the node value of the node when the previous node activation condition, which is a prerequisite for node activation, is satisfied. This calculation procedure generally includes condition determination for activation. Therefore, in such a case, just because the previous node activation condition is satisfied does not necessarily mean that the node will be activated.By activating this calculation procedure, the calculated node value of the node will be , is stored in the node value storage area mentioned above.

第7図に例文■、■に対応する不適性表現検出規則ネッ
トワークを示す。
FIG. 7 shows an inappropriate expression detection rule network corresponding to example sentences (■) and (■).

不適性表現検定部3は、まず、特性データ収集部2によ
って収集された特性データに基づいて、不適性表現検出
規則ネットワーク中の始端ノードの活性化状態を決定す
る。その後、不適性表現検定部3は、不適性表現検定規
則辞書4中の不適性表現検出規則ネットワーク中の各ノ
ードの接続関係、ノードに記述されているノードの活性
化条件及びノードの値の計算方法に基づいて、順次ネッ
トワーク中の各ノードを活性化または非活性化させてい
く、ネットワーク中の各終端ノードは、1つの不適性表
現に対応しており、最終的に活性化された終端ノードは
、そのノードに対応する不適性表現が検出されたことを
意味する。また、第7図に示した不適性表現検出規則ネ
ットワークのように、終端ノードの値として、該不適性
表現の文中での位置を保持させることにより、文中での
該不適性表現の位置をも得ることができる。
The inappropriate expression testing section 3 first determines the activation state of the starting node in the inappropriate expression detection rule network based on the characteristic data collected by the characteristic data collecting section 2. Thereafter, the inappropriate expression testing unit 3 calculates the connection relationship of each node in the inappropriate expression detection rule network in the inappropriate expression testing rule dictionary 4, the activation condition of the node described in the node, and the value of the node. Based on the method, each node in the network is sequentially activated or deactivated. Each terminal node in the network corresponds to one unsuitability expression, and finally the activated terminal node means that an inappropriate expression corresponding to that node has been detected. Furthermore, as in the inappropriate expression detection rule network shown in Figure 7, by holding the position of the inappropriate expression in the sentence as the value of the terminal node, the position of the inappropriate expression in the sentence can also be determined. Obtainable.

第7図に示した不適性表現検出規則ネットワークを用い
て、例文■を処理する過程を第8図に示す、まず、対応
する特性データの存在によって、ノードX−0001が
活性化状態となり、ノードX−0002は、非活性化状
態となる。ノードX−0002が非活性状態となること
により、X−0002からたどることのできるノードは
、処理されない0次に、ノードX−0001に接続され
ているノードであるノードA−0001及びノードA−
0002がそれぞれ前ノード活性化条件を満たすので、
該ノードに記述されているノード値計算方法に従ってノ
ード値計算が行われ、それぞれ図に示したようなノード
値を持つようになり、活性化状態となる。次の段階では
、ノードA−0001に接続されているノードとしてノ
ードY −0001及びY−0002が、ノードA−0
002に接続されているノードとしてY−0003が処
理される。ノードY−0002は、その前ノード活性化
条件は満たされるが、ノード値計算における条件が満た
されないため、活性化されない。
FIG. 8 shows the process of processing example sentence (■) using the inappropriate expression detection rule network shown in FIG. 7. First, due to the presence of the corresponding characteristic data, node X-0002 becomes inactive. As the node X-0002 becomes inactive, the nodes that can be traced from X-0002 are the unprocessed nodes A-0001 and A- which are the nodes connected to the node X-0001.
0002 satisfy the previous node activation condition, so
Node value calculation is performed according to the node value calculation method described in the node, and each node has a node value as shown in the figure, and is in an activated state. In the next stage, nodes Y-0001 and Y-0002 are connected to node A-0001.
Y-0003 is processed as a node connected to 002. Node Y-0002 is not activated because the previous node activation condition is satisfied, but the node value calculation condition is not satisfied.

ノードY−0001は、前ノード活性化条件及びノード
値計算中の条件ともに満たされるため、活性化され、図
に示したようなノード値を持つことNなる。ノードY−
0003も前ノード活性化条件及びノード値計算中の条
件ともに満たされるため、活性化され、図に示したよう
なノード値を持つことへなる。
Since both the previous node activation condition and the node value calculation condition are satisfied, node Y-0001 is activated and has a node value N as shown in the figure. Node Y-
0003 also satisfies both the previous node activation condition and the node value calculation condition, so it is activated and has the node value as shown in the figure.

以上に説明したように、例文■に対しては次の2つのタ
イプの不適性表現及び該不適性表現の文中での位置が検
出される。
As explained above, the following two types of inappropriate expressions and the position of the inappropriate expressions in the sentence are detected for the example sentence (3).

■−A:タイプ;名詞+「の」の文節がす変名間+「が
」の文節を修飾し。
■-A: Type; Noun + clause of "no" modifies the clause of pseudonym + "ga".

かつ、後者の文節が動詞「で きる」を修飾する。and the latter clause is the verb “de Modify "kiru".

位置 ; (文節12文節22文節4)[ノードY−0
001の活性化によって]■−B:タイプ;副詞と動詞
「できる」が連続する 位置 ; (文節31文節4) [ノードY−0003の活性化によって]次に、第7図
に示した不適性表現検出規則ネットワークを用いて、例
文■を処理する過程を第9図に示す、まず、対応する特
性データの存在によって、ノードX−0002が活性化
状態となり。
Position; (Phrase 12 Clause 22 Clause 4) [Node Y-0
[By activation of node Y-0003] ■-B: Type; position where adverb and verb "dekiru" are consecutive; (clause 31 clause 4) [By activation of node Y-0003] Next, the inappropriateness shown in Figure 7 FIG. 9 shows the process of processing example sentence (2) using the expression detection rule network. First, node X-0002 becomes activated due to the presence of corresponding characteristic data.

ノードX−0001は、非活性状態となる。ノードX−
0001が非活性状態となることにより、X−0001
からたどることのできるノードは、処理されない0次に
、ノードX−0002に接続されるノードであるノード
A−0003が前ノード活性化条件を満たすので、該ノ
ードに記述されているノード値計算方法に従ってノード
値計算が行われ5図に示すようなノード値を持つように
なり、活性化状態となる1次の段階では、ノードA−0
003に接続されているノードとしてノードA−000
4及びA−0005が処理される。ノードA−0005
は、その前ノード活性化条件が満たされないため、活性
化されない、ノードA−〇〇〇4は、前ノード活性化条
件及びノード値計算中の条件ともに満たされるため、活
性化され、図に示したようなノード値を持つこと5なる
。ノードA−0004に接続されるノードy−oo。
Node X-0001 becomes inactive. Node X-
As 0001 becomes inactive, X-0001
Since node A-0003, which is a node connected to node X-0002 and is connected to node X-0002, satisfies the previous node activation condition, the node value calculation method described in this node is Accordingly, the node value is calculated and has the node value as shown in Figure 5, and in the first stage of activation state, the node A-0
Node A-000 as the node connected to 003
4 and A-0005 are processed. Node A-0005
is not activated because its previous node activation condition is not satisfied, and node A-〇〇〇4 is activated because both the previous node activation condition and the condition during node value calculation are satisfied, as shown in the figure. 5. It has a node value such as 5. Node y-oo connected to node A-0004.

4は、前ノード活性化条件を満たすことによって活性化
され、図に示したようなノード値を持つこと\なる。
4 is activated by satisfying the previous node activation condition, and has the node value shown in the figure.

以上に説明したように、例文■に対しては次の1つのタ
イプの不適性表現及び該不適性表現の文中での位置が検
出される。
As explained above, for the example sentence (3), the following type of inappropriate expression and the position of the inappropriate expression in the sentence are detected.

■−A:タイプ;自動詞を他動詞として使用位置 ; 
(文節19文節3) [ノードY−0004の活性化によって]以上のように
して検出された不適性表現情報(不適性表現タイプ、不
適性表現の位置)は、警告メツセージ生成部5に送られ
る。警告メツセージ生成部5が参照する警告メツセージ
生成規則辞書6には、各不適性表現項目に1対1に対応
して、メツセージ生成規則が記述されている。各メツセ
ージ生成規則は、不適性表現箇所リスト、メツセージ生
成パターン、変数変換規則の3つの部分からなる。不適
性表現箇所リストは、該不適性表現に関係する文中での
位置情報を示す変数のリストである。すなわち、該リス
トの各要素は、警告メツセージ生成規則と1対1に対応
する不適性表現検出規則中の終端ノードにおけるノード
値のそれぞれの要素に対応している。メツセージ生成パ
ターンは、最終的に生成されるメツセージのテンプレー
トである。該メツセージ生成パターンは、変数部分を持
つ、不適性表現箇所リスト中に記述される変数と該メツ
セージ生成パターンに記述される変数との間には対応関
係がある。すなわち、不適性表現箇所中の変数に対して
変数変換規則を適用した結果がテンプレート中の変数で
ある。警告メツセージ生成部5は、まず、検出された不
適性表現の位置情報を警告メツセージ規則中の不適性表
現情報リストと対応付ける1次に、不適性表現情報リス
ト中のそれぞれの変数に対して変数変換規則を適用する
。最後に、該変換規則によって変換された結果をメツセ
ージ生成パターン中の変数部分と置き換えることによっ
て警告メツセージを生成する。
■-A: Type; position where intransitive verbs are used as transitive verbs;
(Phrase 19, Clause 3) The inappropriate expression information (unsuitable expression type, inappropriate expression position) detected as described above [by activation of node Y-0004] is sent to the warning message generation unit 5. . In the warning message generation rule dictionary 6 referred to by the warning message generation unit 5, message generation rules are described in one-to-one correspondence to each inappropriateness expression item. Each message generation rule consists of three parts: a list of inappropriate expressions, a message generation pattern, and a variable conversion rule. The inappropriate expression location list is a list of variables indicating positional information in a sentence related to the inappropriate expression. That is, each element of the list corresponds to each element of the node value at the terminal node in the inappropriate expression detection rule, which has a one-to-one correspondence with the warning message generation rule. The message generation pattern is a template for the message that is finally generated. The message generation pattern has a variable part, and there is a correspondence between the variables described in the list of inappropriate expressions and the variables described in the message generation pattern. That is, the variables in the template are the results of applying the variable conversion rules to the variables in the inappropriate expression location. The warning message generation unit 5 first associates the position information of the detected inappropriate expression with the inappropriate expression information list in the warning message rule, and then performs variable conversion on each variable in the inappropriate expression information list. Apply rules. Finally, a warning message is generated by replacing the variable part in the message generation pattern with the result converted by the conversion rule.

以下に第8図及び第9図に示した過程によって検出され
た不適性表現に対する警告メツセージ規則及びそれに基
づいて生成される警告メツセージを示す。こへで、Xi
、X2などは不適性箇所リスト中の変数を、Xi’ 、
X2’などはメツセージ生成パターン中の変数を示す。
The warning message rules for inappropriate expressions detected by the process shown in FIGS. 8 and 9 and the warning messages generated based on the rules are shown below. Here, Xi
, X2, etc. are the variables in the unsuitable part list,
X2' etc. indicate variables in the message generation pattern.

(a)Y−0001に関するメツセージ生成規則及び生
成メツセージ $メツセージ生成規則 不適性表現箇所リスト: (Xi  X2  X3) メツセージ生成パターン: ’ rX1’ X2’ Jの形に書き換えてください。
(a) Message generation rules and generated messages related to Y-0001 $ List of inappropriate expressions for message generation rules: (Xi X2 X3) Message generation pattern: Rewrite to the form 'rX1'X2' J.

” 変数変換規則: x1→x1′ :助詞を「の」から「を」へ変更する。” Variable conversion rules: x1→x1': Change the particle from "no" to "wo".

x2→x2′ :す変名詞+[することができる」へ変
更する。
x2→x2′: Change to s-odd noun + [can do].

串生成メツセージ(警告メツセージ) ″[分散処理システムを建設することができる」の形に
書き換えてください。
Skewer generation message (warning message) Please rewrite it as ``[Distributed processing system can be constructed.''

(b)Y−0003に関するメツセージ生成規則及び生
成メツセージ 拳メツセージ生成規則 不適性表現箇所リスト: (Xi  X2) メツセージ生成、パターン: ″副詞「X1′」の語順を変更してください、″″変数
変換規則: X14X1’  :X1’ =X1 ・生成メツセージ(警告メツセージ) パ副詞「容易に」の語順を変更してください、″(c)
Y−0004に関するメツセージ生成規則及び生成メツ
セージ 傘メツセージ生成規則 不適性表現箇所リスト: (Xi  X2) メツセージ生成パターン ’rX1’ をX2’ Jのように使役表現を用いて書
き換えるか、用いる動詞を再検討してください。
(b) Message generation rules for Y-0003 and list of inappropriate expressions for message generation rules: (Xi Rule: X14X1':X1' =
Message generation rules and message generation rules for Y-0004 List of inappropriate expressions: (Xi please.

変数変換規則: X1→X1’  :XL’  =XI X2→X2′ :使役表現(「させる」)を付加する。Variable conversion rules: X1 → X1': XL' = XI X2→X2′: Add causative expression (“to cause”).

一生成メッセージ(警報メツセージ) ″「入出力装置を動作させることができます」のように
使役表現を用いて書き換えるか、用いる動詞を再検討し
てください。
1-Generated message (alarm message) ``Rewrite the message using a causative expression such as ``The input/output device can be operated,'' or reconsider the verb used.

(a)は第8図に示した過程によって検出される不適性
表現に対するものである。この場合、変数X1は文節1
 (「分散処理システムのj)、変数X2は文節2(「
建設が」)、変数X3は文節4([できますj)に対応
付けられる。次に、Xl。
(a) is for an inappropriate expression detected by the process shown in FIG. In this case, variable X1 is clause 1
("j of distributed processing system), variable X2 is clause 2 ("
construction ga''), variable X3 is associated with clause 4 ([can be j). Next, Xl.

X2の変数に対して変数変換規則が適用される。Variable conversion rules are applied to the variables of X2.

その結果、X1′は、r分散処理システムをJという文
字列を値として持ち、X2’は、「建設することができ
ます」という文字列を値とした持つ。
As a result, X1' has the character string J representing r distributed processing system as its value, and X2' has the character string "can be constructed" as its value.

この結果は、メツセージ生成パターン中のそれぞれ対応
する変数と置き換えられ、警告メツセージとして「分散
処理システムを建設することができる」が生成される。
This result is replaced with each corresponding variable in the message generation pattern, and a warning message "A distributed processing system can be constructed" is generated.

 (b)、 (c)に対しても同様の過程によって警告
メツセージが生成される。
Warning messages are generated for (b) and (c) by a similar process.

以上のようにして生成された警告メツセージは。The warning message generated as above is:

出力部7を介して、デイスプレィ装置などの表示装置に
表示され、ユーザに通知される。ユーザは、この警告メ
ツセージを参照することによって推敲作業を効率的に行
うことができる。
Via the output unit 7, the information is displayed on a display device such as a display device, and the user is notified. The user can efficiently perform editing work by referring to this warning message.

〔発明の効果〕〔Effect of the invention〕

以上説明したように、本発明によれば、複数の文章から
かる日本語文書の推敲作業を、検出された不適性表現の
箇所、及び、不適性表現のタイプに基づいて生成され提
示される警告メツセージに基づいて行うことができる。
As explained above, according to the present invention, a warning is generated and presented based on the location of inappropriate expressions detected and the type of inappropriate expressions when revising a Japanese document consisting of multiple sentences. This can be done based on the message.

不適性表現の検出、及び、警告メツセージの提示は1本
発明を実施した装置により網羅的に行われるため、推敲
作業を行うユーザは、不適性表現の推敲を網羅的に行う
ことができ1文書の品質を均一に保つことができる。ま
た、特定の表現を要求される分野の文書を対象とする場
合には、それに適応した不適性表現検出規則を不適性表
現検出規則辞書に登録するだけで、文書の対象分野に適
合した推敲支援機能を実現することができる。
Since the detection of inappropriate expressions and the presentation of warning messages are carried out comprehensively by the device implementing the present invention, the user performing the editing work can comprehensively revise inappropriate expressions in one document. can maintain uniform quality. In addition, if you are targeting a document in a field that requires specific expressions, you can simply register inappropriate expression detection rules that are appropriate for the document in the inappropriate expression detection rule dictionary, and you will receive revision support that is appropriate for the target field of the document. functions can be realized.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の日本語文書推敲支援装置の一実施例を
示すブロック図、第2図は形態素解析及び構文解析を説
明する図、第3図は例文■に対する形態素解析結果及び
構文解析結果を示す図、第4図は例文■に対する形態素
解析結果及び構文解析結果を示す図、第5図は不適性表
現検出規則ネットワークの概念図、第6図は不適性表現
検出規則ネットワーク中のノードの構造の概念図、第7
図は例文に関連する不適性表現検出規則ネットワークを
示す図、第8図は例文■に対する不適性表現検定の過程
を説明する図、第9図は例文■に対する不適性表現検定
の過程を説明する図である。 1・・・入力部、 2・・・特性データ収集部、3・・
・不適性表現検定部、 4・・・不適性表現検出規則辞
書、  5・・・警告メツセージ生成部。 6・・・警告メツセージ生成規則辞書、7・・・出力部
。 第1図 弔 図 第 図 令メN;;)ノード ツへnノー ド 迦ト縞ノーV
Fig. 1 is a block diagram showing an embodiment of the Japanese document elaboration support device of the present invention, Fig. 2 is a diagram explaining morphological analysis and syntactic analysis, and Fig. 3 is the morphological analysis result and syntactic analysis result for example sentence ■. Figure 4 is a diagram showing the morphological analysis results and syntactic analysis results for example sentence ■. Figure 5 is a conceptual diagram of the inappropriate expression detection rule network. Figure 6 is a diagram showing the nodes in the inappropriate expression detection rule network. Conceptual diagram of structure, 7th
The figure shows the inappropriate expression detection rule network related to example sentences, Figure 8 is a diagram explaining the process of inappropriate expression testing for example sentence ■, and Figure 9 explains the process of inappropriate expression testing for example sentence ■. It is a diagram. 1... Input section, 2... Characteristic data collection section, 3...
- Inappropriate expression testing unit, 4... Inappropriate expression detection rule dictionary, 5... Warning message generation unit. 6... Warning message generation rule dictionary, 7... Output section. Figure 1: Funeral map: Figure 1;

Claims (1)

【特許請求の範囲】[Claims] (1)複数の日本文から構成される日本語文書を入力し
て処理する日本語文書処理システムにおいて、 文書を構成する各日本文に対する形態素解析結果、構文
解析結果を入力として、各日本文に対する推敲支援上の
特性データを収集する特性データ収集部と、該収集され
た特性データ及びあらかじめ登録された不適性表現検出
規則に基づいて各日本文中に含まれる推敲作業を必要と
する不適性表現を含む箇所と不適性表現のタイプを検出
する不適性表現検定部と、該不適性表現検出規則を格納
する不適性表現規則辞書と、上記検出された不適性表現
箇所及び不適性表現タイプに基づいて警告メッセージを
生成する警告メッセージ生成部と、該警告メッセージ生
成規則を格納する警告メッセージ生成規則辞書を有する
ことを特徴とする日本語文書推敲支援装置。
(1) In a Japanese document processing system that inputs and processes a Japanese document consisting of multiple Japanese sentences, the morphological analysis results and syntactic analysis results for each Japanese sentence that make up the document are input, and the A characteristic data collection unit that collects characteristic data for elaboration support, and a characteristic data collection unit that collects inappropriate expressions that require elaboration work included in each Japanese sentence based on the collected characteristic data and pre-registered inappropriate expression detection rules. an inappropriate expression testing unit that detects the inappropriate expressions including the inappropriate expressions, an inappropriate expression rule dictionary that stores the inappropriate expression detection rules, and an inappropriate expression detection section that detects the inappropriate expressions and inappropriate expression types; A Japanese document elaboration support device comprising: a warning message generation unit that generates a warning message; and a warning message generation rule dictionary that stores the warning message generation rules.
JP63214615A 1988-08-29 1988-08-29 Back-up device for elaboration of japanese word document Pending JPH0262656A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63214615A JPH0262656A (en) 1988-08-29 1988-08-29 Back-up device for elaboration of japanese word document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63214615A JPH0262656A (en) 1988-08-29 1988-08-29 Back-up device for elaboration of japanese word document

Publications (1)

Publication Number Publication Date
JPH0262656A true JPH0262656A (en) 1990-03-02

Family

ID=16658658

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63214615A Pending JPH0262656A (en) 1988-08-29 1988-08-29 Back-up device for elaboration of japanese word document

Country Status (1)

Country Link
JP (1) JPH0262656A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03255576A (en) * 1990-03-06 1991-11-14 Matsushita Electric Ind Co Ltd Method and device for correcting japanese language document
US5598518A (en) * 1993-03-10 1997-01-28 Fuji Xerox Co., Ltd. Text editing apparatus for rearranging sentences
US9697955B2 (en) 2011-11-22 2017-07-04 Nippon Chemi-Con Corporation Capacitor device

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03255576A (en) * 1990-03-06 1991-11-14 Matsushita Electric Ind Co Ltd Method and device for correcting japanese language document
JP2887327B2 (en) * 1990-03-06 1999-04-26 松下電器産業株式会社 Japanese document proofreading device
US5598518A (en) * 1993-03-10 1997-01-28 Fuji Xerox Co., Ltd. Text editing apparatus for rearranging sentences
US9697955B2 (en) 2011-11-22 2017-07-04 Nippon Chemi-Con Corporation Capacitor device

Similar Documents

Publication Publication Date Title
US4931935A (en) User interface system for permitting natural language interaction with an information retrieval system
JP2664915B2 (en) Information retrieval system
Strobelt et al. LMdiff: A visual diff tool to compare language models
US11436278B2 (en) Database creation apparatus and search system
Frase Human factors and behavioral science: The UNIX™ Writer'S workbench software: Philosophy
Alghamdi et al. Natural language interface to relational database (NLI-RDB) through object relational mapping (ORM)
Fukui et al. Predictive algorithm for converting linear strings to general mathematical formulae
EP3425531A1 (en) System, method, electronic device, and storage medium for identifying risk event based on social information
Begum et al. Analysis of legal case document automated summarizer
JPH0262656A (en) Back-up device for elaboration of japanese word document
Siyam et al. Arabic arithmetic word problems solver
JP2007122660A (en) Document data processor and document data processing program
CN114547321A (en) Knowledge graph-based answer generation method and device and electronic equipment
Golub et al. Visualizing Russian kinship term possessive sequences as family trees
JP3506518B2 (en) Review support device
Kaiser et al. Gaining process information from clinical practice guidelines using information extraction
FRASE The UNIX™ Writer's Workbench Software
Küçük et al. Stance and Sentiment Analysis of Health-related Tweets with Data Augmentation: STANCE AND SENTIMENT ANALYSIS OF HEALTH-RELATED TWEETS
Küçük et al. Stance and Sentiment Analysis of Health-related Tweets with Data Augmentation
Rybank Adapting a Question-Answering System for Retrieving Information about Git Repositories: A NLP journey through Knowledge Graphs and Git
Koçak et al. Topic Modeling Analysis of Tweets on the Twitter Hashtags with LDA and Creating a New Dataset
WO2023168369A1 (en) Processing and visualization of textual data based on syntactic dependency trees and sentiment scoring
JPH0283770A (en) Sentence sort deciding device
Rösner et al. TECHDOC: Multilingual generation of online and offline instructional text
JP2005338970A (en) Sentence processor