JPH0969102A - Device and method for preparing document - Google Patents

Device and method for preparing document

Info

Publication number
JPH0969102A
JPH0969102A JP7223066A JP22306695A JPH0969102A JP H0969102 A JPH0969102 A JP H0969102A JP 7223066 A JP7223066 A JP 7223066A JP 22306695 A JP22306695 A JP 22306695A JP H0969102 A JPH0969102 A JP H0969102A
Authority
JP
Japan
Prior art keywords
sentence
character string
specific character
condition
error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7223066A
Other languages
Japanese (ja)
Inventor
Keiji Saito
啓司 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP7223066A priority Critical patent/JPH0969102A/en
Publication of JPH0969102A publication Critical patent/JPH0969102A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To shorten error detection time by previously registering a character string which tends to be used in error in a Japanese sentence and applying a molpheme analysis only to a sentence including the character string. SOLUTION: A character string retrieving part 105 reads out sentence data from a sentence storing part 102 and retrieves a character string to easily make an error which is previously prepared in a specific character string storing part 104. A sentence including the specific character string is extracted from the read data and an information sort necessary for evaluating the specific character string is referred from an information sort condition storing part 201. A necessary analysis method is selected based upon the referred information sort and a segmented document is analyzed based upon the analysis method. Then, a condition evaluating part 109 evaluates whether the specific character string to be an object is properly used in the sentence or not by the use of the analyzed result and a judgement condition stored in a condition storing part 106.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、日本語文章中の誤り検
出する文書作成装置、及び文書作成方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document preparation device and a document preparation method for detecting an error in a Japanese sentence.

【0002】[0002]

【従来の技術】従来の文書作成装置に於ける誤り検出で
は、形態素解析或いは構文解析を用いた誤り検出をする
場合には、全文章に解析を施して誤りを検出していた
為、無駄な処理時間が多かった。又、解析方法が固定さ
れていて、必要のない情報をも取り出していたものであ
った。この必要のない情報は参照されず、効率が悪いも
のであった。
2. Description of the Related Art In the conventional error detection in a document preparation apparatus, when performing error detection using morphological analysis or syntactic analysis, the whole sentence is analyzed to detect the error, which is wasteful. It took a lot of processing time. In addition, the analysis method was fixed, and unnecessary information was taken out. This unnecessary information was not referenced and was inefficient.

【0003】[0003]

【発明が解決しようとする課題】上述したように、従来
の文書作成装置に於ける誤り検出では、文章中で誤りが
潜む疑いのある文章のみを対象に解析を施したり、必要
な情報だけを取り出す文章解析方法を選択する必要があ
った。
As described above, in the error detection in the conventional document creating apparatus, the analysis is performed only on the sentence in which the error is suspected to be hidden, or only the necessary information is obtained. It was necessary to select the text analysis method to retrieve.

【0004】そこで、本発明は上記事情を考慮して成さ
れたものであり、上記不具合を解消し、必要最小限の文
章を、必要最小限の解析で評価し、誤り検出時間を短縮
する文書作成装置、及び文書作成方法を提供することを
目的とする。
Therefore, the present invention has been made in consideration of the above circumstances, and is a document which solves the above-mentioned problems, evaluates the minimum necessary sentences by the minimum necessary analysis, and shortens the error detection time. An object is to provide a creating device and a document creating method.

【0005】[0005]

【課題を解決するための手段】本発明は、上記目的を達
成する為、文章を記憶する文章記憶手段と、前記文章を
表示する文章表示手段と、前記文章を形態素に分割する
形態素解析手段と、使用誤りを犯し易い特定の文字列を
予め記憶しておく特定文字列記憶手段と、文中から前記
特定文字列を検出する文字列検出手段と、前記特定文字
列を含む文章中の各形態素が満たすべき条件を記憶する
形態素条件記憶手段と、前記特定文字列を含む文章の形
態素解析結果がその条件を満たすかどうかを評価して文
中の特定文字列の使用誤りを検出する誤り検出手段とを
具備し、使用誤りを犯し易い文字列が含まれる文章のみ
を対象に形態素解析を実施し、文中の誤りを検出するこ
とを特徴とする文書作成装置にある。
In order to achieve the above object, the present invention provides a sentence storage unit for storing a sentence, a sentence display unit for displaying the sentence, and a morpheme analysis unit for dividing the sentence into morphemes. , A specific character string storage means for pre-storing a specific character string that is prone to misuse, a character string detection means for detecting the specific character string in a sentence, and each morpheme in a sentence including the specific character string A morpheme condition storage unit that stores a condition to be satisfied, and an error detection unit that evaluates whether or not a morpheme analysis result of a sentence including the specific character string satisfies the condition and detects an error in using the specific character string in the sentence. There is provided a document creation device characterized by performing morphological analysis only on a sentence including a character string that is prone to misuse and detects an error in the sentence.

【0006】又、本発明は上記目的を達成する為、文章
を記憶する文章記憶手段と、前記文章を表示する文章表
示手段と、前記文章を形態素に分割する形態素解析手段
と、前記形態素解析結果から文章構造を得る構文解析手
段と、使用誤りを犯し易い特定の文字列を予め記憶して
おく特定文字列記憶手段と、文中から前記特定文字列を
検出する文字列検出手段と、前記特定文字列を含む文章
中の各形態素が満たすべき条件を記憶する形態素条件記
憶手段と、前記特定文字列を含む文章の形態素解析結果
がその条件を満たすかどうかを評価して文中の特定文字
列の使用誤りを検出する誤り検出手段とを具備し、使用
誤りを犯し易い文字列が含まれる文章のみを対象に形態
素解析及び構文解析を施し、文中の誤りを検出すること
を特徴とする文書作成装置にある。
Further, in order to achieve the above object, the present invention achieves the above-mentioned object, a sentence storage means for storing a sentence, a sentence display means for displaying the sentence, a morpheme analysis means for dividing the sentence into morphemes, and a morpheme analysis result. A syntactic analysis unit that obtains a sentence structure from a specific character string storage unit that stores in advance a specific character string that is prone to misuse; a character string detection unit that detects the specific character string from a sentence; Morphological condition storage means for storing a condition to be satisfied by each morpheme in a sentence including a string, and use of a specific character string in the sentence by evaluating whether or not a morphological analysis result of a sentence including the specific character string satisfies the condition A document comprising an error detecting means for detecting an error, performing morphological analysis and syntactic analysis only on a sentence including a character string that is likely to cause a usage error, and detecting an error in the sentence In the adult system.

【0007】更に、本発明は上記目的を達成する為、文
章を記憶する文章記憶手段と、前記文章を表示する文章
表示手段と、形態素解析結果として必要とする情報種夫
々を得る為の複数の形態素解析手段と、構文解析結果と
して必要とする情報種夫々を得る為の複数の構文解析手
段と、使用誤りを犯し易い特定の文字列を予め記憶して
おく特定文字列記憶手段と、文中から前記特定文字列を
検出する特定文字列検出手段と、特定文字列及びそれを
含む文章が満たすべき条件を記憶する条件記憶手段と、
前記条件を満たすかどうかを評価するのに必要な情報種
を特定文字列と関連づけて記憶する情報種記憶手段と、
前記条件を満たすかどうかを評価して特定文字列の使用
誤りを検出する誤り検出手段とを具備し、使用誤りを犯
し易い文字列が含まれる文章のみを対象に、必要最小限
の形態素解析及び構文解析を施し文中の誤りを検出する
ことを特徴とする文書作成装置にある。
Further, in order to achieve the above object, the present invention provides a plurality of sentence storage means for storing a sentence, a sentence display means for displaying the sentence, and a plurality of information types for obtaining each information type required as a morphological analysis result. Morphological analysis means, a plurality of syntactic analysis means for obtaining each required information type as a syntactic analysis result, a specific character string storage means for pre-storing a specific character string that is prone to misuse, and from the sentence A specific character string detection means for detecting the specific character string, a condition storage means for storing the specific character string and the condition to be satisfied by the sentence containing it,
An information type storage unit that stores an information type necessary for evaluating whether or not the condition is satisfied in association with a specific character string;
An error detecting unit that evaluates whether or not the condition is satisfied to detect a usage error of a specific character string, and targets only a sentence including a character string that is prone to a usage error, and a minimum necessary morphological analysis and A document creating apparatus characterized by performing syntax analysis and detecting an error in a sentence.

【0008】更に、本発明は上記目的を達成する為、使
用誤りを犯し易い特定の文字列を予め記憶しておき、こ
の特定文字列を含む文章が満たすべき形態素の条件を記
憶しておき、文中から前記特定文字列を検出し、前記特
定文字列を含む文章の形態素解析結果からその条件を満
たすかどうかを評価して文中の特定文字列の使用誤りを
検出し、使用誤りを犯し易い文字列が含まれる文章のみ
を対象に形態素解析を実施し、文中の誤りを検出するこ
とを特徴とする文書作成方法にある。
Further, in order to achieve the above-mentioned object, the present invention stores in advance a specific character string which is prone to misuse, and stores a condition of a morpheme that a sentence including the specific character string must satisfy. Detects the specific character string in the sentence, detects whether the specific character string in the sentence is used by evaluating whether or not the condition is satisfied from the result of morphological analysis of the sentence including the specific character string, and is a character that is prone to use error A document creating method is characterized by performing morphological analysis only on a sentence including a sequence and detecting an error in the sentence.

【0009】更に、本発明は上記目的を達成する為、使
用誤りを犯し易い特定の文字列を予め記憶しておき、こ
の特定文字列を含む文章が満たすべき形態素の条件を記
憶しておき、文中から前記特定文字列を検出し、前記特
定文字列を含む文章の形態素解析結果からその条件を満
たすかどうかを評価して文中の特定文字列の使用誤りを
検出し、使用誤りを犯し易い文字列が含まれる文章のみ
を対象に形態素解析及び構文解析を施し文中の誤りを検
出することを特徴とする文書作成方法にある。
Further, in order to achieve the above object, the present invention stores in advance a specific character string which is likely to be misused, and stores a condition of a morpheme that a sentence including the specific character string must satisfy. Detects the specific character string in the sentence, detects whether the specific character string in the sentence is used by evaluating whether or not the condition is satisfied from the result of morphological analysis of the sentence including the specific character string, and is a character that is prone to use error A document creating method is characterized by performing morphological analysis and syntactic analysis only on a sentence including a string to detect an error in the sentence.

【0010】更に、本発明は上記目的を達成する為、形
態素解析結果として必要とする情報種夫々を得る為の複
数の形態素解析方法を用意し、構文解析結果として必要
とする情報種夫々を得る為の複数の構文解析方法を用意
し、使用誤りを犯し易い特定の文字列を予め記憶してお
き、文中からその特定文字列を検出し、前記特定文字列
及びそれを含む文章が満たすべき条件を記憶しておき、
前記条件を満たすかどうかを評価するのに必要な構文解
析方法を選択して文章に施し、その条件を満たすかどう
かを評価して特定文字列の形態素解析及び構文解析を施
し、文中の誤りを検出することを特徴とする文書作成方
法にある。
Further, in order to achieve the above object, the present invention prepares a plurality of morpheme analysis methods for obtaining each information type required as a morpheme analysis result, and obtains each information type required as a syntactic analysis result. Prepare a plurality of parsing methods for the purpose, pre-store a specific character string that is prone to misuse, detect the specific character string in the sentence, the condition that the specific character string and the sentence containing it should be satisfied Memorize
Select the syntax analysis method necessary to evaluate whether the condition is satisfied and apply it to the sentence, evaluate whether the condition is satisfied and perform morphological analysis and syntactic analysis of the specific character string to check the error in the sentence. A document creation method characterized by detecting.

【0011】[0011]

【作用】上記構成によれば、日本語文章中で使用を誤り
易い特定の文字列を予め登録しておき、その特定の文字
列を含む文章のみを対象にして形態素解析を施すことに
より解析かかる時間を短縮できる。又、その文字列が正
しく使われているかどうかを判断する為に必要な情報種
に応じて解析方法を選択することにより、無駄な解析を
行わずに誤りの検出が可能になる。
With the above structure, a specific character string that is likely to be misused in a Japanese sentence is registered in advance, and morphological analysis is performed by subjecting only the sentence containing the specific character string to morphological analysis. You can save time. Further, by selecting the analysis method according to the information type necessary for determining whether or not the character string is correctly used, it is possible to detect an error without performing unnecessary analysis.

【0012】[0012]

【実施例】以下図面を参照して本発明の一実施例を説明
する。図1は本発明の一実施例の構成を示すブロック図
である。図1に於いて、入力部101は、ユーザが文字
を入力したりコマンドを入力する部分であり、具体的に
はキーボードやペン、マウス等である。
An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing the configuration of one embodiment of the present invention. In FIG. 1, an input unit 101 is a part where a user inputs characters or commands, and specifically, is a keyboard, a pen, a mouse, or the like.

【0013】文章記憶部102は、処理対象となる文章
を記憶する部分であり具体的にはフロッピーディスク装
置やハードディスク装置、メモリ等である。出力部10
3は、対象となる文章や文書中の特定文字列部分、それ
を評価した後の結果やメッセージ等を表示・出力する部
分であり、具体的にはディスプレイやプリンタ等であ
る。
The sentence storage unit 102 is a unit for storing a sentence to be processed, and is specifically a floppy disk device, a hard disk device, a memory or the like. Output unit 10
Reference numeral 3 denotes a target sentence or a specific character string portion in the document, and a portion for displaying / outputting a result or a message after the evaluation, specifically, a display, a printer or the like.

【0014】特定文字列記憶部104は、誤りを犯し易
い表現を含んだ文字列を記憶する部分である。文字列検
索部105は、特定文字列記憶部104に記憶された文
字列を文章記憶部102に記憶された文章中から探し出
し、その文字列を含む一文を取り出す部分である。
The specific character string storage unit 104 is a unit for storing a character string containing an expression that is likely to make an error. The character string search unit 105 is a unit that searches for a character string stored in the specific character string storage unit 104 from the text stored in the text storage unit 102 and extracts one sentence including the character string.

【0015】条件記憶部106は、特定文字列記憶部1
04に記憶された文字列が正しく使用されている場合
に、その文章が満たすべき条件を各文字列毎に記憶する
部分である。ここには、更に解析前に参照する情報種条
件記憶部201が付加される。
The condition storage unit 106 is a specific character string storage unit 1.
When the character string stored in 04 is correctly used, the condition to be satisfied by the sentence is stored for each character string. An information type condition storage unit 201 to be referred to before analysis is further added here.

【0016】形態素解析部107は、文字列検索部10
5に於いて取り出された文章を形態素単位で分析し、文
法的な諸情報を出力する部分である。ここには、更に機
能別に細分化され、品詞情報解析部301と精微品詞解
析部302に分けられる。細分化した機能については、
通常は全てを使用し、情報種条件記憶部201から特別
に指定があればその機能を使用する。
The morphological analysis unit 107 includes a character string search unit 10
This is a part that analyzes the sentence extracted in 5 in units of morphemes and outputs various grammatical information. Here, it is further subdivided by function and divided into a part-of-speech information analysis unit 301 and a fine part-of-speech analysis unit 302. For the subdivided functions,
Normally, all are used, and if there is a special designation from the information type condition storage unit 201, that function is used.

【0017】構文解析部108は、文字列検索部105
に於いて取り出された文章を解析してその構文構造を出
力する部分である。ここでは、更に機能別に細分化され
基礎解析部401と係り受け解析部402に分けられ
る。細分化した機能について、通常は全てを使用し、情
報種条件記憶部201から特別に指定があればその機能
を使用する。
The syntax analysis unit 108 includes a character string search unit 105.
It is a part that analyzes the sentence extracted in and outputs the syntactic structure. Here, it is further subdivided by function and divided into a basic analysis unit 401 and a dependency analysis unit 402. Normally, all the subdivided functions are used, and if there is a special designation from the information seed condition storage unit 201, the function is used.

【0018】条件評価部109は、形態素解析部107
及び構文解析部108から得られた解析結果と条件記憶
部106から要求される条件によって、対象となる文が
正しいかどうかを評価する部分である。評価した結果は
出力部103へ送られる。情報種条件記憶部201は、
条件評価部109での評価に必要な情報種を記憶してお
り、対象となる文章にどのような解析を施すかを形態素
解析部107及び構文解析部108に対して指定する。
The condition evaluation unit 109 is a morpheme analysis unit 107.
It is a part for evaluating whether or not the target sentence is correct according to the analysis result obtained from the syntax analysis part 108 and the condition requested from the condition storage part 106. The evaluation result is sent to the output unit 103. The information type condition storage unit 201
Information types necessary for evaluation by the condition evaluation unit 109 are stored, and what kind of analysis is performed on a target sentence is specified to the morpheme analysis unit 107 and the syntax analysis unit 108.

【0019】上記構成にあっては、次のように動作する
よう構成されているものである。図2は本実施例の動作
を示すフローチャートである。図2に於いては、文章記
憶部102から文章データを読み込み、文章を表示する
ステップである。
In the above-mentioned configuration, it is configured to operate as follows. FIG. 2 is a flowchart showing the operation of this embodiment. In FIG. 2, the step is to read the text data from the text storage unit 102 and display the text.

【0020】ステップS2は、ステップS1で読み込ん
だ文章データ中から、特定文字列記憶部104に予め用
意された誤りを犯し易い文字列を検索するステップであ
る。ステップS3は、ステップS2の検索の結果、特定
の文字列が含まれることが分かった文章をデータ中から
抜き出すステップである。
Step S2 is a step of searching the text data read in step S1 for a character string prepared in advance in the specific character string storage unit 104 and prone to make an error. Step S3 is a step of extracting from the data a sentence that is found to contain a specific character string as a result of the search in step S2.

【0021】ステップS4は、解析部が複数の処理方法
を実現できる場合、ユーザが解析部の取捨選択をするか
どうかを決定するステップである。ユーザが解析時間の
短縮を望む場合はステップS6へ、そうでない場合はス
テップS5へと処理が移行する。
Step S4 is a step of determining whether or not the user selects the analysis unit when the analysis unit can realize a plurality of processing methods. If the user desires to reduce the analysis time, the process proceeds to step S6, and if not, the process proceeds to step S5.

【0022】解析部が一通りの動作しかサポートていな
い場合はステップS3からステップS5へと処理がスキ
ップする。ステップS5は、ステップS3で切り出され
た1文を通常通の解析方法で処理する方法である。ここ
で、解析部が複数の処理方法を持つ場合、予めどういっ
た解析をするかを定めておく必要がある。特定文字列中
には複数情報を利用して条件判断するものが含まれるの
で、全ての文字列を判定する場合には、それらの必要な
だけの情報を得られるように設定しておくべきである。
When the analysis unit supports only one type of operation, the process skips from step S3 to step S5. Step S5 is a method of processing the one sentence cut out in step S3 by a usual analysis method. Here, if the analysis unit has a plurality of processing methods, it is necessary to define whether to advance what kind of analysis. Certain character strings include those that use multiple pieces of information to make conditional judgments, so when judging all character strings, it should be set so that as much information as necessary can be obtained. is there.

【0023】ステップS6はステップS3で切り出され
た1文中にある特定文字列を評価するのに必要な情報種
を情報種条件記憶部から参照するステップである。ステ
ップS7は、ステップS6で参照された情報種をもとに
必要な解析方法を選択するステップである。
Step S6 is a step of referring from the information type condition storage unit the information type necessary for evaluating the specific character string in one sentence cut out in step S3. Step S7 is a step of selecting a necessary analysis method based on the information type referred to in step S6.

【0024】ステップS8は、ステップS7で選択され
た解析方法に基づいてステップS3で切り出された文章
を解析するステップである。ステップS9は、ステップ
S5或いはS8で得られた解析結果と条件記憶部106
の判定条件を用いて、対象となる特定文字列がその1文
中で適切に使用されているかどうかを評価するステップ
である。
Step S8 is a step of analyzing the sentence cut out in step S3 based on the analysis method selected in step S7. In step S9, the analysis result obtained in step S5 or S8 and the condition storage unit 106 are stored.
Is a step of evaluating whether or not the target specific character string is appropriately used in one sentence by using the determination condition of.

【0025】ステップS10は、ステップS9の判定結
果をユーザに提示するステップである。以下に本実施例
の具体的な動作を説明する。
Step S10 is a step of presenting the determination result of step S9 to the user. The specific operation of this embodiment will be described below.

【0026】処理対象となる文章を読み込み、画面に表
示させる(ステップS1)。次に、予め用意しておいた
誤りを犯し易い特定の文字列を文中から検索する(ステ
ップS2)。もしも文中に見つかれば、その文字列を含
む1文を文章データから切り出す(ステップS3)。こ
の1文だけが以後の処理の対象となり、それ以外の文章
は解析されない。この方法により無駄な処理時間をかけ
ずに文章中に誤りを検出することができる。特定文字列
はそれに対応して、判定条件と情報種を条件記憶部に持
っている。判定条件とはその文字列が正しく使用されて
いるかどうかの判定に用いる条件であり、情報種とはそ
の判定に必要な文章の解析情報である。特定文字列及び
その判定条件と情報種の一例を以下に示す。 (例) 1)特定文字列:以外 判定条件 :「位置が文頭でないこと」 :「前方に助詞がないこと」 情報量 :品詞情報 2)特定文字列:夢にも 判定条件 :「係り受け関係にある動詞が連用形であること」 「否定の付属語“ない”を伴っていること」 情報量 :品詞情報、係り受け情報 解析部が一通りの処理ブロックからなる場合、切り出さ
れた1文をそのまま解析する(ステップS5)。もし、
解析部が複数存在し、情報種が要求するデータを得る為
の処理を付加的に選択できる場合、処理速度を向上する
為に必要な処理を選択することができる(ステップS
4)。例えば、品詞情報だけを必要とする場合、構文解
析は必要ないので、形態素解析のみを施すことにより、
ムダな処理時間をかけずに済む。又、係り受け情報と品
詞情報が必要な場合、精緻化品詞(「名詞」だけでな
く、「動物名詞」「植物名詞」といったより詳しい情報
を付加した品詞情報)は必要なく、品詞情報を得る為の
形態素解析と係り受けを含めた構文解析を施せば良い。
ユーザが処理時間の短縮を望んだ場合、条件記憶部に記
憶された情報種を参照して(ステップS6)、必要な解
析方法を選択し(ステップS7)、解析を実行する(ス
テップS8)。その後、解析結果と判定条件からその文
章の正しさを評価する(ステップS9)。上記の例1)
の文字列を含む誤った文章の場合の解析と評価の例を以
下に示す。 (例文)それは以外な盲点だった。
The text to be processed is read and displayed on the screen (step S1). Next, a specific character string that is easy to make an error prepared in advance is searched from the sentence (step S2). If found in the sentence, one sentence including the character string is cut out from the sentence data (step S3). Only this one sentence is the target of the subsequent processing, and the other sentences are not analyzed. By this method, an error can be detected in a sentence without wasting processing time. The specific character string has a determination condition and an information type in the condition storage unit correspondingly. The judgment condition is a condition used for judging whether or not the character string is correctly used, and the information type is analysis information of a sentence necessary for the judgment. An example of a specific character string, its determination condition, and information type is shown below. (Example) 1) Other than specific character string Judgment condition: "The position is not the beginning of a sentence": "There is no particle in front" Information amount: Part-of-speech information 2) Specific character string: Even in dream Judgment condition: "Dependency relationship" The verb in is a continuation form. "It is accompanied by the negative adjunct" not "." Information amount: part-of-speech information, dependency information If the analysis unit consists of one processing block, the cut-out sentence is The analysis is performed as it is (step S5). if,
When there are a plurality of analysis units and the processing for obtaining the data required by the information type can be additionally selected, the processing necessary for improving the processing speed can be selected (step S
4). For example, if only part-of-speech information is required, syntactic analysis is not required, so by performing only morphological analysis,
Saves unnecessary processing time. In addition, if dependency information and part-of-speech information are needed, refined part-of-speech (part-of-speech information in which more detailed information such as "animal noun" or "plant noun" is added in addition to "noun") is not needed, and part-of-speech information is obtained. It is sufficient to perform morphological analysis and syntactic analysis including dependency.
When the user desires to shorten the processing time, the information type stored in the condition storage unit is referred to (step S6), the necessary analysis method is selected (step S7), and the analysis is executed (step S8). Then, the correctness of the sentence is evaluated from the analysis result and the judgment condition (step S9). Example 1 above)
An example of analysis and evaluation in the case of an incorrect sentence containing the character string of is shown below. (Example sentence) It was a blind spot.

【0027】 形態素解析結果:[それ」(代名詞) 「は」 (助詞) 「以外」(名詞)→特定文字列 「な」(未知語) 「盲点」(名詞) 「だっ」(助詞) 「た」(助詞) 条件判定結果:「以外」の前方に助詞が存在する。Morphological analysis result: [that] (pronoun) "ha" (particle) "other" (noun) → specific character string "na" (unknown word) "blind point" (noun) "da" (particle) "ta ”(Particle) Condition determination result: A particle exists before“ other than ”.

【0028】よってこの文章は使用誤りである 以上のように誤りと判定された文章に対してはその旨ユ
ーザに通知する(ステップS10)。
Therefore, this sentence is a misuse. For the sentence judged to be erroneous as described above, the user is informed accordingly (step S10).

【0029】[0029]

【発明の効果】以上詳記したように本発明によれば、文
章解析の処理量を削減することにより、誤り検出に費や
す時間を短縮することができるという優れた効果を奏す
るものである。
As described above in detail, according to the present invention, by reducing the processing amount of sentence analysis, the time required for error detection can be shortened.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例の構成を示すブロック図。FIG. 1 is a block diagram showing the configuration of an embodiment of the present invention.

【図2】同実施例の動作を説明するフローチャート。FIG. 2 is a flowchart for explaining the operation of the embodiment.

【符号の説明】[Explanation of symbols]

101…入力部、102…文章記憶部、103…出力
部、104…特定文字列記憶部、105…文字列検索
部、106…条件記憶部、107…形態素解析部、10
8…構文解析部、109…条件評価部、201…情報種
条件記憶部。
101 ... Input unit, 102 ... Sentence storage unit, 103 ... Output unit, 104 ... Specific character string storage unit, 105 ... Character string search unit, 106 ... Condition storage unit, 107 ... Morphological analysis unit, 10
8 ... Syntax analysis unit, 109 ... Condition evaluation unit, 201 ... Information type condition storage unit.

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 文章を記憶する文章記憶手段と、 前記文章を表示する文章表示手段と、 前記文章を形態素に分割する形態素解析手段と、 使用誤りを犯し易い特定の文字列を予め記憶しておく特
定文字列記憶手段と、 文中から前記特定文字列を検出する文字列検出手段と、 前記特定文字列を含む文章中の各形態素が満たすべき条
件を記憶する形態素条件記憶手段と、 前記特定文字列を含む文章の形態素解析結果がその条件
を満たすかどうかを評価して文中の特定文字列の使用誤
りを検出する誤り検出手段とを具備し、 使用誤りを犯し易い文字列が含まれる文章のみを対象に
形態素解析を実施し、文中の誤りを検出することを特徴
とする文書作成装置。
1. A sentence storage unit that stores a sentence, a sentence display unit that displays the sentence, a morphological analysis unit that divides the sentence into morphemes, and a specific character string that is prone to misuse is stored in advance. Specific character string storage means to be placed, character string detection means to detect the specific character string from the sentence, morpheme condition storage means to store conditions to be satisfied by each morpheme in the sentence including the specific character string, the specific character Equipped with an error detection means that evaluates whether the morphological analysis result of a sentence including a string satisfies the condition and detects an error in using a specific character string in the sentence, and only a sentence including a character string that is prone to use error A document creation device characterized by performing morphological analysis on a target and detecting an error in a sentence.
【請求項2】 文章を記憶する文章記憶手段と、 前記文章を表示する文章表示手段と、 前記文章を形態素に分割する形態素解析手段と、 前記形態素解析結果から文章構造を得る構文解析手段
と、 使用誤りを犯し易い特定の文字列を予め記憶しておく特
定文字列記憶手段と、 文中から前記特定文字列を検出する文字列検出手段と、 前記特定文字列を含む文章中の各形態素が満たすべき条
件を記憶する形態素条件記憶手段と、 前記特定文字列を含む文章の形態素解析結果がその条件
を満たすかどうかを評価して文中の特定文字列の使用誤
りを検出する誤り検出手段とを具備し、 使用誤りを犯し易い文字列が含まれる文章のみを対象に
形態素解析及び構文解析を施し、文中の誤りを検出する
ことを特徴とする文書作成装置。
2. A sentence storage unit that stores a sentence, a sentence display unit that displays the sentence, a morpheme analysis unit that divides the sentence into morphemes, and a syntactic analysis unit that obtains a sentence structure from the morpheme analysis result. Specific character string storage means for storing in advance a specific character string that is prone to misuse, character string detection means for detecting the specific character string in the sentence, and each morpheme in the sentence including the specific character string is satisfied A morpheme condition storage unit that stores a power condition; and an error detection unit that evaluates whether or not a morpheme analysis result of a sentence including the specific character string satisfies the condition and detects a usage error of the specific character string in the sentence. A document creation apparatus, which performs morphological analysis and syntactic analysis only on a sentence containing a character string that is prone to misuse, and detects an error in the sentence.
【請求項3】 文章を記憶する文章記憶手段と、 前記文章を表示する文章表示手段と、 形態素解析結果として必要とする情報種夫々を得る為の
複数の形態素解析手段と、 構文解析結果として必要とする情報種夫々を得る為の複
数の構文解析手段と、 使用誤りを犯し易い特定の文字列を予め記憶しておく特
定文字列記憶手段と、 文中から前記特定文字列を検出する特定文字列検出手段
と、 特定文字列及びそれを含む文章が満たすべき条件を記憶
する条件記憶手段と、 前記条件を満たすかどうかを評価するのに必要な情報種
を特定文字列と関連づけて記憶する情報種記憶手段と、 前記条件を満たすかどうかを評価して特定文字列の使用
誤りを検出する誤り検出手段とを具備し、 使用誤りを犯し易い文字列が含まれる文章のみを対象
に、必要最小限の形態素解析及び構文解析を施し文中の
誤りを検出することを特徴とする文書作成装置。
3. A sentence storage means for storing a sentence, a sentence display means for displaying the sentence, a plurality of morphological analysis means for obtaining each information type required as a morphological analysis result, and a syntactic analysis result. A plurality of parsing means for obtaining each information type, a specific character string storage means for pre-storing a specific character string that is likely to be misused, and a specific character string for detecting the specific character string in the sentence Detecting means, condition storing means for storing a specific character string and a condition to be satisfied by a sentence including the specific character string, and an information type for storing an information type necessary for evaluating whether or not the condition is satisfied in association with the specific character string A storage unit and an error detection unit that evaluates whether or not the above condition is satisfied to detect a usage error of a specific character string are provided. A document creation apparatus characterized by performing a small amount of morphological analysis and syntactic analysis to detect an error in a sentence.
【請求項4】 使用誤りを犯し易い特定の文字列を予め
記憶しておき、 この特定文字列を含む文章が満たすべき形態素の条件を
記憶しておき、 文中から前記特定文字列を検出し、 前記特定文字列を含む文章の形態素解析結果からその条
件を満たすかどうかを評価して文中の特定文字列の使用
誤りを検出し、 使用誤りを犯し易い文字列が含まれる文章のみを対象に
形態素解析を実施し、文中の誤りを検出することを特徴
とする文書作成方法。
4. A specific character string that is prone to misuse is stored in advance, a morpheme condition to be satisfied by a sentence including the specific character string is stored, and the specific character string is detected from the sentence, From the morphological analysis result of the sentence containing the specific character string, it is evaluated whether or not the condition is satisfied to detect the use error of the specific character string in the sentence, and the morpheme is applied only to the sentence containing the character string that is prone to the use error. A method of creating a document, characterized by performing an analysis and detecting an error in a sentence.
【請求項5】 使用誤りを犯し易い特定の文字列を予め
記憶しておき、 この特定文字列を含む文章が満たすべき形態素の条件を
記憶しておき、 文中から前記特定文字列を検出し、 前記特定文字列を含む文章の形態素解析結果からその条
件を満たすかどうかを評価して文中の特定文字列の使用
誤りを検出し、 使用誤りを犯し易い文字列が含まれる文章のみを対象に
形態素解析及び構文解析を施し、 文中の誤りを検出することを特徴とする文書作成方法。
5. A specific character string which is prone to misuse is stored in advance, a morpheme condition to be satisfied by a sentence including the specific character string is stored, and the specific character string is detected from the sentence, From the morphological analysis result of the sentence including the specific character string, it is evaluated whether or not the condition is satisfied to detect the use error of the specific character string in the sentence, and the morpheme is applied only to the sentence including the character string that is prone to the use error. A document creation method characterized by performing an analysis and a syntax analysis to detect an error in a sentence.
【請求項6】 形態素解析結果として必要とする情報種
夫々を得る為の複数の形態素解析方法を用意し、 構文解析結果として必要とする情報種夫々を得る為の複
数の構文解析方法を用意し、 使用誤りを犯し易い特定の文字列を予め記憶しておき、 文中からその特定文字列を検出し、 前記特定文字列及びそれを含む文章が満たすべき条件を
記憶しておき、 前記条件を満たすかどうかを評価するのに必要な構文解
析方法を選択して文章に施し、 その条件を満たすかどうかを評価して特定文字列の形態
素解析及び構文解析を施し、文中の誤りを検出すること
を特徴とする文書作成方法。
6. A plurality of morpheme analysis methods for obtaining each information type required as a morpheme analysis result, and a plurality of syntax analysis methods for obtaining each information type required as a syntactic analysis result are prepared. , A specific character string that is prone to misuse is stored in advance, the specific character string is detected from the sentence, and the condition that the specific character string and the sentence including it are to be satisfied is stored, and the condition is satisfied. Select the syntax analysis method necessary to evaluate whether or not it is applied to the sentence, evaluate whether the condition is satisfied, perform morphological analysis and syntax analysis of the specific character string, and detect the error in the sentence. Characteristic document creation method.
JP7223066A 1995-08-31 1995-08-31 Device and method for preparing document Pending JPH0969102A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7223066A JPH0969102A (en) 1995-08-31 1995-08-31 Device and method for preparing document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7223066A JPH0969102A (en) 1995-08-31 1995-08-31 Device and method for preparing document

Publications (1)

Publication Number Publication Date
JPH0969102A true JPH0969102A (en) 1997-03-11

Family

ID=16792303

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7223066A Pending JPH0969102A (en) 1995-08-31 1995-08-31 Device and method for preparing document

Country Status (1)

Country Link
JP (1) JPH0969102A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010182181A (en) * 2009-02-06 2010-08-19 Toshiba Solutions Corp Document processing device and program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010182181A (en) * 2009-02-06 2010-08-19 Toshiba Solutions Corp Document processing device and program

Similar Documents

Publication Publication Date Title
EP0971294A2 (en) Method and apparatus for automated search and retrieval processing
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
JP2002215617A (en) Method for attaching part of speech tag
JPH0969102A (en) Device and method for preparing document
JP2785692B2 (en) Dictionary search and display device
JP2000268034A (en) Automatic text pre-editing device, its method and storage medium to be used for it
JP5412137B2 (en) Machine learning apparatus and method
JPH0795323B2 (en) Natural language processor
JPH11282839A (en) Machine translation system and computer readable recording medium recording machine translation processing program
JP2982076B2 (en) Text processing apparatus and method
JPH09185629A (en) Machine translation method
JPH07219955A (en) Japanese sentence proofreading device
JPH08235177A (en) Information processor
JP2003256415A (en) Dictionary construction support method, system and program
JPH0673134B2 (en) Machine translation system
JPH09179865A (en) Machine translation device with deciding function for translation object area
JPH08129546A (en) Device and method for document preparation
JPH08320870A (en) User manual generating method
JPH05216922A (en) Dictionary editing device
JPH05225232A (en) Automatic text pre-editor
JPH08329107A (en) Document preparing device and its method
JPH05233619A (en) Method for correcting error of japanese language sentence and device therefor
JPH08263492A (en) Method and device for supporting document preparation
JPH1185751A (en) Translation device and medium storing translation device control program
JPH1185752A (en) Machine translation system