JPH0793330A - Document correcting device - Google Patents
Document correcting deviceInfo
- Publication number
- JPH0793330A JPH0793330A JP5240977A JP24097793A JPH0793330A JP H0793330 A JPH0793330 A JP H0793330A JP 5240977 A JP5240977 A JP 5240977A JP 24097793 A JP24097793 A JP 24097793A JP H0793330 A JPH0793330 A JP H0793330A
- Authority
- JP
- Japan
- Prior art keywords
- memory
- correction
- ambiguity
- word
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012937 correction Methods 0.000 claims abstract description 237
- 230000015654 memory Effects 0.000 claims abstract description 175
- 238000004458 analytical method Methods 0.000 claims abstract description 90
- 230000001915 proofreading effect Effects 0.000 claims description 42
- 230000003936 working memory Effects 0.000 claims description 24
- 238000001514 detection method Methods 0.000 abstract description 9
- 230000008030 elimination Effects 0.000 abstract 2
- 238000003379 elimination reaction Methods 0.000 abstract 2
- 238000000034 method Methods 0.000 description 28
- 238000010586 diagram Methods 0.000 description 26
- 239000004927 clay Substances 0.000 description 11
- 239000000470 constituent Substances 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 239000002689 soil Substances 0.000 description 4
- 235000016496 Panda oleosa Nutrition 0.000 description 2
- 240000000220 Panda oleosa Species 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 239000013256 coordination polymer Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000003205 fragrance Substances 0.000 description 1
- 239000002304 perfume Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
【0001】[0001]
【産業上の利用分野】本発明は、入力された日本語文章
について単語辞書を用いた文法解析に基づいて不適正箇
所(誤字・脱字、適切でない表現、わかりにくい表現な
ど)を訂正する文章訂正装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention is a sentence correction for correcting an incorrect portion (a typographical error / missing character, an inappropriate expression, an incomprehensible expression, etc.) based on a grammatical analysis using a word dictionary for an input Japanese sentence. Regarding the device.
【0002】[0002]
【従来技術】従来の文章訂正装置では、まず、入力され
た文章を単語辞書を用いて文法解析した結果に基づいて
不適正箇所を検出し、その不適正箇所に対してマークを
付与する。次に、その不適正箇所について、各々、訂正
候補を表示し、そのなかからユーザに所望のものを選択
させ、それに置き換えることで文章を訂正する。その種
の従来技術は、例えば、特開昭61ー208164号公
報「日本語文章校正装置の表示方式」などに記載されて
いる。2. Description of the Related Art In a conventional text correction device, an inappropriate portion is first detected based on a result of grammatical analysis of an input sentence using a word dictionary, and a mark is added to the inappropriate portion. Next, a correction candidate is displayed for each of the improper portions, the user selects a desired one from the candidates, and the sentence is corrected by replacing it. Such a conventional technique is described, for example, in Japanese Patent Laid-Open No. 61-208164, "Display system of Japanese proofreading device".
【0003】不適正箇所の認定方法は、主に、文法解析
で失敗した箇所を検出する方法(第一の方法)、文法解
析結果が特定の条件にマッチした箇所を検出する方法
(第二の方法)、単語辞書にあらかじめ不適正語を登録
しておき、文法解析結果において不適正語と認定された
箇所を検出する方法(第三の方法)などがある。このう
ち、第三の方法では、単語辞書に不適正語の訂正方法も
登録しておくことで、単に不適正箇所を検出するだけで
なく、訂正も可能となり、従来の文章訂正装置において
採用されている。The method of recognizing an improper portion is mainly a method of detecting a portion that fails in grammar analysis (first method) and a method of detecting a portion whose grammar analysis result matches a specific condition (second method). Method), and a method of registering an incorrect word in a word dictionary in advance and detecting a portion recognized as an incorrect word in a grammar analysis result (third method). Of these, the third method is to register an incorrect word correction method in the word dictionary so that not only the incorrect part can be detected but also the correction can be made. ing.
【0004】図5は、従来の文章訂正装置の構成例を示
すブロック図である。FIG. 5 is a block diagram showing an example of the configuration of a conventional text correction device.
【0005】従来の文章訂正装置は、文章入力手段1、
入力文章メモリ2、文法解析手段3、校正情報付き単語
辞書メモリ4、解析結果メモリ5、逐次訂正手段6、候
補選択指示入力手段7、作業メモリ11、訂正後文章メ
モリ17、訂正候補情報メモリ18、表示制御手段2
1、表示手段22から成る。The conventional text correction device has a text input means 1,
Input sentence memory 2, grammar analysis unit 3, proofreading word dictionary memory 4, analysis result memory 5, sequential correction unit 6, candidate selection instruction input unit 7, working memory 11, corrected sentence memory 17, correction candidate information memory 18 , Display control means 2
1. The display means 22.
【0006】文章入力手段1は、ユーザが入力する文章
を読込み、入力文章をその位置情報などとともに入力文
章メモリ2に記憶する。文法解析手段3は、校正情報付
き単語辞書メモリ4を参照して途中結果を作業メモリ1
1に一時的に格納しながら文法解析を行い、解析結果を
解析結果メモリ5に記憶する。校正情報付き単語辞書メ
モリ4は、通常の文法解析を行うための単語辞書に訂正
の対象となる語(不適正語)やその訂正候補などの校正
情報を加えたものである。逐次訂正手段6は、校正情報
付き単語辞書メモリ4と解析結果メモリ5を参照して入
力文章の不適正箇所に対する訂正候補を検索し、その不
適正箇所に対する訂正候補の情報を訂正候補情報メモリ
18に書き込むことによって表示手段22に表示させ、
候補選択指示入力手段7からの候補選択指示にしたがっ
て、入力文章の訂正を逐次訂正する。その結果の訂正さ
れた文章は訂正後文章メモリ17が記憶する。表示制御
手段21は、訂正後文章メモリ17や訂正候補情報メモ
リ18の内容にしたがって、表示手段22を制御し、入
力文章の表示、不適正箇所や訂正箇所に対するマークの
付与、訂正候補の表示などを行う。The text input means 1 reads a text input by the user and stores the input text in the input text memory 2 together with its position information and the like. The grammar analyzing unit 3 refers to the proofreading word dictionary memory 4 and stores the intermediate result as the working memory 1.
The grammatical analysis is performed while temporarily storing in 1 and the analysis result is stored in the analysis result memory 5. The proofreading word dictionary memory 4 is a word dictionary for performing a normal grammatical analysis, in which proofreading information such as words to be corrected (inappropriate words) and correction candidates thereof is added. The sequential correction means 6 refers to the word dictionary memory 4 with proofreading information and the analysis result memory 5 to search for a correction candidate for the incorrect portion of the input sentence, and to obtain the information of the correction candidate for the incorrect portion, the correction candidate information memory 18. To display on the display means 22 by writing
According to the candidate selection instruction from the candidate selection instruction input means 7, the correction of the input sentence is sequentially corrected. The corrected sentence resulting therefrom is stored in the corrected sentence memory 17. The display control means 21 controls the display means 22 in accordance with the contents of the corrected sentence memory 17 and the correction candidate information memory 18 to display the input sentence, add marks to the improper portion and the corrected portion, display the correction candidate, etc. I do.
【0007】文章入力手段1には、キーボード、マウ
ス、文字認識装置、かな漢字変換入力装置など、候補選
択指示入力手段7には、キーボード、マウスなどが用い
られる。入力文章メモリ2、校正情報付き単語辞書メモ
リ4、解析結果メモリ5、作業メモリ11、訂正後文章
メモリ17、訂正候補情報メモリ18には、ICメモ
リ、磁気ディスク装置、磁気テープ装置などが用いられ
る。文法解析手段3、逐次訂正手段6、表示制御手段2
1には、コンピュータのCPUなどが用いられる。文章
表示手段22には、CRTディスプレイなどが用いられ
る。A keyboard, a mouse, a character recognition device, a kana-kanji conversion input device, etc. are used for the sentence input means 1, and a keyboard, a mouse, etc. are used for the candidate selection instruction input means 7. An IC memory, a magnetic disk device, a magnetic tape device or the like is used for the input sentence memory 2, the proofreading word dictionary memory 4, the analysis result memory 5, the working memory 11, the corrected sentence memory 17, and the correction candidate information memory 18. . Grammar analysis means 3, sequential correction means 6, display control means 2
1 is a CPU of a computer or the like. A CRT display or the like is used as the text display unit 22.
【0008】すなわち、従来の訂正候補装置は、不適正
箇所を指摘し、その箇所に対して訂正候補を示してユー
ザに選択させる(あるいは、その箇所をユーザに直接訂
正させる)ことによって、逐次的に、文章を適正なもの
に訂正してゆくものであった。さらに、ユーザが訂正に
要する操作回数を減らして効率を高めるために、次のよ
うな従来技術も考案されている。That is, the conventional correction candidate device sequentially points out an unsuitable portion, shows a correction candidate for the portion, and allows the user to select it (or let the user directly correct the portion). Then, the text was corrected to a proper one. Further, the following conventional techniques have been devised in order to reduce the number of operations required for correction by the user and improve efficiency.
【0009】その一つは、特開平2ー140861号公
報「文章作成装置」に記載されているもので、検出した
個々の不適正箇所について、一つ一つ訂正候補を確認す
る操作を省き、キー押下一つで修正できるというもので
ある。もう一つは、特開平3ー240160号公報「文
字列置換方法」に記載されているもので、ある箇所につ
いて訂正候補への置換を行った場合、それ以降に出現す
るその箇所と同様の不適正箇所は、一括して置換してし
まうというものである。One of them is described in Japanese Unexamined Patent Publication No. Hei 2-140861 "Sentence Making Device", which omits the operation of checking correction candidates one by one for each detected improper portion, It can be corrected with a single key press. The other is described in Japanese Patent Laid-Open No. 3-240160, “Character string replacement method”, and when a certain portion is replaced with a correction candidate, the same error as that portion appearing after that is generated. Appropriate locations are to be replaced all at once.
【0010】また、文章訂正装置に採用されているわけ
ではないが、一般の文章編集装置において、文字列Aを
文字列Bに一括置換してしまい、その置換が不適切だっ
た箇所については、後から、元の文字列Aに戻せるよう
にしておくことも考えられている(例えば、特開平3ー
233669号公報「文書作成装置」に記載されてい
る)。この方法によれば、置換が不適切で元に戻さなく
てはならない箇所が少なければ、全体として訂正に要す
る操作回数は少なくなる。Although not used in the text correction device, in a general text editing device, the character string A is replaced by the character string B all at once, and the replacement is improper. It is also considered that the character string A can be returned to the original character string later (for example, it is described in Japanese Patent Laid-Open No. 233669/1993, “Document Creation Device”). According to this method, the number of operations required for correction is reduced as a whole if the replacement is inappropriate and there are few places that must be restored.
【0011】[0011]
【発明が解決しようとする課題】最初に述べたような従
来の文章訂正装置では、検出された不適正の可能性が高
い箇所の各々について、訂正候補を確認し、その中から
適切なものを選択して置き換える操作が、逐次的に必要
になる。それに対して、従来も操作回数を削減する工夫
が検討されているが、最も大きな効果があると考えられ
るのは、従来技術の項の最後に述べたような一括置換
を、文章訂正装置においても実現することである。すな
わち、訂正候補(特に第一候補)が適切な訂正結果であ
ることが多いならば、先に一括して自動的に訂正してし
まって、その訂正が適切でなかったときに元に戻す操作
を行うようにした方が、全体としての操作回数は減って
作業効率が高くなる可能性がある。In the conventional sentence correction device as described above, the correction candidate is confirmed for each of the detected high possibility of improperness, and the appropriate one is selected. The operations of selecting and replacing are sequentially required. On the other hand, although measures for reducing the number of operations have been studied in the past, the most significant effect is that the batch replacement as described at the end of the section of the related art is also performed in the text correction device. It is to be realized. That is, if the correction candidate (especially the first candidate) is often an appropriate correction result, it is automatically corrected in a batch first, and when the correction is not appropriate, the operation to restore By doing so, the number of operations as a whole may be reduced and the work efficiency may be improved.
【0012】しかし、不適正箇所である可能性が低い箇
所を訂正してしまったり、不確実な訂正候補へ置き換え
てしまったりすることが多いと、逆に元に戻す操作が多
くなって効率は上がらない。したがって、不適正である
ことが確実で、かつ、その訂正方法が確実な箇所に絞っ
て、自動訂正を行うのが好ましい。However, if a portion that is unlikely to be an inappropriate portion is corrected or replaced with an uncertain correction candidate in many cases, the number of operations to be undone is increased and the efficiency is reduced. I can't go up. Therefore, it is preferable to perform automatic correction by focusing on a portion that is surely incorrect and the correction method is reliable.
【0013】一方、自動訂正を行わなかった箇所は、従
来の文章訂正装置と同様に、逐次的に確認しながら訂正
してゆくことになる。その際、不適正箇所として検出し
た箇所に不確実性があるならば、それがわかるようにユ
ーザに提示するのが好ましい。On the other hand, a portion where automatic correction has not been performed will be sequentially checked and corrected in the same manner as in a conventional text correction device. At that time, if there is uncertainty in the location detected as an inappropriate location, it is preferable to present it to the user so that it can be known.
【0014】上記のような不確実性を発生させる要因と
して、文法解析の曖昧性がある。例えば、同形だが読み
の違いにより、文法解析において複数通りの解釈が可能
な場合に、不適正箇所の検出や訂正方法に不確実性が生
じる。具体的には、「焼土」という単語について、「や
けつち」という読みと「しょうど」という読みの2通り
の解釈があり得たとする。このとき、「やけつち」のと
いう解釈ならば、送りがな不適正語と認定され、「焼け
土」への訂正が正しい。一方、「しょうど」という解釈
ならば、誤用語と認定され、「焦土」への訂正が正し
い。Ambiguity in grammar analysis is a factor that causes the above-mentioned uncertainty. For example, when the grammar analysis can be interpreted in a plurality of ways due to different isomorphisms but different readings, uncertainty arises in the method of detecting and correcting the improper portion. Specifically, suppose there are two possible interpretations of the word "burnt clay", "yaketsuchi" and "shodo." At this time, if it is interpreted as "yaketsuchi", it is recognized as an unsuitable word and the correction to "burnt soil" is correct. On the other hand, if it is interpreted as “shodo”, it is recognized as an incorrect term and the correction to “scorch” is correct.
【0015】このような場合、深い意味や文脈を理解し
た処理により、適切な解釈が可能になる場合もあるが、
従来の文法解析技術では、そのような処理は実用的なレ
ベルには達していない。しかも、ときには、人間が解釈
しても解釈に曖昧性が生ずる場合(複数通りの解釈が可
能な場合)がある。このような場合について、従来の文
章訂正装置では、適切な解釈を行うのに十分な情報がな
くとも強引に、一方の解釈を選択してしまう。その結
果、誤った解釈をとってしまうことも少なくなく、検出
洩れを生じさせたり、文章訂正装置(あるいは文章の不
適正箇所検出装置)に対するユーザの信頼感を失わせる
ことになっていた。In such a case, an appropriate interpretation may be possible by a process that understands a deep meaning or context.
With conventional grammar analysis techniques, such processing has not reached a practical level. In addition, sometimes, even when a human interprets the ambiguity, the interpretation may be ambiguous (when multiple interpretations are possible). In such a case, the conventional text correction device forcibly selects one of the interpretations even if there is not enough information for performing an appropriate interpretation. As a result, it is not uncommon for an incorrect interpretation to be taken, resulting in omission of detection and loss of the user's confidence in the text correction device (or the text improper portion detection device).
【0016】そこで、本発明は、以上のような従来の文
章訂正装置の欠点を除去し、文法解析によって不適正語
と認定された箇所を一括して自動訂正する際に、不確実
な訂正を行わないことで、訂正作業の効率を向上させ、
さらに、逐次的な訂正を行う際に、文法解析における曖
昧性を考慮した表示を行うことによって、検出洩れが少
なく、しかも、ユーザが理解しやすい文章訂正を実現で
きる文章訂正装置を提供することを目的とする。Therefore, the present invention eliminates the above-mentioned drawbacks of the conventional sentence correction device, and makes an uncertain correction when collectively correcting the portions recognized as inappropriate words by grammar analysis. By not performing it, the efficiency of correction work is improved,
Further, by providing a display in consideration of ambiguity in grammatical analysis when performing sequential correction, it is possible to provide a sentence correction device that is capable of realizing sentence correction that is less likely to be missed and is easy for the user to understand. To aim.
【0017】[0017]
【課題を解決するための手段】本発明では、上記の目的
を達成するために、次のような2種類の文章訂正装置を
提供する。SUMMARY OF THE INVENTION In order to achieve the above object, the present invention provides the following two types of sentence correction devices.
【0018】第一の発明の文章訂正装置は、入力された
文章を記憶する入力文章メモリと、不適正語を含み不適
正語の種別や訂正候補などの校正情報を持つ単語辞書を
記憶する校正情報付き単語辞書メモリと、前記校正情報
付き単語辞書メモリを参照して前記入力された文章の文
法解析を行い不適正語を認定する文法解析手段と、前記
入力された文章について前記文法解析の結果を記憶する
解析結果メモリと、前記文法解析の途中結果を一時格納
する作業メモリと、前記作業メモリを参照して前記入力
された文章の前記文法解析における曖昧性を判定する曖
昧性判定手段と、前記曖昧性判定手段の判定結果を記憶
する判定結果メモリと、自動訂正の対象箇所の満たすべ
き条件を記憶した訂正条件メモリと、前記解析結果メモ
リと前記判定結果メモリを参照して前記訂正条件メモリ
の条件に該当する箇所を検出する訂正対象箇所判定手段
と、前記訂正対象箇所判定手段の検出箇所を記憶する訂
正対象箇所メモリと、前記校正情報付き辞書メモリを参
照して前記入力された文章を前記訂正対象箇所メモリに
格納された箇所について自動訂正を行う自動訂正手段と
を備えることを特徴とする。The sentence correction device according to the first aspect of the present invention is an proofreading memory for storing an input sentence memory for storing an inputted sentence and a word dictionary having proofreading information such as an incorrect word type and a correction candidate. A word dictionary memory with information, a grammar analysis unit for recognizing an incorrect word by performing a grammatical analysis of the input sentence with reference to the proofreading word dictionary memory, and a result of the grammar analysis of the input sentence. An analysis result memory that stores, a working memory that temporarily stores an intermediate result of the grammar analysis, an ambiguity determination unit that determines ambiguity in the grammar analysis of the input sentence with reference to the working memory, A determination result memory that stores the determination result of the ambiguity determination unit, a correction condition memory that stores the condition to be satisfied by the automatic correction target portion, the analysis result memory, and the determination result A correction target location determining means for detecting a location corresponding to the condition of the correction condition memory with reference to a memory, a correction target location memory for storing the location detected by the correction target location determining means, and the calibration information-equipped dictionary memory. An automatic correction unit is provided for referring to the input sentence and automatically correcting the portion stored in the correction target portion memory.
【0019】第二の発明の文章訂正装置は、入力された
文章を記憶する入力文章メモリと、不適正語を含み不適
正語の種別や訂正候補などの校正情報を持つ単語辞書を
記憶する校正情報付き単語辞書メモリと、前記校正情報
付き単語辞書メモリを参照して前記入力された文章の文
法解析を行い不適正語を認定する文法解析手段と、前記
入力された文章について前記文法解析の結果を記憶する
解析結果メモリと、前記文法解析の途中結果を一時格納
する作業メモリと、前記作業メモリを参照して前記入力
された文章の前記文法解析における曖昧性を判定する曖
昧性判定手段と、前記曖昧性判定手段の判定結果を記憶
する判定結果メモリと、不適正語の認定に関する曖昧性
を解消するための指示を入力する曖昧解消指示入力手段
と、前記判定結果メモリを参照して前記入力された文章
における不適正語の認定が曖昧な箇所を検出し前記曖昧
解消指示入力手段からの指示によって該箇所の曖昧性を
解消する曖昧箇所決定手段と、不適正箇所に関する訂正
候補の選択指示を入力する候補選択指示入力手段と、前
記曖昧箇所決定手段の決定と前記解析結果メモリを参照
して前記入力された文章における不適正箇所を検出し該
不適正箇所に関する訂正候補を前記校正情報付き単語辞
書メモリから検索し前記候補選択指示入力手段から指示
された訂正候補に該不適正箇所を置き換える逐次訂正手
段とを備えることを特徴とする。The sentence correction device of the second invention is a proofreading device for storing an input sentence memory for storing an inputted sentence and a word dictionary having proofreading information such as types of incorrect words and correction candidates such as correction candidates. A word dictionary memory with information, a grammar analysis unit for recognizing an incorrect word by performing a grammatical analysis of the input sentence with reference to the proofreading word dictionary memory, and a result of the grammar analysis of the input sentence. An analysis result memory that stores, a working memory that temporarily stores an intermediate result of the grammar analysis, an ambiguity determination unit that determines ambiguity in the grammar analysis of the input sentence with reference to the working memory, A determination result memory that stores the determination result of the ambiguity determination unit, an ambiguity resolution instruction input unit that inputs an instruction to eliminate the ambiguity regarding the recognition of an inappropriate word, and the determination result An ambiguity point determining means for detecting an ambiguity part of the incorrect word in the input sentence with reference to the memory and eliminating the ambiguity of the part by an instruction from the ambiguity resolution instruction input means, and an improper part Candidate selection instruction input means for inputting a correction candidate selection instruction regarding the correction candidate, and the determination of the ambiguous portion determination means and the analysis result memory to detect an inappropriate portion in the input sentence and correct the incorrect portion. It is characterized by further comprising: sequential correction means for retrieving a candidate from the proofreading word dictionary memory and replacing the inadequate portion with a correction candidate designated by the candidate selection designation input means.
【0020】[0020]
【作用】本発明では、まず、文法解析によって不適正語
と認定された箇所を一括して自動訂正する際に、不確実
な訂正を行わないことで、訂正作業の効率を向上させ
る。不確実な訂正であるかの判定は、主に、文法解析過
程で、ある種の曖昧性が発生していないかを調べる。例
えば、「焼土」が「やけつち」とも「しょうど」とも解
釈できるような場合、その箇所を自動訂正の対象から外
すような判断が可能となる。According to the present invention, first, when the parts that have been identified as incorrect words by the grammar analysis are automatically corrected collectively, uncertain correction is not performed, thereby improving the efficiency of the correction work. The determination as to whether or not the correction is an uncertain correction is performed mainly by checking whether some kind of ambiguity has occurred in the grammar analysis process. For example, when "burnt clay" can be interpreted as "yaketsuchi" or "shodo", it is possible to judge that part is excluded from the target of automatic correction.
【0021】次に、不適正箇所として検出された箇所に
ついて、訂正候補を表示してユーザに選択させるような
逐次的な訂正の際に、文法解析における曖昧性を考慮し
た表示を行うことによって、検出洩れが少なく、しか
も、ユーザが理解しやすい文章訂正を実現する。文法解
析における曖昧性を考慮した表示というのは、例えば、
上記の「焼土」の場合、いったん不適正語として検出し
て、色マークなどを付与した上で、その部分の訂正候補
を表示するときに、「やけつち」という解釈と「しょう
ど」という解釈(読み方)の2通りがあることを、ユー
ザにわかるように表示する。いずれかの解釈をユーザに
選択させた上で、それに対応する訂正候補を示す。すな
わち、ユーザが「やけつち」の方を選べば「焼け土」と
いう訂正候補を示し、「しょうど」の方を選べば「焦
土」という訂正候補を示す。このような場合、一方の解
釈を強引に選択して訂正候補を提示してしまうと、ユー
ザは意に反する訂正を促されることになって、文章訂正
装置に対する信頼感を失わせることになってしまうが、
上記のような表示方法をとることで、ユーザの自然な理
解を得ることが可能となる。Next, regarding the location detected as an inappropriate location, a correction candidate is displayed and the display is performed in consideration of the ambiguity in the grammatical analysis when performing sequential correction such that the user can select it. It realizes a sentence correction that is easy to understand by the user with few omissions. The display considering ambiguity in grammar analysis is, for example,
In the case of the above-mentioned "burnt clay", once it is detected as an incorrect word, a color mark etc. is added, and when the correction candidate for that part is displayed, it is interpreted as "Yaketsuchi" and "Shodo". It is displayed so that the user can understand that there are two ways of interpretation (reading). After allowing the user to select one of the interpretations, the correction candidate corresponding to it is shown. That is, if the user selects “Yaketsuchi”, the correction candidate “burnt soil” is displayed, and if the user selects “Shodo”, the correction candidate “scorched soil” is displayed. In such a case, if one of the interpretations is forcibly selected and the correction candidate is presented, the user will be prompted to make an unintended correction, and the confidence of the text correction device will be lost. But
By adopting the display method as described above, it is possible to obtain a natural understanding of the user.
【0022】また、上記の例では、2通りの不適正語と
解釈できる場合の説明をしたが、適正語と不適正語の2
通りの解釈が可能な場合もある。例えば、「香車」が
「きょうしゃ」あるいは「きゃしゃ」と解釈できるとき
がある。「きょうしゃ」と解釈すれば、適正語で訂正の
必要はない。一方、「きゃしゃ」と解釈すると、正しく
は「華奢」なので訂正する必要がある。この場合、強引
に適正語の「きょうしゃ」の解釈をとると、もし「きゃ
しゃ」のつもりで書かれたものであれば検出洩れが発生
することになる。逆に、不適正語の「きゃしゃ」と解釈
を常に優先すると、不適正語の検出洩れは避けられる
が、ユーザに不自然な印象を強く与えることになる。こ
のような場合についても、本発明では、検出洩れを避
け、かつ、ユーザに自然な理解を与えることが可能とな
る。Further, in the above example, the case where the word can be interpreted as two incorrect words is explained.
In some cases, the street interpretation is possible. For example, there is a case where "scent wheel" can be interpreted as "kyosha" or "kyasha". If you interpret it as "Kyosha," there is no need to correct it with proper words. On the other hand, when it is interpreted as "Kyasha", it is "delicate" and must be corrected. In this case, forcibly interpreting the proper word "Kyosha" would result in omission of detection if it was written as "Kyasha". On the other hand, if priority is always given to the interpretation of the inappropriate word as “chasha”, the missed detection of the incorrect word can be avoided, but the user is strongly given an unnatural impression. Even in such a case, according to the present invention, it is possible to avoid omission of detection and give the user a natural understanding.
【0023】[0023]
【実施例】図1は、本発明の文章訂正装置の第一の実施
例の構成を示すブロック図である。以下、各構成要素を
説明する。DESCRIPTION OF THE PREFERRED EMBODIMENTS FIG. 1 is a block diagram showing the configuration of a first embodiment of a text correction device according to the present invention. Hereinafter, each component will be described.
【0024】文章入力手段1は、日本語文章の漢字かな
混じり文字列を入力する手段である。標準キーボードを
用いたかな漢字変換装置、全文字配列キーボード、文字
認識装置、音声認識装置などが用いられる。あるいは、
ワードプロセッサなどで作成した文章ファイルを読み込
むための、磁気ディスク装置や磁気テープ装置などを用
いてもよい。The sentence input means 1 is a means for inputting a character string containing kanji and kana of a Japanese sentence. A kana-kanji conversion device using a standard keyboard, an all-character arrangement keyboard, a character recognition device, a voice recognition device, etc. are used. Alternatively,
A magnetic disk device or a magnetic tape device for reading a text file created by a word processor or the like may be used.
【0025】入力文章メモリ2は、文章入力手段1によ
って入力された文章を記憶する。ICメモリ、磁気ディ
スク装置、磁気テープ装置などが用いられる。The input text memory 2 stores the text input by the text input means 1. An IC memory, a magnetic disk device, a magnetic tape device or the like is used.
【0026】校正情報付き単語辞書メモリ4は、不適正
語を含み不適正語の種別や訂正候補などの校正情報を持
つ単語辞書を記憶する。ICメモリ、磁気ディスク装
置、磁気テープ装置などが用いられる。図7に、校正情
報付き単語辞書メモリの内容の例を示す。図7の単語辞
書では、各単語に対して、表記700、品詞701、読
み702、校正用属性703、訂正候補704が登録さ
れている。そのうち、通常の文法解析に用いる単語辞書
でも一般に登録されているのは、表記700、品詞70
1、読み702の項目である。図7の校正情報付き単語
辞書メモリ4では、それらの項目に加えて、校正用属性
703や訂正候補704などの項目が追加されている。
また、通常の単語(適正語)だけでなく、訂正の対象と
なる語(不適正語)も登録されている。The proofreading word dictionary memory 4 stores a word dictionary having proofreading information including an incorrect word type, an incorrect word type, a correction candidate, and the like. An IC memory, a magnetic disk device, a magnetic tape device or the like is used. FIG. 7 shows an example of the contents of the word dictionary memory with proofreading information. In the word dictionary of FIG. 7, a notation 700, a part of speech 701, a reading 702, a proofreading attribute 703, and a correction candidate 704 are registered for each word. Of these, notations 700 and parts-of-speech 70 are commonly registered in word dictionaries used for normal grammar analysis.
The first item is the reading 702 item. In the proofreading word dictionary memory 4 of FIG. 7, in addition to these items, items such as a proofreading attribute 703 and a correction candidate 704 are added.
Further, not only ordinary words (appropriate words) but also words to be corrected (inappropriate words) are registered.
【0027】図7の例では、「完璧」「焦土」「焼け
土」などが適正語であり、「完壁」「焼土」などが不適
正語である。不適正語については、校正用属性703と
して、誤用語、送りがな不適正語などといった不適正種
別が付与されている。不適正種別としては、誤用語、送
りがな不適正語の以外にも、書き換え推奨語、かな書き
推奨語、同音類語、禁止語など、文章訂正装置の対象分
野や用途に応じて、様々な定義が可能である(本発明で
は、不適正種別について、特に限定はしない)。また、
不適正語については、訂正候補704も付与されてい
る。訂正候補が複数考えられる場合には、複数個を登録
しておいてよい。逆に、不適正語であっても、訂正候補
は決められないなどの理由により、訂正候補が登録され
ていないこともあり得る。本明細書では、通常の単語辞
書には登録されていなかった部分、すなわち、不適正
語、および、それらの不適正種別や訂正候補などを、ま
とめて校正情報と呼ぶ。なお、図7では、校正情報付き
単語辞書が1ファイルとして構成されているような形態
の例を示したが、本発明では、校正情報付き単語辞書の
構造を、図7の形態に限定するものではない。検索キー
となる表記の部分をインデックスファイルとして分離し
たり、訂正候補の部分や校正情報全体を別ファイルに分
けたりするなど、複数ファイルとして構成することも可
能である。In the example of FIG. 7, "perfect", "scorched earth", "burnt earth" and the like are proper words, and "complete wall" and "burnt earth" are inappropriate words. As for the inappropriate word, an incorrect type such as an incorrect word or an unsuitable word is given as the proofreading attribute 703. In addition to incorrect words and incorrect words that can not be sent, there are various definitions of incorrect categories, such as recommended rewriting words, recommended kana writing words, synonyms, and prohibited words, depending on the target field and application of the text correction device. It is possible (in the present invention, the improper type is not particularly limited). Also,
Correction candidates 704 are also attached to the inappropriate words. When a plurality of correction candidates are considered, a plurality of correction candidates may be registered. On the contrary, even if the word is an incorrect word, the correction candidate may not be registered because the correction candidate cannot be determined. In the present specification, a portion that is not registered in a normal word dictionary, that is, an inappropriate word, and the inappropriate type and correction candidate thereof are collectively referred to as proofreading information. Although FIG. 7 shows an example in which the proofreading information added word dictionary is configured as one file, the present invention limits the structure of the proofreading information added word dictionary to the form shown in FIG. 7. is not. It is also possible to form a plurality of files, such as separating the part of the notation that serves as the search key as an index file, or separating the part of the correction candidates and the entire calibration information into separate files.
【0028】文法解析手段3は、校正情報付き単語辞書
メモリ4を参照して、入力文章メモリに格納された文章
の文法解析を行い、その文章中の不適正語を認定する。
コンピュータのCPUなどが用いられる。図17は、文
法解析手段3の実現例を示すフローチャートである。図
17では、まずステップ170で、単語辞書を検索し、
入力された文章の部分文字列に一致する単語の候補を抽
出する。次にステップ171では、ステップ170で検
索された単語について、文法的な制約を満たすような組
み合わせを形成する。最後に、組み合わせが複数通り形
成された場合は、ステップ172において、最も確から
しいものを選択する。最も確からしいものを選択する方
法は、意味的な制約を利用する方法や、文節数が最小の
組み合わせが最も確からしいといったヒューリスティッ
クスを利用する方法など、様々な方法が考案されてい
る。その詳細は、例えば、『国語辞書の記憶と日本語文
の自動分割』(長尾・他、「情報処理」第19巻第6
号、1978)、『日本文音声出力のための言語処理方
式』(宮崎・大山、「情報処理学会論文誌」第27巻第
11号、1986)、『文節数最小法を用いたべた書き
日本語文の形態素解析』(吉村・他、「情報処理学会論
文誌」第24巻第1号、1983)、『接続コスト最小
法による形態素解析の提案と計算量評価について』(久
光・新田、「電子情報通信学会研究報告」NLC90−
8、1990)などに記載されている。The grammar analyzing means 3 refers to the proofreading word dictionary memory 4 to perform grammatical analysis of the sentence stored in the input sentence memory, and recognizes an inappropriate word in the sentence.
A CPU or the like of a computer is used. FIG. 17 is a flowchart showing an example of implementation of the grammar analysis means 3. In FIG. 17, first, in step 170, the word dictionary is searched,
The word candidates that match the partial character strings of the input sentence are extracted. Next, in step 171, combinations of the words retrieved in step 170 that satisfy grammatical constraints are formed. Finally, when a plurality of combinations are formed, in step 172, the most probable one is selected. Various methods have been devised as methods for selecting the most probable ones, such as a method using a semantic constraint and a method using heuristics that a combination with the smallest number of clauses is most likely. For details, see “Memory of Japanese language dictionary and automatic division of Japanese sentence” (Nagao et al., “Information Processing”, Vol. 19, No. 6).
No. 1978), "Language Processing Method for Japanese Sentence Output" (Miyazaki / Oyama, "IPSJ Transactions", Vol. 27, No. 11, 1986), "Solid writing using minimum phrase number method Japan. Morphological Analysis of Words "(Yoshimura et al.," Information Processing Society of Japan ", Vol. 24, No. 1, 1983)," On Proposal of Morphological Analysis by Minimum Connection Cost Method and Evaluation of Complexity "(Hisami &Nitta," IEICE research report "NLC90-
8, 1990) and the like.
【0029】本発明の文法解析手段3では、上記の文献
に記載されているような通常の文法解析手段と異なり、
単語辞書に校正情報を付与している。それによって、図
17で述べたような処理手順に変更は生じないが、ステ
ップ170で単語辞書から校正情報のうちの必要な項目
を読み出し、解析結果において不適正語に関する情報が
得られる点が異なる。そのような、校正情報付き単語辞
書を参照して行う文法解析の詳細は、『専用ハードウェ
アを用いた高速な校閲支援システムの提案』(竹元・
他、情報処理学会第43回全国大会論文集、1991)
や『日本語文書校正支援システムSt.WORDS』
(福島・他、情報処理学会第45回全国大会論文集、1
992)などに記載されている。The grammar analyzing means 3 of the present invention differs from the usual grammar analyzing means as described in the above-mentioned document.
Proofreading information is added to the word dictionary. This does not change the processing procedure as described with reference to FIG. 17, but differs in that necessary items of the proofreading information are read from the word dictionary in step 170, and information about the incorrect word is obtained in the analysis result. . For details of such grammar analysis performed by referring to a word dictionary with proofreading information, refer to "Proposal of a high-speed editing support system using dedicated hardware" (Takemoto
IPSJ 43rd National Convention Proceedings, 1991)
And "Japanese document proofreading support system St. "WORDS"
(Fukushima et al., Proc. Of the 45th National Convention of IPSJ, 1
992) and the like.
【0030】作業メモリ11は、文法解析手段3による
文法解析の途中結果を一時格納する。ICメモリ、磁気
ディスク装置、磁気テープ装置などが用いられる。図8
に作業メモリ11の内容の例を示す。図8に示した内容
は、「戦争で私の故郷は完壁に焼土になった。」という
例文に対する文法解析の、候補選択ステップ172の直
前(接続検定ステップ171の直後)の状態を表してい
る。入力文章中の各文字列がどのような品詞・読みとし
て解釈され得るかが表現されており、不適正語について
は、その不適正種別や訂正候補の情報も単語辞書から読
み出されて格納されている。The working memory 11 temporarily stores the intermediate result of the grammar analysis by the grammar analysis means 3. An IC memory, a magnetic disk device, a magnetic tape device or the like is used. Figure 8
An example of the contents of the working memory 11 is shown in FIG. The content shown in FIG. 8 represents the state immediately before the candidate selection step 172 (immediately after the connection verification step 171) in the grammar analysis for the example sentence "My hometown was completely burned in the war." ing. It expresses what part of speech / reading each character string in the input sentence can be interpreted as.In regard to the incorrect word, the incorrect type and correction candidate information are also read from the word dictionary and stored. ing.
【0031】解析結果メモリ5は、入力文章メモリ2に
格納された文章に対する、文法解析手段3による文法解
析の結果を記憶する。図9に解析結果メモリ5の内容の
例を示す。図9に示した内容は、「戦争で私の故郷は完
壁に焼土になった。」という例文に対する文法解析の結
果であり、図8の作業メモリ11の状態からさらに候補
選択が行われて、解釈が一意に決定されている。曖昧性
判定手段12は、作業メモリ11を参照して、入力文章
メモリに格納された文章に関する、文法解析手段3の文
法解析における曖昧性を判定する。コンピュータのCP
Uなどが用いられる。図18に曖昧性判定手段12の実
現例のフローチャートを示す。図18のフローチャート
では、文法解析の候補選択ステップの直前の作業メモリ
11の内容について、単語辞書から読み出された不適正
語種別に着目し、不適正語が他の単語候補と重複する区
間に出現する場合を検出し、その部分の解析情報を判定
結果メモリ13に書き込んでいる。不適正語に着目して
いるのは、訂正対象箇所になるのは不適正語の部分だけ
だから、余計な情報は格納しないようにしていたためで
ある。しかし、そのような節約は、この手段の実現に必
須のものではなく、後述する訂正条件メモリ19に記述
する条件のタイプに応じて、様々な実現方法があり得
る。例えば、複数通りの解釈があり得る箇所はすべて検
出するとか、同形語をもつ部分のみを検出するなどの実
現方法もある。The analysis result memory 5 stores the result of the grammar analysis by the grammar analysis means 3 for the sentence stored in the input sentence memory 2. FIG. 9 shows an example of the contents of the analysis result memory 5. The content shown in FIG. 9 is the result of the grammar analysis for the example sentence “My hometown was completely burned in the war.” The candidates are further selected from the state of the working memory 11 in FIG. The interpretation is uniquely determined. The ambiguity determination unit 12 refers to the work memory 11 and determines the ambiguity in the grammar analysis of the grammar analysis unit 3 regarding the sentence stored in the input sentence memory. Computer CP
U or the like is used. FIG. 18 shows a flowchart of an example of implementation of the ambiguity determination means 12. In the flowchart of FIG. 18, regarding the content of the working memory 11 immediately before the candidate selection step of grammar analysis, paying attention to the inappropriate word type read from the word dictionary, and the incorrect word overlaps with other word candidates. When it appears, the analysis information of that portion is written in the determination result memory 13. The reason for paying attention to the incorrect word is that only the incorrect word portion is to be corrected, so that unnecessary information is not stored. However, such saving is not indispensable for realizing this means, and there can be various ways of realizing it depending on the type of condition described in the correction condition memory 19 described later. For example, there is a realization method such as detecting all the places that can be interpreted in a plurality of ways, or detecting only the part having the same word.
【0032】判定結果メモリ13は、曖昧性判定手段1
2の判定結果を記憶する。ICメモリ、磁気ディスク装
置、磁気テープ装置などが用いられる。図10は判定結
果メモリ13の内容の例である。図10に示した内容
は、図8の作業メモリ11の例に対して、曖昧性判定手
段12が図18のような処理手順で実行された場合の判
定結果メモリ13の内容に対応する。図10の判定結果
メモリ13では、曖昧性のあった箇所について、その位
置と解析情報が格納されている。The determination result memory 13 is used by the ambiguity determination means 1
The determination result of 2 is stored. An IC memory, a magnetic disk device, a magnetic tape device or the like is used. FIG. 10 shows an example of the contents of the judgment result memory 13. The contents shown in FIG. 10 correspond to the contents of the judgment result memory 13 when the ambiguity judging means 12 is executed by the processing procedure as shown in FIG. 18 with respect to the example of the working memory 11 of FIG. In the determination result memory 13 of FIG. 10, the position and the analysis information are stored with respect to the ambiguity portion.
【0033】訂正条件メモリ19は、自動訂正の対象箇
所の満たすべき条件を記憶する。ICメモリ、磁気ディ
スク装置、磁気テープ装置などが用いられる。図11
は、訂正条件メモリ19の例を示す図である。図11の
訂正条件メモリ19の例では、曖昧性判定手段12の検
出した箇所を自動訂正の対象とするか否かや、どんな種
別の不適正語を自動訂正の対象とするかが、対象とする
なら1、対象としないなら0で記述してある。図11の
例では、曖昧性判定手段12の検出した箇所は自動訂正
の対象とせず、それ以外の箇所で不適正種別が誤用語、
送りがな不適正語、書き換え推奨語のいずれかの場合に
自動訂正を行うという条件を表している。ただし、条件
の記述形式は、このようなフラグ形式に限定されるもの
ではなく、自然言語やプログラムとして記述するような
形式をとっても構わない。The correction condition memory 19 stores the conditions to be met by the automatic correction target portion. An IC memory, a magnetic disk device, a magnetic tape device or the like is used. Figure 11
FIG. 6 is a diagram showing an example of a correction condition memory 19. In the example of the correction condition memory 19 of FIG. 11, whether or not the location detected by the ambiguity determining unit 12 is to be the target of automatic correction, and what kind of inappropriate word is to be the target of automatic correction is the target. It is described as 1 if yes, and 0 if not. In the example of FIG. 11, the location detected by the ambiguity determination unit 12 is not a target for automatic correction, and the incorrect type is a wrong term in other locations,
It represents the condition that automatic correction is performed in the case of an unsuitable word that is not sent or a rewriting recommended word. However, the description format of the condition is not limited to such a flag format, and may be a format described as a natural language or a program.
【0034】訂正箇所判定手段14は、解析結果メモリ
5と判定結果メモリ13を参照して、訂正条件メモリ1
9の条件に該当する箇所を検出する。コンピュータのC
PUなどが用いられる。図19は、図11の訂正条件メ
モリ19の例にあわせた訂正箇所判定手段14の実現例
を示すフローチャートである。図19のフローチャート
におけるステップ191が図11の不適正種別の条件チ
ェックに対応し、ステップ192が図11の解析曖昧性
の生じた箇所かどうかの条件チェックに対応する。The correction point judging means 14 refers to the analysis result memory 5 and the judgment result memory 13 to refer to the correction condition memory 1
The part corresponding to the condition 9 is detected. Computer C
PU or the like is used. FIG. 19 is a flow chart showing an example of implementation of the correction point determination means 14 in accordance with the example of the correction condition memory 19 of FIG. Step 191 in the flowchart of FIG. 19 corresponds to the condition check of the inappropriate type of FIG. 11, and step 192 corresponds to the condition check of whether or not the analysis ambiguity has occurred in FIG. 11.
【0035】訂正対象箇所メモリ15は、訂正対象箇所
判定手段14の検出箇所を記憶する。ICメモリ、磁気
ディスク装置、磁気テープ装置などが用いられる。図1
2は、訂正対象箇所メモリ15の内容の例を示す図であ
る。図12では、「戦争で私の故郷は完壁に焼土になっ
た。」という例文に対する訂正箇所は、9番目の文字位
置から長さ2の単語( 完壁) であることが示されてい
る。必要に応じて、該当箇所の不適正種別も記憶してよ
い。The correction target location memory 15 stores the detection location of the correction target location determination means 14. An IC memory, a magnetic disk device, a magnetic tape device or the like is used. Figure 1
FIG. 2 is a diagram showing an example of the contents of the correction target location memory 15. In Fig. 12, the corrected part for the example sentence "My hometown was completely burned by the war." Is shown to be a word of length 2 from the 9th character position (complete wall). There is. If necessary, the incorrect type of the relevant part may be stored.
【0036】自動訂正手段16は、校正情報付き辞書メ
モリ4を参照して、入力文章メモリ2に格納された文章
を、訂正対象箇所メモリ15に格納された箇所について
訂正候補(複数ある場合は第一候補)に置き換えること
で、自動訂正する。コンピュータのCPUなどが用いら
れる。図20は、自動訂正手段16の実現例のフローチ
ャートである。図20のフローチャートでは、訂正対象
箇所メモリ15から入力文章中の訂正対象箇所を見つけ
て、その訂正箇所に対する訂正候補を校正情報付き単語
辞書メモリ4から検索し、訂正箇所と検索した訂正候補
の第一候補を置き換えている。入力文章の最後に達した
ら訂正後の文章を訂正後文章メモリ17に書き込む。The automatic correction means 16 refers to the proofreading-added dictionary memory 4 and corrects the sentence stored in the input sentence memory 2 with respect to the portion stored in the correction target portion memory 15 (if there are a plurality of correction candidates, the correction candidate). It is automatically corrected by substituting one candidate). A CPU or the like of a computer is used. FIG. 20 is a flowchart of an implementation example of the automatic correction means 16. In the flowchart of FIG. 20, a correction target portion in the input sentence is found from the correction target portion memory 15, a correction candidate for the correction portion is searched from the proofreading word dictionary memory 4, and the correction portion and the first correction candidate searched are searched. Replacing one candidate. When the end of the input sentence is reached, the corrected sentence is written in the corrected sentence memory 17.
【0037】訂正後文章メモリ17は、入力文章メモリ
2に格納された文章の、自動訂正手段16による訂正結
果を格納する。ICメモリ、磁気ディスク装置、磁気テ
ープ装置などが用いられる。本実施例では、訂正後文章
メモリ17を入力文章メモリ2とは別の構成要素とした
が、訂正後文章メモリ17を設けずに、自動訂正手段1
6が入力文章メモリ2を直接書き換えるように構成する
ことも可能である。図13は、訂正後文章メモリ20の
内容の例を示す図である。文章出力手段20は、訂正後
文章メモリ17の内容を出力する。プリンタやCRTデ
ィスプレイなどが用いられる。The corrected text memory 17 stores the correction result of the automatic correction means 16 for the text stored in the input text memory 2. An IC memory, a magnetic disk device, a magnetic tape device or the like is used. In the present embodiment, the corrected text memory 17 is a component different from the input text memory 2, but the corrected text memory 17 is not provided and the automatic correction means 1 is provided.
It is also possible for 6 to directly rewrite the input sentence memory 2. FIG. 13 is a diagram showing an example of the contents of the corrected text memory 20. The text output means 20 outputs the corrected contents of the text memory 17. A printer or CRT display is used.
【0038】以上のような構成要素のうち、文章入力手
段1、入力文章メモリ2、文法解析手段3、校正情報付
き単語辞書メモリ4、解析結果メモリ5、作業メモリ1
1、訂正後文章メモリ17は、図5に示した従来の文章
訂正装置の構成要素と同じである。曖昧性判定手段1
2、判定結果メモリ13、訂正対象箇所判定手段14、
訂正対象箇所メモリ15、自動訂正手段16、訂正条件
メモリ19が、本発明による新しい構成要素である。Among the above components, the sentence input means 1, the input sentence memory 2, the grammar analysis means 3, the proofreading word dictionary memory 4, the analysis result memory 5, and the working memory 1
1. The corrected text memory 17 is the same as the constituent elements of the conventional text correction device shown in FIG. Ambiguity determination means 1
2, determination result memory 13, correction target portion determination means 14,
The correction target location memory 15, the automatic correction means 16, and the correction condition memory 19 are new components according to the present invention.
【0039】次に、「戦争で私の故郷は完壁に焼土にな
った。」という文章が文章入力手段1を用いて入力され
た場合の動作例について説明する。入力された文章は、
図6に示すように入力文章メモリ2に記憶される。図6
に示したような先頭から数えた文字数を、以下では、文
字位置を表すために用いる。文法解析手段3は、図7に
示すような校正情報付き単語辞書メモリ4を参照しなが
ら文法解析を行う。文法解析の途中結果は、図8に示す
ように「焼土」の解釈に二つの可能性を残した形で作業
メモリ11に一時的に格納される。Next, an example of the operation when the sentence "My hometown was completely burned in the war" was input using the sentence input means 1 will be described. The entered text is
It is stored in the input sentence memory 2 as shown in FIG. Figure 6
In the following, the number of characters counted from the beginning as shown in is used to represent the character position. The grammar analyzing means 3 performs grammar analysis with reference to the proofreading word dictionary memory 4 as shown in FIG. The intermediate result of the grammar analysis is temporarily stored in the working memory 11 in a form leaving two possibilities for the interpretation of "burnt clay" as shown in FIG.
【0040】曖昧性判定手段12は、図18のフローチ
ャートに示すように、ステップ181で作業メモリ11
の9番目の単語候補「完壁」が不適正語であると判定す
ると、ステップ182で「完壁」と存在区間が重複する
単語があるかどうかを調べる。「完壁」には存在区間が
重複する単語が作業メモリ11の中で存在しないのでス
テップ182でNOと判定されて次の文字位置である1
0番目の判定処理に移る。同様に、ステップ182で1
2番目の単語候補「焼土」が不適正語であると判定する
と、「焼土」と存在区間が重複する単語があるかどうか
を調べる。「焼土」には存在区間が重複する単語が作業
メモリ11の中で存在するのでステップ182でYES
と判定されて、12番目の文字位置から長さ2の「焼
土」は、「やけつち」と「しょうど」の二通りの読みの
曖昧性が発生し、送りがなの不適正語と誤用語の二通り
の訂正項目に該当する語であることが判定結果メモリ1
3に図10に示すように記憶される。The ambiguity determining means 12 determines the working memory 11 in step 181 as shown in the flowchart of FIG.
If it is determined that the 9th word candidate “complete wall” of is an inappropriate word, it is checked in step 182 whether there is a word whose existence section overlaps with “complete wall”. Since there is no word in the working memory 11 in which the existence section overlaps in “Complete wall”, it is determined as NO in step 182 and is the next character position.
Move to the 0th determination process. Similarly, in step 182, 1
When it is determined that the second word candidate “burnt clay” is an inappropriate word, it is checked whether there is a word whose existence section overlaps with “burnt clay”. Since there is a word in the working memory 11 in which the existence section overlaps in the "burnt clay", YES is obtained in step 182.
It was determined that the 12th character position, and the length of 2 "fired clay" had an ambiguity in reading in two ways, "Yaketsuchi" and "Shodo" Judgment result memory 1 that the word corresponds to two types of correction items
3 is stored as shown in FIG.
【0041】解析結果メモリ5では、文法解析手段3に
よって図8の作業メモリ11の状態からさらに候補選択
が行われて、図9に示すように解釈が一意に決定されて
いる。In the analysis result memory 5, candidates are further selected from the state of the working memory 11 shown in FIG. 8 by the grammar analyzing means 3, and the interpretation is uniquely determined as shown in FIG.
【0042】訂正条件メモリ19には、図11に示すよ
うな条件が記述されているものとする。このとき、訂正
箇所判定手段14が、解析結果メモリ5と判定結果メモ
リ13を参照して検出する訂正箇所は、訂正対象箇所メ
モリ15のようになる。It is assumed that the correction condition memory 19 describes the conditions as shown in FIG. At this time, the correction location determining unit 14 refers to the analysis result memory 5 and the determination result memory 13 to detect the correction location like the correction target location memory 15.
【0043】訂正対象箇所メモリ15には、図12のよ
うに訂正箇所が9番目の文字位置から長さ2の単語( 完
壁) であることが示されている。In the correction target portion memory 15, as shown in FIG. 12, it is shown that the correction portion is a word (complete wall) having a length of 2 from the ninth character position.
【0044】自動訂正手段16は、校正情報付き辞書メ
モリ4を参照して、入力文章メモリ2に格納された図6
の文章を、訂正対象箇所メモリ15に格納された箇所に
ついて第一訂正候補「完璧」に置き換えることで、自動
訂正する。The automatic correction means 16 refers to the proofreading dictionary memory 4 and is stored in the input sentence memory 2 as shown in FIG.
Is automatically replaced with the first correction candidate “perfect” for the part stored in the correction target part memory 15.
【0045】訂正後文章メモリ17は、入力文章メモリ
2に格納された文章の、自動訂正手段16による訂正結
果を図13のように格納する。文章出力手段20は、訂
正後文章メモリ17の内容を出力する。結果として、
「完壁」は「完璧」に自動訂正されるが、「焼土」の部
分は解釈が曖昧になるため自動訂正は実行されず、その
まま残る。The corrected sentence memory 17 stores the correction result of the sentence stored in the input sentence memory 2 by the automatic correction means 16 as shown in FIG. The text output means 20 outputs the corrected contents of the text memory 17. as a result,
The "complete wall" is automatically corrected to "perfect", but the "burned clay" part is not corrected because the interpretation is ambiguous.
【0046】図2は、本発明の文章訂正装置の第二の実
施例の構成を示すブロック図である。図1の構成に、訂
正条件入力手段25が構成要素として加わっている。FIG. 2 is a block diagram showing the configuration of the second embodiment of the sentence correction device of the present invention. Correction condition input means 25 is added to the configuration of FIG. 1 as a component.
【0047】訂正条件入力手段25は、訂正条件メモリ
19に記憶した内容をユーザが変更するための入力手段
である。訂正条件入力手段25としてキーボードなどが
用いられる。例えば、図11のような訂正条件メモリ1
9について、不適正種別の誤用語の値を1から0に書き
換えると上述の動作例で検出され、訂正箇所となった
「完壁」( 訂正候補:「完璧」) は、自動訂正されない
ようにできる。The correction condition input means 25 is an input means for the user to change the contents stored in the correction condition memory 19. A keyboard or the like is used as the correction condition input means 25. For example, the correction condition memory 1 as shown in FIG.
Regarding 9, if the value of the incorrect term of the incorrect type is rewritten from 1 to 0, the "complete wall" (correction candidate: "perfect") that is detected and corrected in the above operation example will not be automatically corrected. it can.
【0048】図3は、本発明の文章訂正装置の第三の実
施例の構成を示すブロック図である。FIG. 3 is a block diagram showing the configuration of the third embodiment of the sentence correction device of the present invention.
【0049】図5に示した従来の文章訂正装置の構成
に、曖昧箇所決定手段31、曖昧解消指示入力手段3
2、曖昧箇所情報メモリ33が構成要素として加わって
いる。曖昧箇所決定手段31は、判定結果メモリ13を
参照することで入力文章における不適正語の認定が曖昧
な箇所を検出し、その曖昧性を持つ箇所の情報を曖昧箇
所情報メモリ33に書き込むことによって表示手段22
に表示させるようにし、曖昧解消指示入力手段32から
の曖昧解消指示にしたがって、その検出箇所の曖昧性を
解消する。その結果は、逐次訂正手段6へ通知する。曖
昧箇所決定手段31には、コンピュータのCPUなどが
用いられる。曖昧解消指示入力手段32は、曖昧箇所決
定手段31によって不適正語の認定に関する曖昧性を解
消するための指示を入力する手段で、キーボード、マウ
スなどが用いられる。図21は、曖昧箇所決定手段31
の実現例を示すフローチャートである。曖昧箇所情報メ
モリ33は、曖昧箇所決定手段31によって検出され
た、入力文章における不訂正語の認定が曖昧な箇所の複
数通りの解釈に関する情報を表示するために一時格納す
るメモリで、ICメモリ、磁気ディスク装置、磁気テー
プ装置などが用いられる。In addition to the structure of the conventional sentence correction device shown in FIG. 5, the ambiguity point determining means 31 and the ambiguity resolution instruction input means 3 are added.
2. The ambiguous location information memory 33 is added as a constituent element. The ambiguous portion determining means 31 detects a portion in the input sentence in which the recognition of an incorrect word is ambiguous by referring to the determination result memory 13, and writes the information of the ambiguous portion in the ambiguous portion information memory 33. Display means 22
, And the ambiguity of the detected position is resolved according to the ambiguity resolution instruction from the ambiguity resolution instruction input means 32. The result is notified to the sequential correction means 6. A CPU of a computer or the like is used as the ambiguous portion determination unit 31. The ambiguity resolving instruction input means 32 is means for inputting an instruction for resolving the ambiguity regarding the recognition of an inappropriate word by the ambiguity determining means 31, and a keyboard, a mouse or the like is used. FIG. 21 shows the ambiguous portion determining means 31.
It is a flow chart which shows an example of realization of. The ambiguous portion information memory 33 is a memory that is temporarily stored to display information about multiple interpretations of the ambiguous portion recognition of the uncorrected word in the input sentence, which is detected by the ambiguous portion determining unit 31, and is an IC memory, A magnetic disk device, a magnetic tape device, etc. are used.
【0050】「戦争で私の故郷は完壁に焼土になっ
た。」という入力文章を用いて第三の実施例の動作例に
ついて説明する。第一の実施例で説明したように判定結
果メモリ13には、12番目の文字位置から長さ2の
「焼土」は「やけつち」と「しょうど」の二通りの解釈
( 読み) があり、送りがなの不適正語と誤用語の二通り
の訂正項目に該当する語であることが図10に示すよう
に記憶されていることになる。曖昧箇所決定手段31
は、「焼土」の箇所が不適正語の認定に関して曖昧性を
持つ箇所であることを検出し、その情報を曖昧箇所情報
メモリ33に書き込む。その結果、例えば、図22(
a) のような表示が行われる。An operation example of the third embodiment will be described with reference to an input sentence "My hometown was completely burned in the war." As described in the first embodiment, the judgment result memory 13 has two interpretations of "yaketsuchi" and "shodo" for the "burnt clay" having a length of 2 from the 12th character position.
It is stored as shown in FIG. 10 that the word corresponding to two kinds of correction items, that is, the word (reading), the incorrect word and the incorrect word. Ambiguous location determining means 31
Detects that the “burned earth” part is a part having ambiguity regarding the recognition of an incorrect word, and writes the information to the ambiguity part information memory 33. As a result, for example, in FIG.
A display such as a) is displayed.
【0051】図22( a) では、「焼土」について「し
ょうど」と「やけつち」という二通りの読みがあり、い
ずれかが選択できることを示している。In FIG. 22 (a), there are two readings for "burnt earth", "shodo" and "yaketsuchi", and it is shown that either one can be selected.
【0052】曖昧解消指示入力手段32によってユーザ
は、「やけつち」と「しょうど」のどちらの読みを選択
することができる。ユーザが「しょうど」の読みを選択
したとすると、逐次訂正手段6は、校正情報付き単語辞
書メモリ4を参照して、入力文章の曖昧箇所決定手段3
1の決定結果である「しょうど」の読みの方の「焼土」
に対する訂正候補を検索し、その訂正候補「焦土」を訂
正候補情報メモリ18に書き込むことによって表示手段
22に表示させる。図22( b) が、その状態の表示例
である。候補選択指示入力手段7によって、ユーザが
「焼土」に対する訂正候補として「焦土」を指定すると
訂正後文章メモリ17には「戦争で私の故郷は完壁に焦
土になった。」という文章が書き込まれる。一方、曖昧
解消指示入力手段32で「やけつち」を選択した場合
は、図22( b’) のようになる。The ambiguity resolution instruction input means 32 allows the user to select either "Yaketsuchi" or "shodo" reading. When the user selects the reading of “shodo”, the sequential correction means 6 refers to the proofreading word dictionary memory 4 and refers to the ambiguous part determination means 3 of the input sentence.
"Soil" for those who read "Shodo", which is the result of decision 1.
The correction candidate for “?” Is retrieved, and the correction candidate “scorch” is written in the correction candidate information memory 18 to be displayed on the display means 22. FIG. 22 (b) is a display example of that state. When the user designates "scorched earth" as a correction candidate for "burnt clay" by means of the candidate selection instruction input means 7, the sentence "correction made my hometown completely scorched" in the corrected text memory 17 is displayed. Written. On the other hand, when "Yaketsuchi" is selected by the disambiguation instruction input means 32, the result is as shown in FIG. 22 (b ').
【0053】以上のようにして、本実施例では、不適正
語の解釈に曖昧性が生じた箇所をユーザに自然な形で掲
示できる。なお、上記の説明では、不適正語の認定に曖
昧性の生じなかった「完壁」の部分をとばしてしまった
が、その部分については、従来の文章訂正装置と同様に
解析結果メモリ5の内容に基づいて逐次訂正手段6が誤
用語として検出し、「完璧」という訂正候補を示して置
き換えることができる。As described above, in the present embodiment, the place where the ambiguity occurs in the interpretation of the inappropriate word can be posted to the user in a natural form. In the above description, the "complete wall" portion, which did not cause ambiguity in the recognition of the incorrect word, is skipped. However, that portion is stored in the analysis result memory 5 as in the conventional sentence correction device. Based on the content, the sequential correction means 6 can detect it as an erroneous term, and can indicate and replace the correction candidate “perfect”.
【0054】同じく第三の実施例において、「それは香
車である。」という入力文章を処理する場合の例を説明
する。文法解析に曖昧が発生するのは「香車」の部分で
あり、「きょうしゃ」と読む候補と「きゃしゃ」と読む
候補が出来たとする。このとき、従来の文章訂正装置で
は、強引に一方の解釈に決定してしまう。そのため、
「きょうしゃ」の方をとれば適正語なので検出されず、
「きゃしゃ」の方をとれば誤用語と検出される。どちら
の解釈が正しいかをユーザは判断できるが、ユーザから
見れば文章訂正装置が検出洩れを起こしたか、あるい
は、誤った解釈をしたと感じてしまう。これに対して、
本実施例の文章訂正装置では、図23(a)のように、
一旦「香車」をマークし、「きょうしゃ」と「きゃし
ゃ」の二通りの読みがあることをユーザに示し、選択さ
せる。「きょうしゃ」を選べば、図23( b) のように
不適正語ではないのでマークをはずし、「きゃしゃ」を
選んだときは図23( b’) のように誤用語として訂正
候補を示す。これによって検出洩れを防げるし、ユーザ
に自然な理解を与えられる。Similarly, in the third embodiment, an example of processing an input sentence "It is a fragrance wheel" will be described. Ambiguity occurs in the grammatical analysis in the part of "Kosha", and it is assumed that there are candidates to read "Kyosha" and "Kyasha". At this time, the conventional text correction device forcibly decides one interpretation. for that reason,
If you take "Kyosha", it will not be detected because it is a proper word,
If "Kasha" is taken, it will be detected as an erroneous term. The user can determine which interpretation is correct, but from the user's perspective, the user may feel that the text correction device has missed the detection or made an incorrect interpretation. On the contrary,
In the text correction device of this embodiment, as shown in FIG.
Mark "Perfume wheel" once and let the user know that there are two readings, "Kyosha" and "Kyasha", and let the user select. If "Kyosha" is selected, it is not an incorrect word as shown in Fig. 23 (b), so the mark is removed. When "Kyasha" is selected, a correction candidate is shown as an incorrect term as shown in Fig. 23 (b '). . This prevents omission of detection and gives the user a natural understanding.
【0055】図4は、本発明の文章訂正装置の第四の実
施例の構成を示すブロック図である。FIG. 4 is a block diagram showing the configuration of the fourth embodiment of the text correction device of the present invention.
【0056】図2の構成と図3の構成を組み合わせた構
成に、訂正取消指示入力手段34、訂正取消手段35、
自動訂正情報メモリ36が構成要素として加わってい
る。In addition to the combination of the configuration of FIG. 2 and the configuration of FIG. 3, a correction cancellation instruction input means 34, a correction cancellation means 35,
An automatic correction information memory 36 is added as a constituent element.
【0057】訂正取消指示入力手段34は、訂正取消指
示を入力する。自動訂正情報メモリ36は、自動訂正手
段16が訂正候補と置き換えた箇所の位置や解析情報を
記憶する。訂正取消手段35は、自動訂正情報メモリ3
6を参照し、訂正後文章の自動訂正された箇所を元の単
語に戻す。訂正取消指示入力手段34は、キーボード、
マウスなどが用いられる。訂正取消手段35は、コンピ
ュータのCPUなどが用いられる。The correction cancellation instruction input means 34 inputs a correction cancellation instruction. The automatic correction information memory 36 stores the position and analysis information of the portion replaced with the correction candidate by the automatic correction means 16. The correction canceling means 35 is provided in the automatic correction information memory 3
6, the automatically corrected portion of the corrected sentence is returned to the original word. The correction cancellation instruction input means 34 is a keyboard,
A mouse or the like is used. As the correction canceling means 35, a CPU of a computer or the like is used.
【0058】自動訂正情報メモリ36は、ICメモリ、
磁気ディスク装置、磁気テープ装置などが用いられる。
これらの手段は、自動訂正の結果が不適切だった箇所に
ついて、元の単語に戻せるようにするためのものであ
る。The automatic correction information memory 36 is an IC memory,
A magnetic disk device, a magnetic tape device, etc. are used.
These means are for making it possible to revert to the original word at a portion where the result of the automatic correction is inappropriate.
【0059】例えば、入力文章「戦争で私の故郷は完壁
に焼土になった。」が、自動訂正手段16の結果、訂正
後文章メモリ17に「戦争で私の故郷は完璧に焼土にな
った。」という文章になって記憶されているものとす
る。そのとき自動訂正情報メモリ36は、自動訂正した
9番目の箇所に対して「完壁」が訂正前の元の表記であ
ることを記憶している。自動訂正された箇所には、その
旨を表すマークをつけて表示し、その箇所について、訂
正取消指示入力手段34によって指示を与えると、訂正
前の単語に戻すようにできる。第四の実施例の文章訂正
装置では、まず、第二の実施例に対応する構成要素を動
作させて、自動訂正の条件に適合する箇所を置き換えて
掲示し、次に第三の実施例に対応する構成要素を動作さ
せて、自動訂正しなかった箇所の不適正語の逐次訂正を
行うような使い方ができる。さらには上述のように自動
訂正したことが適切でなかった箇所は元に戻すような操
作も可能である。For example, the input sentence “My hometown was completely burned in the war.” As a result of the automatic correction means 16, the corrected sentence memory 17 reads “My hometown was completely burned in the war. It has been remembered as a sentence. At that time, the automatic correction information memory 36 stores that “complete wall” is the original notation before correction for the automatically corrected ninth position. It is possible to display the automatically corrected portion with a mark to that effect and to return to the uncorrected word when an instruction is given to the portion by the correction cancellation instruction input means 34. In the text correction device of the fourth embodiment, first, the constituent elements corresponding to the second embodiment are operated, and the parts that meet the conditions of the automatic correction are replaced and posted, and then the third embodiment is described. It can be used to operate the corresponding components to perform sequential correction of incorrect words at locations that were not automatically corrected. Further, as described above, it is also possible to perform an operation to restore the place where automatic correction was not appropriate.
【0060】[0060]
【発明の効果】以上のようにして、本発明の文章訂正装
置によれば、まず、文法解析によって不適正語と認定さ
れた箇所を一括して自動訂正する際に、不確実な訂正を
避けるようにしているので、自動訂正した箇所を後から
元に戻すような操作が従来より大幅に減少し、訂正作業
の効率が向上する。さらに、逐次的な訂正を行う際に、
文法解析における曖昧性を考慮した表示を行っているの
で、検出洩れが少なく、しかも、ユーザが理解しやすい
文章訂正が実現できる。As described above, according to the sentence correction device of the present invention, first, uncertain correction is avoided at the time of automatically correcting collectively the portions recognized as inappropriate words by grammar analysis. As a result, the number of operations to restore the automatically corrected portion later is greatly reduced compared to the conventional one, and the efficiency of the correction work is improved. Furthermore, when making sequential corrections,
Since the display is performed in consideration of the ambiguity in the grammatical analysis, it is possible to realize the sentence correction that is not overlooked and is easy for the user to understand.
【図1】本発明の文章訂正装置の第一の実施例を表すブ
ロック図である。FIG. 1 is a block diagram showing a first embodiment of a text correction device of the present invention.
【図2】本発明の文章訂正装置の第二の実施例を表すブ
ロック図である。FIG. 2 is a block diagram showing a second embodiment of the text correction device of the present invention.
【図3】本発明の文章訂正装置の第三の実施例を表すブ
ロック図である。FIG. 3 is a block diagram showing a third embodiment of the text correction device of the present invention.
【図4】本発明の文章訂正装置の第四の実施例を表すブ
ロック図である。FIG. 4 is a block diagram showing a fourth embodiment of the text correction device of the present invention.
【図5】従来の文章訂正装置の一実施例を表すブロック
図である。FIG. 5 is a block diagram showing an embodiment of a conventional text correction device.
【図6】入力文章メモリ2の内容の例を示す図である。FIG. 6 is a diagram showing an example of contents of an input sentence memory 2.
【図7】校正情報付き単語辞書メモリ4の内容の例を示
す図である。FIG. 7 is a diagram showing an example of contents of a word dictionary memory 4 with proofreading information.
【図8】作業メモリ11の内容の例を示す図である。FIG. 8 is a diagram showing an example of contents of a working memory 11.
【図9】解析結果メモリ19の内容の例を示す図であ
る。9 is a diagram showing an example of contents of an analysis result memory 19. FIG.
【図10】判定結果メモリ13の内容の例を示す図であ
る。FIG. 10 is a diagram showing an example of contents of a determination result memory 13.
【図11】訂正条件メモリ19の内容の例を示す図であ
る。11 is a diagram showing an example of contents of a correction condition memory 19. FIG.
【図12】訂正対象箇所メモリ15の内容の例を示す図
である。12 is a diagram showing an example of the contents of a correction target location memory 15. FIG.
【図13】訂正後文章メモリ20の内容の例を示す図で
ある。FIG. 13 is a diagram showing an example of the contents of a corrected text memory 20.
【図14】曖昧箇所情報メモリ33の内容の例を示す図
である。FIG. 14 is a diagram showing an example of contents of an ambiguous portion information memory 33.
【図15】訂正候補情報メモリ18の内容の例を示す図
である。FIG. 15 is a diagram showing an example of the contents of a correction candidate information memory 18.
【図16】自動訂正情報メモリ36の内容の例を示す図
である。16 is a diagram showing an example of contents of an automatic correction information memory 36. FIG.
【図17】文法解析手段3の実現例を示すフローチャー
トである。FIG. 17 is a flowchart showing an example of implementation of grammar analysis means 3.
【図18】曖昧性判定手段12の実現例を示すフローチ
ャートである。FIG. 18 is a flowchart showing an implementation example of the ambiguity determination unit 12.
【図19】訂正対象箇所判定手段14の実現例を示すフ
ローチャートである。FIG. 19 is a flowchart showing an example of implementation of the correction target portion determination means 14.
【図20】自動訂正手段16の実現例を示すフローチャ
ートである。FIG. 20 is a flowchart showing an implementation example of the automatic correction means 16.
【図21】曖昧箇所決定手段31の実施例を示すフロー
チャートである。FIG. 21 is a flow chart showing an example of an ambiguous point determination means 31.
【図22】不適正語の認定に曖昧性のある箇所の表示例
その1を示す図である。FIG. 22 is a diagram showing a first display example of a portion where there is ambiguity in the recognition of an inappropriate word;
【図23】不適正語の認定に曖昧性のある箇所の表示例
その2を示す図である。FIG. 23 is a diagram showing a second display example of a portion where there is ambiguity in the recognition of an inappropriate word.
1 文章入力手段 2 入力文章メモリ 3 文法解析手段 4 校正情報付き単語辞書メモリ 5 解析結果メモリ 6 逐次訂正手段 7 候補選択指示入力手段 11 作業メモリ 12 曖昧性判定手段 13 判定結果メモリ 14 訂正対象箇所判定手段 15 訂正対象箇所メモリ 16 自動訂正手段 17 訂正後文章メモリ 18 訂正候補情報メモリ 19 訂正条件メモリ 20 文章出力手段 21 表示制御手段 25 訂正条件入力手段 31 曖昧箇所決定手段 32 曖昧解消指示入力手段 33 曖昧箇所情報メモリ 34 訂正取消指示入力手段 35 訂正取消手段 36 自動訂正情報メモリ 1 sentence input means 2 input sentence memory 3 grammar analysis means 4 word dictionary memory with proofreading information 5 analysis result memory 6 sequential correction means 7 candidate selection instruction input means 11 working memory 12 ambiguity determination means 13 determination result memory 14 correction target location determination Means 15 Correction target location memory 16 Automatic correction means 17 Corrected text memory 18 Correction candidate information memory 19 Correction condition memory 20 Text output means 21 Display control means 25 Correction condition input means 31 Ambiguous location determination means 32 Ambiguous resolution instruction input means 33 Ambiguous Location information memory 34 Correction cancellation instruction input means 35 Correction cancellation means 36 Automatic correction information memory
Claims (2)
リと、不適正語を含み不適正語の種別や訂正候補などの
校正情報を持つ単語辞書を記憶する校正情報付き単語辞
書メモリと、前記校正情報付き単語辞書メモリを参照し
て前記入力された文章の文法解析を行い不適正語を認定
する文法解析手段と、前記入力された文章について前記
文法解析の結果を記憶する解析結果メモリと、前記文法
解析の途中結果を一時格納する作業メモリと、前記作業
メモリを参照して前記入力された文章の前記文法解析に
おける曖昧性を判定する曖昧性判定手段と、前記曖昧性
判定手段の判定結果を記憶する判定結果メモリと、自動
訂正の対象箇所の満たすべき条件を記憶した訂正条件メ
モリと、前記解析結果メモリと前記判定結果メモリを参
照して前記訂正条件メモリの条件に該当する箇所を検出
する訂正対象箇所判定手段と、前記訂正対象箇所判定手
段の検出箇所を記憶する訂正対象箇所メモリと、前記校
正情報付き辞書メモリを参照して前記入力された文章を
前記訂正対象箇所メモリに格納された箇所について自動
訂正を行う自動訂正手段とを備えることを特徴とする文
章訂正装置。1. An input sentence memory for storing an inputted sentence, a word dictionary memory with proofreading information for storing a word dictionary having proofreading information such as an incorrect word type and correction candidate including an incorrect word, Grammar analysis means for recognizing an incorrect word by performing grammatical analysis of the input sentence with reference to a proofreading word dictionary memory, and an analysis result memory for storing the result of the grammar analysis of the input sentence, A working memory for temporarily storing an intermediate result of the grammar analysis, an ambiguity determining unit for determining the ambiguity in the grammar analysis of the input sentence with reference to the working memory, and a determination result of the ambiguity determining unit A determination result memory that stores a condition, a correction condition memory that stores a condition that should be satisfied by an automatic correction target portion, the analysis result memory and the determination result memory, and the correction condition Correction target portion determination means for detecting a portion corresponding to the condition of the memory, correction target portion memory for storing the detected portion of the correction target portion determination means, and the input sentence with reference to the dictionary memory with calibration information And an automatic correction means for automatically correcting a portion stored in the correction target portion memory.
リと、不適正語を含み不適正語の種別や訂正候補などの
校正情報を持つ単語辞書を記憶する校正情報付き単語辞
書メモリと、前記校正情報付き単語辞書メモリを参照し
て前記入力された文章の文法解析を行い不適正語を認定
する文法解析手段と、前記入力された文章について前記
文法解析の結果を記憶する解析結果メモリと、前記文法
解析の途中結果を一時格納する作業メモリと、前記作業
メモリを参照して前記入力された文章の前記文法解析に
おける曖昧性を判定する曖昧性判定手段と、前記曖昧性
判定手段の判定結果を記憶する判定結果メモリと、不適
正語の認定に関する曖昧性を解消するための指示を入力
する曖昧解消指示入力手段と、前記判定結果メモリを参
照して前記入力された文章における不適正語の認定が曖
昧な箇所を検出し前記曖昧解消指示入力手段からの指示
によって該箇所の曖昧性を解消する曖昧箇所決定手段
と、不適正箇所に関する訂正候補の選択指示を入力する
候補選択指示入力手段と、前記曖昧箇所決定手段の決定
と前記解析結果メモリを参照して前記入力された文章に
おける不適正箇所を検出し該不適正箇所に関する訂正候
補を前記校正情報付き単語辞書メモリから検索し前記候
補選択指示入力手段から指示された訂正候補に該不適正
箇所を置き換える逐次訂正手段とを備えることを特徴と
する文章訂正装置。2. An input sentence memory for storing an inputted sentence, a word dictionary memory with proofreading information for storing a word dictionary having proofreading information such as types of incorrect words and correction candidates including incorrect words, Grammar analysis means for recognizing an incorrect word by performing grammatical analysis of the input sentence with reference to a proofreading word dictionary memory, and an analysis result memory for storing the result of the grammar analysis of the input sentence, A working memory for temporarily storing an intermediate result of the grammar analysis, an ambiguity determining unit for determining the ambiguity in the grammar analysis of the input sentence with reference to the working memory, and a determination result of the ambiguity determining unit A decision result memory for storing a decision result memory, an ambiguity resolution instruction input means for inputting an instruction for resolving an ambiguity relating to recognition of an incorrect word, and the decision result memory for inputting the ambiguity. An ambiguity point determining means for detecting an ambiguity in the recognition of an incorrect word in a sentence and eliminating the ambiguity of the ambiguity by the instruction from the ambiguity resolution instruction inputting means, and an instruction for selecting a correction candidate for the incorrectness input The candidate selection instruction inputting means, the determination of the ambiguous portion determining means, and the analysis result memory are referred to detect an inappropriate portion in the input sentence, and a correction candidate for the incorrect portion is detected, and the correction information-related word dictionary A sentence correction device comprising: a sequential correction unit that replaces the inappropriate portion with a correction candidate that is retrieved from a memory and that is designated by the candidate selection designation input unit.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5240977A JP2870375B2 (en) | 1993-09-28 | 1993-09-28 | Sentence correction device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5240977A JP2870375B2 (en) | 1993-09-28 | 1993-09-28 | Sentence correction device |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0793330A true JPH0793330A (en) | 1995-04-07 |
JP2870375B2 JP2870375B2 (en) | 1999-03-17 |
Family
ID=17067482
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5240977A Expired - Lifetime JP2870375B2 (en) | 1993-09-28 | 1993-09-28 | Sentence correction device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2870375B2 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014225172A (en) * | 2013-05-17 | 2014-12-04 | 日本電気株式会社 | Document analysis system, method, and program |
US9665559B2 (en) | 1998-01-27 | 2017-05-30 | Kinigos, Llc | Word checking tool for selectively filtering text documents for undesirable or inappropriate content as a function of target audience |
JP2017215734A (en) * | 2016-05-31 | 2017-12-07 | 京セラドキュメントソリューションズ株式会社 | Image forming apparatus and image forming method |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6039228A (en) * | 1983-08-11 | 1985-03-01 | Ricoh Co Ltd | Kana-kanji (japanese syllabary-chinese character) conversion processing device |
JPS61208164A (en) * | 1985-03-12 | 1986-09-16 | Agency Of Ind Science & Technol | Display system of proofreading device for japanese document |
JPS6272082A (en) * | 1985-09-25 | 1987-04-02 | Toshiba Corp | Image inputting device |
-
1993
- 1993-09-28 JP JP5240977A patent/JP2870375B2/en not_active Expired - Lifetime
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6039228A (en) * | 1983-08-11 | 1985-03-01 | Ricoh Co Ltd | Kana-kanji (japanese syllabary-chinese character) conversion processing device |
JPS61208164A (en) * | 1985-03-12 | 1986-09-16 | Agency Of Ind Science & Technol | Display system of proofreading device for japanese document |
JPS6272082A (en) * | 1985-09-25 | 1987-04-02 | Toshiba Corp | Image inputting device |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9665559B2 (en) | 1998-01-27 | 2017-05-30 | Kinigos, Llc | Word checking tool for selectively filtering text documents for undesirable or inappropriate content as a function of target audience |
JP2014225172A (en) * | 2013-05-17 | 2014-12-04 | 日本電気株式会社 | Document analysis system, method, and program |
JP2017215734A (en) * | 2016-05-31 | 2017-12-07 | 京セラドキュメントソリューションズ株式会社 | Image forming apparatus and image forming method |
Also Published As
Publication number | Publication date |
---|---|
JP2870375B2 (en) | 1999-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH07325828A (en) | Grammar checking system | |
JPH09259125A (en) | Document creation support system and term dictionary | |
US10936825B1 (en) | Methods and apparatus to improve disambiguation and interpretation in automated text analysis using transducers applied on a structured language space | |
JP2870375B2 (en) | Sentence correction device | |
JPS61156466A (en) | Word extracting system | |
JP2001137788A (en) | Place name notation dictionary creation method and place name notation dictionary creation device | |
JP3329476B2 (en) | Kana-Kanji conversion device | |
JPH08190561A (en) | Document correction device | |
JP3132058B2 (en) | Document inspection device | |
JPS62145463A (en) | Kana/kanji (japanese syllabary/chinese character) conversion system | |
JPH03233669A (en) | Document preparing device | |
JPH08249331A (en) | Document processor | |
JPH07129577A (en) | Document proofreading supporting device | |
JPH06149791A (en) | Kanji sentence input device | |
JPH0696117A (en) | Document change support system | |
JPH07160714A (en) | Japanese sentence proofreading device | |
JPH07295983A (en) | Method for supporting sentence proofreading and device therefor | |
JPH0785038A (en) | Document preparation device and paste processing | |
JPH01281561A (en) | Method for extracting japanese sentence correcting candidate character | |
JPH08106460A (en) | Input error automatic repair device | |
JPH05233619A (en) | Method for correcting error of japanese language sentence and device therefor | |
JPS6029823A (en) | Adaptive symbol string conversion method | |
JPH08329068A (en) | Method and device for processing character string | |
JPS5899829A (en) | Erroneous character detection and correction backing device | |
JPH0682366B2 (en) | Character string correction method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080108 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090108 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100108 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110108 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110108 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120108 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130108 Year of fee payment: 14 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130108 Year of fee payment: 14 |
|
EXPY | Cancellation because of completion of term |