JPH10187724A - Method and device for assisting document preparation - Google Patents

Method and device for assisting document preparation

Info

Publication number
JPH10187724A
JPH10187724A JP8347430A JP34743096A JPH10187724A JP H10187724 A JPH10187724 A JP H10187724A JP 8347430 A JP8347430 A JP 8347430A JP 34743096 A JP34743096 A JP 34743096A JP H10187724 A JPH10187724 A JP H10187724A
Authority
JP
Japan
Prior art keywords
numerical
counting
unit
expression
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8347430A
Other languages
Japanese (ja)
Inventor
Noriko Koyama
紀子 小山
Yukihiro Fukunaga
幸弘 福永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba AVE Co Ltd
Original Assignee
Toshiba Corp
Toshiba AVE Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba AVE Co Ltd filed Critical Toshiba Corp
Priority to JP8347430A priority Critical patent/JPH10187724A/en
Publication of JPH10187724A publication Critical patent/JPH10187724A/en
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

PROBLEM TO BE SOLVED: To detect an error in numerical expression by performing a document analysis, specially, an analysis of units of counting way for words from meaning relation between words. SOLUTION: A word division part 104 divides a sentence inputted from an input part 101 into words and a word relation analysis part 106 analyzes modification relations among the divided words. A numerical relation extraction part 108 extracts a numerical expression having a relation of counting a number from the modification relations of the respective words. A numerical expression error detection part 109 refers to counting way information (including units or ways of counting and conditions of numerals when the units are used) registered in a counting way storage part 107 corresponding to words counting numbers in the extracted numeric expression to detect an auxiliary numeral when units of ways of counting match each other or a numeral limit error unless the represented numerical meets numeral conditions although the unit of counting way match with each other.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、文書の作成を支援
する文書作成支援方法及び装置に係り、特に単語の数え
方の表現の誤りを検出するのに好適な文書作成支援方法
及び装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document creation support method and apparatus for supporting document creation, and more particularly to a document creation support method and apparatus suitable for detecting an error in the expression of a word count.

【0002】[0002]

【従来の技術】近年、日本語ワードプロセッサなどの文
書入力装置、或いはパーソナルコンピュータ等に読み込
んで実行可能な日本語文書作成ソフトウェア(いわゆる
日本語ワープロソフト)の普及に伴い、文書の作成が、
従来の手書きから電子的な手段によることが多くなって
きている。しかし、電子的な手段が提供されているの
は、主として文章を入力する手段であり、入力すべき文
章を考えるのは未だに人間に頼っているのが現状であ
る。
2. Description of the Related Art In recent years, with the spread of Japanese document creation software (so-called Japanese word processing software) that can be read and executed by a document input device such as a Japanese word processor or a personal computer, the creation of documents has become difficult.
The use of electronic means instead of conventional handwriting is increasing. However, electronic means are mainly provided for inputting sentences, and at present, human beings still consider the sentences to be input.

【0003】そこで、近年のワードプロセッサやそれに
類する文書入力装置(或いはワープロソフト)には、人
間が文章を考える際に有用な情報や、作成された文章が
より間違いのない文章になるように、支援する機能が設
けられているものがある。入力された文章を解析して、
その誤りを見つける機能も、その一つである。
[0003] In recent years, word processors and similar document input devices (or word processing software) have been provided with information useful for humans to think about sentences, and for helping created sentences to be more accurate. Some are provided with a function to perform Analyze the input text,
The function to find the error is one of them.

【0004】[0004]

【発明が解決しようとする課題】しかしながら、上記し
た従来技術においては、特定の単語から得られる情報を
用いたものであったため、その単語一つでは分からない
言葉の使用誤りを検出するのが難しいという問題があっ
た。特に、日本語文章のように数の数え方(の単位)が
単語によって異なる場合には問題であった。
However, in the above-mentioned prior art, since information obtained from a specific word is used, it is difficult to detect a use error of a word that cannot be understood by one word alone. There was a problem. In particular, there is a problem in the case where the counting method (unit) differs for each word as in Japanese sentences.

【0005】本発明は上記事情を考慮してなされたもの
でその目的は、単語と単語の意味的な係わりからの文章
解析、特に単語の数え方の単位の解析を行い、その数値
表現の誤りを検出する文書作成支援方法及び装置を提供
することにある。
The present invention has been made in consideration of the above circumstances, and has as its object to analyze a sentence based on the semantic relation between words and words, in particular, to analyze units of counting of words, and to make an error in the numerical expression thereof. It is an object of the present invention to provide a document creation support method and device for detecting a document.

【0006】[0006]

【課題を解決するための手段】本発明は、数値表現の対
象となり得る単語毎に、その数え方の情報を記憶手段
(数え方記憶手段)に登録しておき、入力文中の数値表
現の誤りを検出する際には、上記入力文を単語単位に分
割し、その分割した各単語の係り受けの関係を解析する
ことで、数を数えている関係を持つ数値表現を抽出し、
この抽出した数値表現毎に、その数値表現中の単語に対
応する記憶手段内の数え方情報を参照することで、誤り
のある数値表現を検出するようにしたことを特徴とす
る。
SUMMARY OF THE INVENTION According to the present invention, for each word that can be a numerical expression, information on how to count is registered in a storage means (counting storage means), and an error in a numerical expression in an input sentence is stored. When detecting the input sentence, the input sentence is divided into words, and the relation of the dependency of each of the divided words is analyzed to extract a numerical expression having a relation of counting the number,
For each of the extracted numerical expressions, an erroneous numerical expression is detected by referring to the counting information in the storage means corresponding to the word in the numerical expression.

【0007】本発明においては、数値表現の対象となり
得る各単語、即ち数を数えられる各単語(名詞)に対応
して、その数え方の情報を予め記憶手段に登録しておく
ことで、入力文を解析して数を数えている関係を持つ数
値表現を抽出し、その数値表現中の単語(数えられる単
語)についての数え方情報を参照するだけで、その単語
を用いた数え方の表現が数え方情報の示す数え方から外
れた表現であるか否か、即ち抽出した数値表現が誤って
いるか否かを簡単に判定することができる。
[0007] In the present invention, the information of the counting method is registered in advance in the storage means in correspondence with each word which can be a target of numerical expression, that is, each word (noun) whose number can be counted, so that the input can be performed. A sentence is analyzed to extract a numerical expression having a relationship that counts the number, and by simply referring to the counting information about the word (the word that can be counted) in the numerical expression, an expression of the counting method using the word is obtained. Can be easily determined whether the expression is out of the counting method indicated by the counting information, that is, whether the extracted numerical expression is incorrect.

【0008】このように本発明においては、入力文の中
から、記憶手段に登録されている数え方情報の示す数え
方とは異なる数え方がされている単語(数えられる単
語)を持つ数値表現を誤りとして検出できる。
As described above, in the present invention, a numerical expression having a word (a word that can be counted) that is counted from the input sentence differently from the counting method indicated by the counting information registered in the storage means. Can be detected as an error.

【0009】ここで、上記数え方情報に、対応する単語
の数え方の単位(助数詞)を持たせるならば、間違えた
単位で数を数えている数値表現箇所を誤りとして検出で
きる。
Here, if the counting information has a unit (numerical number) for counting the corresponding word, it is possible to detect an error in the numerically expressed portion where the number is counted in the wrong unit.

【0010】また、上記数え方情報に、対応する単語の
数え方の単位とその単位を用いるときの数値の条件を持
たせるならば、入力文中から数を数えている関係を持つ
数値表現が抽出された場合に、その数値表現中の単語
(数えられる単語)についての数え方情報を参照するこ
とで、数え方の単位が間違っているか否かだけでなく、
数え方の単位は間違っていないが、表現された数値が数
値条件(例えば数値の大きさや桁数)を満たしていない
誤りのある数値表現であるか否かを判定できる。
In addition, if the counting information has a unit for counting the corresponding word and a numerical condition when the unit is used, a numerical expression having a relation of counting the number from the input sentence is extracted. In this case, by referring to the counting information for the words (words that can be counted) in the numerical expression, it is possible to determine whether or not the counting unit is incorrect,
Although the unit of counting is not wrong, it can be determined whether or not the expressed numerical value is an erroneous numerical expression that does not satisfy numerical conditions (for example, the size and number of digits of the numerical value).

【0011】このように本発明においては、数を数えら
れる単語によっては、それに用いられる数値の大きさや
桁に制限がある場合があることに着目し、そのような制
限を条件(数値条件)として、その単語の数え方情報に
持たせることで、正しい単位を用いていても条件に合致
しない数値を用いた数値表現箇所を誤り(数値制限誤
り)として検出することができる。
As described above, in the present invention, attention is paid to the fact that, depending on the number of words that can be counted, there are cases where the size and digits of numerical values used for the words are limited, and such restrictions are set as conditions (numerical conditions). By giving the word counting information, even if the correct unit is used, a numerical expression portion using a numerical value that does not match the condition can be detected as an error (numerical limit error).

【0012】また、上記数え方情報に、対応する単語の
数え方の単位とその単位を用いるときの数値の条件の他
に、その条件から外れている場合に推奨する表現を生成
するための推奨表現規則を持たせるならば、数え方の単
位は間違っていないものの、条件に合致しない数値を用
いた数値表現が誤りとして検出された場合に、その誤り
検出に用いられた数え方情報中の推奨表現規則に従って
推奨する数値表現を生成することができる。ここで、推
奨表現規則には、使用する単位(助数詞)と、(その単
位を用いた際の数値条件に合致するのに必要な)数値桁
のシフト数を持たせるとよい。
Further, in the counting information, in addition to a unit for counting the corresponding word and a numerical condition when the unit is used, a recommendation for generating an expression recommended when the condition is not satisfied. If there is an expression rule, if the unit of counting is not wrong, but a numerical expression using a numerical value that does not meet the conditions is detected as an error, the recommendation in the counting information used for the error detection Recommended numerical expressions can be generated according to expression rules. Here, the recommended expression rule may include a unit to be used (a classifier) and a shift number of a numerical digit (necessary to satisfy a numerical condition when the unit is used).

【0013】[0013]

【発明の実施の形態】以下、本発明の実施の形態につき
図面を参照して説明する。 [第1の実施形態]図1は本発明の第1の実施形態に係
る文書作成支援装置の機能構成を示すブロック図である
図1の文書作成支援装置は、入力部101、制御部10
2、出力部103、単語分割部104、辞書記憶部10
5、単語関係解析部106、数え方記憶部107、数値
関係抽出部108、及び数値表現誤り検出部109から
構成される。
Embodiments of the present invention will be described below with reference to the drawings. [First Embodiment] FIG. 1 is a block diagram showing a functional configuration of a document creation support apparatus according to a first embodiment of the present invention. The document creation support apparatus shown in FIG.
2, output unit 103, word division unit 104, dictionary storage unit 10
5. It comprises a word relation analysis unit 106, a counting method storage unit 107, a numerical relation extraction unit 108, and a numerical expression error detection unit 109.

【0014】入力部101は、文書作成支援の対象とな
る文字列、更に具体的に述べるならば単語の数え方の誤
りの検出対象となる文字列(或いは文字列からなる文
書)を入力するのに用いられる。入力部101は、例え
ばキーボード、磁気ディスク装置、通信回線等である。
The input unit 101 inputs a character string to be supported for document creation, more specifically, a character string (or a document composed of character strings) to be detected as an error in how to count words. Used for The input unit 101 is, for example, a keyboard, a magnetic disk device, a communication line, or the like.

【0015】制御部102は、装置全体の制御を司る。
出力部103は、入力部101により入力された文字
列、及び単語の数え方の誤りの検出結果の出力等に用い
られる。出力部103は、例えば液晶ディスプレイ、C
RTディスプレイ等の表示装置である。
The control unit 102 controls the entire apparatus.
The output unit 103 is used, for example, to output a character string input by the input unit 101 and a detection result of an error in how to count words. The output unit 103 is, for example, a liquid crystal display, C
It is a display device such as an RT display.

【0016】単語分割部104は、入力部101により
入力された文字列を解析して単語単位に分割する。解析
辞書記憶部105は、単語分割部104による単語解析
に用いられる解析辞書105aを予め記憶しておくもの
である。解析辞書105aは、各単語について、その見
出し(表記)、品詞、活用形等を持つ。
The word dividing unit 104 analyzes the character string input by the input unit 101 and divides the character string into words. The analysis dictionary storage unit 105 stores an analysis dictionary 105a used for word analysis by the word division unit 104 in advance. The analysis dictionary 105a has, for each word, its heading (notation), part of speech, inflected form, and the like.

【0017】単語関係解析部106は、単語分割部10
4により分割された単語と単語の係り受けの関係を解析
する。数え方記憶部107は、数値表現の対象となり得
る(数えられる)単語(名詞)とその単語の数え方の単
位(助数詞)を含む数え方情報の組を種々の数えられる
単語について登録したテーブル(数え方情報テーブル)
107aを予め記憶しておくものである。この数え方情
報には、助数詞で決まる使用数字の表記文字種(例えば
算用数字を用いるか漢数字を用いるかなど)を含めるこ
とが可能である。また数え方情報には、助数詞によって
は、その助数詞を使用するときの数値(数値範囲)の条
件(付加条件)なども含まれてる。この数え方記憶部1
07の内容(数え方情報テーブル107aの登録内容)
例を図2に示す。
The word relation analysis unit 106 includes the word division unit 10
The relationship between the word divided by step 4 and the dependency of the word is analyzed. The counting method storage unit 107 registers a set of counting information including a word (noun) that can be a target (numerable) of a numerical expression and a unit (numerical number) of the counting method for various counting words. Counting information table)
107a is stored in advance. This counting information can include the character type of the used numeral determined by the classifier (for example, whether to use arithmetic numerals or Chinese numerals). Depending on the classifier, the counting information includes a condition (additional condition) of a numerical value (a numerical range) when the classifier is used. This counting storage unit 1
07 (registered contents of counting information table 107a)
An example is shown in FIG.

【0018】数値関係抽出部108は、単語関係解析部
の解析結果(単語間の係り受け関係)から、数を数えて
いる関係を持つ表現(数値表現)を抽出する。数値表現
誤り検出部109は、数値関係抽出部108により抽出
された数値表現が正しいか否かを数え方記憶部107の
内容(数え方情報テーブル107aの登録内容)をもと
に判定する。
The numerical relationship extracting unit 108 extracts an expression (numerical expression) having a number counting relationship from the analysis result of the word relationship analyzing unit (dependency relationship between words). The numerical expression error detecting unit 109 determines whether the numerical expression extracted by the numerical relationship extracting unit 108 is correct based on the contents of the counting storage unit 107 (registered contents of the counting information table 107a).

【0019】次に図1の構成の文書作成支援装置の動作
について、その概要から説明する。まず入力部101か
ら、入力文となる文字列が入力される。この入力文は、
制御部102を介して単語分割部104に渡される。単
語分割部104は、この入力文(入力文字列)を解析辞
書記憶部105上の解析辞書105aに従って解析(形
態素解析)し、最も自然な単語単位に分割する。このと
き単語分割部104は、分割した単語に対し、解析辞書
105aから得られる当該単語の品詞、活用形などの情
報を付加する。この単語分割部104による入力文字列
(入力文)に対する単語分割結果を、入力文字列が「彼
女は本を2冊買った。」の場合を例に図3に示す。図3
中の記号“/”は単語単位への分割位置を示す。
Next, the operation of the document creation support apparatus having the configuration shown in FIG. 1 will be described from its outline. First, a character string serving as an input sentence is input from the input unit 101. This input statement is
It is passed to the word division unit 104 via the control unit 102. The word division unit 104 analyzes (morphologically analyzes) the input sentence (input character string) according to the analysis dictionary 105a in the analysis dictionary storage unit 105, and divides the sentence into the most natural word units. At this time, the word division unit 104 adds information such as the part of speech and the inflected form of the word obtained from the analysis dictionary 105a to the divided word. FIG. 3 shows the result of word division performed on the input character string (input sentence) by the word division unit 104, taking as an example the case where the input character string is "She bought two books." FIG.
The symbol “/” in the inside indicates the division position into word units.

【0020】単語分割部104による単語分割結果は単
語関係解析部106に渡される。単語関係解析部106
は、この単語分割結果を受け取ると、分割された各単語
の単語間の係り受けの関係を解析する。図3の単語分割
結果を対象に単語相互間の係り受け関係を解析した結果
を図4に示す。
The result of the word division by the word division unit 104 is passed to the word relation analysis unit 106. Word relation analysis unit 106
Receives the result of the word division and analyzes the dependency relationship between the words of each divided word. FIG. 4 shows the result of analyzing the dependency relationship between words with respect to the word segmentation result of FIG.

【0021】単語関係解析部106による単語間の係り
受け関係の解析結果は数値関係抽出部108に渡され
る。数値関係抽出部108は、単語関係解析部106に
より解析された単語相互間の関係のうち、数を数えてい
る関係を持つ表現(図4の例では、本と冊、2と冊)を
抽出する。
The result of the analysis of the dependency relationship between words by the word relationship analysis unit 106 is passed to the numerical relationship extraction unit 108. The numerical relationship extracting unit 108 extracts expressions having a counting relationship (in the example of FIG. 4, book and book 2, book 2) from among the words analyzed by the word relationship analyzing unit 106. I do.

【0022】数値関係抽出部108により抽出された数
を数えている関係を持つ表現は数値表現誤り検出部10
9に渡される。数値表現誤り検出部109は、この数を
数えている関係を持つ表現、即ち数え方の表現(数値表
現)を受け取ると、その数え方の表現を、数え方記憶部
107上の数え方情報テーブル107aに登録されてい
る各数え方情報と順次照合することにより、その数え方
の表現が誤っていないか否かを判定して、誤りを検出す
る。
The expression having the relation counting the number extracted by the numerical relation extracting unit 108 is the numerical expression error detecting unit 10.
9 passed. Upon receiving the expression having the relationship of counting the numbers, that is, the expression of the counting (numeric expression), the numerical expression error detecting unit 109 converts the expression of the counting into the counting information table in the counting storage unit 107. By sequentially collating with the counting method information registered in 107a, it is determined whether or not the expression of the counting method is erroneous, and an error is detected.

【0023】数値表現誤り検出部109により検出され
た数え方の表現に対する誤り検出結果は制御部102に
渡される。制御部102は、この誤り検出結果を出力部
103に出力して例えば画面表示することでユーザに提
示する。
The error detection result for the expression of counting detected by the numerical expression error detecting unit 109 is passed to the control unit 102. The control unit 102 outputs this error detection result to the output unit 103 and presents it to the user by, for example, displaying it on a screen.

【0024】ここで、数値表現誤り検出部109による
数値表現誤り検出処理の詳細を図5のフローチャートを
参照して説明する。数値表現誤り検出部109は、単語
関係解析部106により解析された単語相互間の関係の
うち、数値関係抽出部108により抽出された各々の数
値表現に対して、次の処理を行う。
Here, the details of the numerical expression error detection processing by the numerical expression error detection unit 109 will be described with reference to the flowchart of FIG. The numerical expression error detecting unit 109 performs the following process on each numerical expression extracted by the numerical relationship extracting unit 108 among the relationships between words analyzed by the word relationship analyzing unit 106.

【0025】まず、数え方記憶部107上の数え方情報
テーブル107aを検索し、数値関係抽出部108によ
り抽出された数値表現中の数えられる単語に対する数え
方情報(抽出された数値表現中の数えられる単語に一致
する単語に対応する数え方情報)があるか否かを調べる
(ステップ51)。
First, the counting information table 107a in the counting storage unit 107 is searched, and counting information for the countable words in the numerical expression extracted by the numerical relationship extracting unit 108 (counting in the extracted numerical expression). It is checked whether or not there is counting information corresponding to a word that matches the word to be obtained (step 51).

【0026】もし該当する数え方情報がない場合には、
そのまま誤りではないと判断する(ステップ57)。こ
れに対し数え方情報があった場合には、数値関係抽出部
108により抽出された数値表現中の助数詞と該当する
数え方情報中の助数詞とが一致しているか否か、即ち助
数詞が正しいか否かをチェックする(ステップ52)。
If there is no corresponding counting information,
It is determined that it is not an error as it is (step 57). On the other hand, if there is counting information, whether the classifier in the numerical expression extracted by the numerical relationship extraction unit 108 matches the classifier in the corresponding counting information, that is, whether the classifier is correct It is checked whether or not there is (step 52).

【0027】ここで助数詞が正しくない場合には、「助
数詞誤り」として誤り検出する(ステップ53)。これ
に対し助数詞が正しい場合には、該当する数え方情報中
に数値条件(付加条件)があるか否かを調べ(ステップ
54)、数値条件がないときには、誤りではないとする
(ステップ57)。
If the classifier is incorrect, an error is detected as a "classifier error" (step 53). On the other hand, if the classifier is correct, it is checked whether there is a numerical condition (additional condition) in the corresponding counting information (step 54), and if there is no numerical condition, it is determined that there is no error (step 57). .

【0028】一方、数値条件がある場合には、数値関係
抽出部108により抽出された数値表現中の助数詞と数
値の関係が数値条件に合致しているか否かを調べる(ス
テップ55)。即ち、数値条件には、図2の例のよう
に、その助数詞を使うときの数値の大きさや桁の制限が
記述されているため、抽出された入力文の数値表現の数
値がそれに合致するか否かを判定する。
On the other hand, if there is a numerical condition, it is checked whether or not the relationship between the classifier and the numerical value in the numerical expression extracted by the numerical relation extracting unit 108 matches the numerical condition (step 55). That is, as in the numerical condition, as in the example of FIG. 2, the size of the numerical value when using the classifier and the restriction on the number of digits are described, so that the numerical value of the numerical expression of the extracted input sentence matches it? Determine whether or not.

【0029】合致していれば、そのまま誤りなしとし
(ステップ57)、合致していなければ、「数値制限誤
り」とする(ステップ56)。次に、以上に述べた図1
の文書作成支援装置による入力文(入力文字列)を対象
とする数値表現(数え方の単位)の検査についての具体
例を図6を参照して説明する。
If they match, it is determined that there is no error (step 57), and if they do not match, it is determined that "numerical limit error" has occurred (step 56). Next, FIG.
With reference to FIG. 6, a description will be given of a specific example of inspection of a numerical expression (unit of counting) for an input sentence (input character string) by the document creation support device of the present invention.

【0030】まず、入力部101から入力文として「2
000メガバイトのメモリ」と入力され、単語分割部1
04により、図6(a)のように単語分割が行われてい
るとする。更に、単語関係解析部106、数値関係抽出
部108により、図6(b)のような数値関係が抽出さ
れているとする。
First, “2” is input from the input unit 101 as an input sentence.
000 megabytes of memory "
04, word division is performed as shown in FIG. Further, it is assumed that a numerical relationship as shown in FIG. 6B has been extracted by the word relationship analyzing unit 106 and the numeric relationship extracting unit 108.

【0031】数値表現誤り検出部109は、数え方記憶
部107上の数え方情報テーブル107aの登録情報
(図2参照)を参照して、「メモリ」という単語は「バ
イト」「キロバイト」「メガバイト」「個」などの数え
方をすることを認識する。この例では、助数詞には「メ
ガバイト」が使われているため、助数詞の使い方として
は間違っていない。
The numerical expression error detecting unit 109 refers to the registration information (see FIG. 2) of the counting information table 107a in the counting storage unit 107, and finds that the word "memory" is "byte", "kilobyte", "megabyte". Recognize how to count "individual". In this example, the use of the classifier is correct because "megabyte" is used for the classifier.

【0032】しかし、図2の数え方情報テーブル107
aの登録情報から明らかなように、助数詞「メガバイ
ト」を用いる場合の数値範囲は3桁までという数値条件
があることから、上記入力文「2000メガバイトのメ
モリ」中の「2000」という4桁の数値は当該条件に
合わない。よって数値表現誤り検出部109は、この4
桁の数値「2000」を含む「2000メガバイト」と
いう数値表現を「数値制限誤り」(ステップ56)とし
て検出する。
However, the counting information table 107 shown in FIG.
As is clear from the registration information of a, since the numerical range when using the classifier "megabyte" has a numerical condition of up to 3 digits, the 4-digit "2000" in the input sentence "2000 megabyte memory" is used. The figures do not meet the conditions. Therefore, the numerical expression error detecting unit 109 calculates
The numerical expression "2000 megabytes" including the digit number "2000" is detected as "numerical limit error" (step 56).

【0033】図6(c)は同様に、入力文が「2000
個のメモリ」であった場合の(単語関係解析部106、
数値関係抽出部108により抽出された)数値関係を示
す。この例では、助数詞も正しく、数値条件にも合致す
るため、「誤りなし」(ステップ57)となる。更に図
6(d)は入力文が「2000冊のメモリ」であった場
合の数値関係を示すもので、これは用いる助数詞が違う
ため、「助数詞誤り」(ステップ53)となる。 [第2の実施形態]次に、本発明の第2の実施形態につ
き図面を参照して説明する。
FIG. 6C similarly shows that the input sentence is "2000".
(Word relation analysis unit 106,
The numerical relationship (extracted by the numerical relationship extracting unit 108) is shown. In this example, since the classifier is correct and also satisfies the numerical condition, the result is "no error" (step 57). Further, FIG. 6D shows a numerical relationship when the input sentence is "2000 memories". Since this uses a different classifier, the result is "Error in classifier" (step 53). [Second Embodiment] Next, a second embodiment of the present invention will be described with reference to the drawings.

【0034】図7は本発明の第2の実施形態に係る文書
作成支援装置の機能構成を示すブロック図であり、図1
と同一部分には同一符号を付して説明を省略する。図7
の文書作成支援装置の構成が図1の文書作成支援装置と
異なる点は、数え方記憶部107上の数え方情報テーブ
ル107aに代わる数え方情報テーブル707aと、数
値表現誤り検出部109に代わる数値表現誤り検出部7
09とを備えると共に、(数値表現誤り検出部709に
より)「数値制限誤り」と判定された表現をもとに推奨
する表現を生成する推奨表現生成部710を新たに備え
たことである。
FIG. 7 is a block diagram showing a functional configuration of a document creation support device according to the second embodiment of the present invention.
The same parts as those in FIG. FIG.
1 is different from the document creation support device of FIG. 1 in that a counting method information table 707a in place of the counting information table 107a in the counting storage unit 107 and a numeric value in place of the numerical expression error detection unit 109 Expression error detector 7
09, and a new recommended expression generation unit 710 that generates a recommended expression based on the expression determined to be “numeric restriction error” (by the numerical expression error detection unit 709).

【0035】数え方情報テーブル707aは、数値表現
の対象となり得る(数えられる)単語(名詞)とその単
語の数え方の単位(助数詞)を含む数え方情報の組を種
々の数えられる単語について登録したテーブルであり、
助数詞によっては、その助数詞を使用するときの数値
(数値範囲)の条件(付加条件)なども対応付けて登録
してある点では図1中の数え方情報テーブル107aと
同様である。数え方情報テーブル707aが数え方情報
テーブル1107aと異なる点は、数値条件が付加され
ている数え方情報には、その数値条件に合致しない数値
表現、即ち数値範囲を越えた数値表現の場合に、どう表
現するのが妥当かを示す情報、即ち推奨する表現を示す
情報(推奨表現規則)が更に付加されていることであ
る。この数え方情報テーブル707aの登録内容例を図
8に示す。
The counting information table 707a registers a group of counting information including a word (noun) which can be an object of numerical expression (can be counted) and a unit of counting of the word (numerical number) for various counting words. Table
It is the same as the counting information table 107a in FIG. 1 in that, depending on the classifier, the condition (additional condition) of a numerical value (numerical range) when the classifier is used is registered in association with the classifier. The counting information table 707a is different from the counting information table 1107a in that the counting information to which a numerical condition is added has a numerical expression that does not match the numerical condition, that is, a numerical expression that exceeds the numerical range. That is, information indicating how appropriate the expression is, that is, information indicating a recommended expression (recommended expression rule) is further added. FIG. 8 shows an example of the registered contents of the counting information table 707a.

【0036】数値表現誤り検出部709は、数値関係抽
出部108により抽出された数値表現が正しいか否かを
数え方記憶部107の内容(数え方情報テーブル707
aの登録内容)をもとに判定する点では図1中の数値表
現誤り検出部109と同様である。数値表現誤り検出部
709が数値表現誤り検出部109と異なる点は、誤っ
た表現が(「助数詞誤り」ではなくて)「数値制限誤
り」であった場合に、数え方情報テーブル707a上の
対応する推奨表現規則を推奨表現生成部710に渡して
(その表現に代わる)推奨する表現を生成することを要
求することである。
The numerical expression error detecting section 709 counts whether or not the numerical expression extracted by the numerical relation extracting section 108 is correct.
This is the same as the numerical expression error detection unit 109 in FIG. The difference between the numerical expression error detection unit 709 and the numerical expression error detection unit 109 is that when the erroneous expression is “numeric limit error” (instead of “numeric classifier error”), the correspondence in the counting method information table 707a Is passed to the recommended expression generation unit 710 to request generation of a recommended expression (instead of the expression).

【0037】次に、図7の構成の文書作成支援装置の動
作について、その概要から説明する。まず、入力部10
1により入力文となる文字列が入力されてから、その入
力文を単語分割部104により単語単位に分割し、その
単語分割の結果をもとに単語関係解析部106により単
語相互間の係り受けの関係を解析し、その解析された単
語相互間の関係のうち、数を数えている関係を持つ表現
を数値関係抽出部108により抽出するまでの動作は、
図1の構成の文書作成支援装置における動作と同様であ
る。
Next, the operation of the document creation support device having the configuration shown in FIG. 7 will be described from its outline. First, the input unit 10
1, the input sentence is input, and then the input sentence is divided into words by the word division unit 104, and the inter-word relations are determined by the word relation analysis unit 106 based on the result of the word division. The operation up to the point where the numerical relationship extracting unit 108 extracts the expression having the relationship of counting the number of the analyzed relationships between the words,
The operation is the same as that in the document creation support device having the configuration shown in FIG.

【0038】数値表現誤り検出部709は、数値関係抽
出部108により数を数えている関係を持つ表現、即ち
数え方の表現(数値表現)が抽出されると、その数え方
の表現を、数え方記憶部107上の数え方情報テーブル
707aに登録されている各数え方情報と順次照合する
ことにより、その数え方の表現が誤っていないか否かを
判定して、誤りを検出する。ここで誤りが検出され、し
かも数値条件に当てはまらない「数値制限誤り」である
場合には、数値表現誤り検出部709は推奨表現生成部
710に対し、「数値制限誤り」となった数え方の表現
(をなす数値及び助数詞)と、「数値制限誤り」の判定
に用いられた数値条件に対応して数え方情報テーブル7
07aに登録されている推奨表現規則とを推奨表現生成
部710に渡し、「数値制限誤り」となった数え方の表
現に代わる妥当な表現を生成するように推奨表現生成部
710に要求する。
When the numerical relationship extracting unit 108 extracts an expression having a number counting relationship, that is, a numerical expression (numerical expression), the numerical expression error detecting unit 709 counts the counted expression. By sequentially checking the counting method information registered in the counting information table 707a on the method storage unit 107, it is determined whether or not the expression of the counting method is incorrect, and an error is detected. Here, when an error is detected and the numerical expression error is a “numeric restriction error” that does not satisfy the numerical condition, the numerical expression error detection unit 709 instructs the recommended expression generation unit 710 to count the “numeric restriction error”. Counting information table 7 corresponding to the expression (a numerical value and a classifier) and the numerical condition used for the determination of the “numeric limit error”
The recommended expression rule registered in 07a is passed to the recommended expression generation unit 710, and a request is made to the recommended expression generation unit 710 to generate an appropriate expression that replaces the expression of the numbering that has become “numerical limit error”.

【0039】これを受けて推奨表現生成部710は、
「数値制限誤り」となった数え方の表現をなす数値及び
助数詞を、数値表現誤り検出部709から渡された推奨
表現規則に従って変更することで推奨する表現を生成
し、制御部102に渡す。
In response to this, the recommended expression generation unit 710
A recommended expression is generated by changing a numerical value and a classifier that represent the expression of “numerical restriction error” in accordance with the recommended expression rule passed from the numerical expression error detection unit 709, and passed to the control unit 102.

【0040】制御部102は、推奨表現生成部710の
生成した推奨する表現を出力部103に出力して例えば
画面表示することでユーザに提示する。ここで、数値表
現誤り検出部709による数値表現誤り検出処理並びに
当該検出処理で誤りが検出された場合の後処理の詳細を
図9のフローチャートを参照して説明する。
The control unit 102 outputs the recommended expressions generated by the recommended expression generation unit 710 to the output unit 103 and presents them to the user by, for example, displaying them on a screen. Here, the details of the numerical expression error detection processing by the numerical expression error detection unit 709 and the post-processing when an error is detected in the detection processing will be described with reference to the flowchart of FIG.

【0041】数値表現誤り検出部709は、単語関係解
析部106により解析された単語相互間の関係のうち、
数値関係抽出部108により抽出された各々の数値表現
に対して、次の処理を行う。
Numerical expression error detecting section 709 determines the relation between words analyzed by word relation analyzing section 106.
The following processing is performed on each numerical expression extracted by the numerical relationship extracting unit 108.

【0042】まず、数え方記憶部107上の数え方情報
テーブル707aを検索し、数値関係抽出部108によ
り抽出された数値表現中の数えられる単語に対する数え
方情報があるか否かを調べる(ステップ91)。
First, the counting information table 707a on the counting storage unit 107 is searched to determine whether there is counting information for the countable word in the numerical expression extracted by the numerical relationship extracting unit 108 (step). 91).

【0043】もし該当する数え方情報がない場合には、
そのまま誤りではないと判断する(ステップ97)。こ
れに対し数え方情報があった場合には、数値関係抽出部
108により抽出された数値表現中の助数詞と該当する
数え方情報中の助数詞とが一致しているか否か、即ち助
数詞が正しいか否かをチェックする(ステップ92)。
If there is no corresponding counting information,
It is determined that it is not an error as it is (step 97). On the other hand, if there is counting information, whether the classifier in the numerical expression extracted by the numerical relationship extraction unit 108 matches the classifier in the corresponding counting information, that is, whether the classifier is correct It is checked whether or not it is (step 92).

【0044】ここで助数詞が正しくない場合には、「助
数詞誤り」として誤り検出する(ステップ93)。これ
に対し助数詞が正しい場合には、該当する数え方情報に
数値条件が付加されているか否かを調べ(ステップ9
4)、数値条件がないときには、誤りではないとする
(ステップ97)。
If the classifier is incorrect, an error is detected as a "classifier error" (step 93). On the other hand, if the classifier is correct, it is checked whether a numerical condition is added to the corresponding counting information (step 9).
4) If there is no numerical condition, it is determined that there is no error (step 97).

【0045】一方、数値条件が付加されている場合に
は、数値関係抽出部108により抽出された数値表現中
の助数詞と数値の関係が数値条件に合致しているか否か
を調べる(ステップ95)。
On the other hand, when the numerical condition is added, it is checked whether or not the relation between the classifier and the numerical value in the numerical expression extracted by the numerical relation extracting unit 108 matches the numerical condition (step 95). .

【0046】合致していれば、そのまま誤りなしとし
(ステップ97)、合致していなければ、「数値制限誤
り」とする(ステップ96)。数値表現誤り検出部70
9は、「数値制限誤り」として数値表現の誤りを検出し
た場合、数え方情報テーブル707a中の該当する数え
方情報に数値条件と共に付加されている推奨表現規則を
取り出し、「数値制限誤り」と判定した数値表現をなす
数値及び助数詞と共に推奨表現生成部710に渡して、
推奨する表現の生成を要求する。
If they match, it is determined that there is no error (step 97), and if they do not match, it is determined that "numerical limit error" has occurred (step 96). Numerical expression error detection unit 70
9 detects a numerical expression error as a “numerical restriction error”, extracts a recommended expression rule added to the corresponding counting information in the counting information table 707a together with a numerical condition, and It is passed to the recommended expression generation unit 710 together with the numerical value and the classifier forming the determined numerical expression,
Request generation of recommended expressions.

【0047】すると推奨表現生成部710は、数値表現
誤り検出部709から受け取った数値及び助数詞のうち
の数値を、当該数値表現誤り検出部709から受け取っ
た推奨表現規則の指定する桁数だけずらすと共に、助数
詞を、当該推奨表現規則の指定する助数詞に変更するこ
とで、「数値制限誤り」と判定された数値表現に代わる
推奨する表現を生成(取得)する(ステップ98)。そ
して推奨表現生成部710は、生成した推奨する表現を
ユーザに提示する情報として設定して制御部102に渡
す(ステップ99)。
Then, the recommended expression generating unit 710 shifts the numerical value and the numerical value of the classifier received from the numerical expression error detecting unit 709 by the number of digits specified by the recommended expression rule received from the numerical expression error detecting unit 709. By changing the classifier to the classifier specified by the recommended expression rule, a recommended expression is generated (acquired) in place of the numerical expression determined to be “numerical limit error” (step 98). Then, the recommended expression generation unit 710 sets the generated recommended expression as information to be presented to the user and passes it to the control unit 102 (step 99).

【0048】一方、数値表現誤り検出部709が「助数
詞誤り」を検出した場合(ステップ93)、当該数値表
現誤り検出部709は、「助数詞誤り」をユーザに提示
する情報として設定して制御部102に渡す(ステップ
99)。
On the other hand, when the numerical expression error detecting section 709 detects "numeric classifier error" (step 93), the numerical expression error detecting section 709 sets the "numeric classifier error" as information to be presented to the user, and sets the information to the control section. 102 (step 99).

【0049】制御部102は、数値表現誤り検出部70
9または推奨表現生成部710から渡されたユーザ提示
情報を出力部103に出力して画面表示する。次に、以
上に述べた図7の文書作成支援装置による入力文(入力
文字列)を対象とする数値表現(数え方の単位)の検査
についての具体例を図10を参照して説明する。
The control unit 102 includes a numerical expression error detection unit 70
9 or the user presentation information passed from the recommended expression generation unit 710 is output to the output unit 103 and displayed on the screen. Next, a specific example of the above-described inspection of a numerical expression (unit of counting) for an input sentence (input character string) by the document creation support device of FIG. 7 will be described with reference to FIG.

【0050】まず、入力部101から入力文として「2
000メガバイトのメモリ」と入力され、単語分割部1
04により、図6(a)のように単語分割が行われてい
るとする。更に、単語関係解析部106、数値関係抽出
部108により、図6(b)のような数値関係が抽出さ
れているとする。
First, “2” is input from the input unit 101 as an input sentence.
000 megabytes of memory "
04, word division is performed as shown in FIG. Further, it is assumed that a numerical relationship as shown in FIG. 6B has been extracted by the word relationship analyzing unit 106 and the numeric relationship extracting unit 108.

【0051】数値表現誤り検出部109は、数え方記憶
部107上の数え方情報テーブル707aの登録情報
(図8参照)を参照して、「メモリ」という単語は「バ
イト」「キロバイト」「メガバイト」「個」などの数え
方をすることを認識する。この例では、助数詞には「メ
ガバイト」が使われているため、助数詞の使い方として
は間違っていない。
The numerical expression error detecting section 109 refers to the registration information (see FIG. 8) of the counting information table 707a on the counting storage section 107, and finds that the word "memory" is "byte", "kilobyte", "megabyte". Recognize how to count "individual". In this example, the use of the classifier is correct because "megabyte" is used for the classifier.

【0052】しかし、図8の数え方情報テーブル707
aの登録情報(数え方情報)から明らかなように、助数
詞「メガバイト」を用いる場合の数値範囲は3桁までと
いう数値条件があり、且つ3桁を越えるときには(「メ
ガバイト」ではなくて)「ギガバイト」を用いること
と、その際には(「メガバイト」使用時の)数値を3桁
ずらす、という推奨表現規則があるため、数値表現誤り
検出部709は、上記入力文「2000メガバイトのメ
モリ」中の「2000メガバイト」という4桁の数値
「2000」を含む数値表現を「数値制限誤り」(ステ
ップ96)として検出する。
However, the counting information table 707 shown in FIG.
As is clear from the registration information (counting information) of a, when the classifier “megabyte” is used, the numerical range has a numerical condition of up to three digits, and when it exceeds three digits (instead of “megabyte”) Since there is a recommended expression rule of using “gigabyte” and shifting the numerical value by three digits (when “megabyte” is used), the numerical expression error detecting unit 709 uses the above-mentioned input sentence “2000 megabyte memory” The numerical expression including the four-digit numerical value “2000” of “2000 megabytes” therein is detected as “numeric limit error” (step 96).

【0053】この場合、数値表現誤り検出部709は、
「数値制限誤り」となった数値表現「2000メガバイ
ト」をなす数値「2000」及び助数詞「メガバイト」
と、「メガバイト」使用時の数値を3桁ずらして「ギガ
バイト」使用の推奨表現に代えるための推奨表現規則と
を推奨表現生成部710に渡す。これを受けて推奨表現
生成部710は、図10に示すように、「2000メガ
バイト」中の数値「2000」を3桁ずらして「2」と
すると共に、助数詞「メガバイト」を「ギガバイト」に
変更することで、「2000メガバイト」の表現を「2
ギガバイト」という表現に変換する。
In this case, the numerical expression error detecting section 709
The numerical value "2000" and the classifier "megabyte" which form the numerical expression "2000 megabytes" which became "numerical limit error"
And a recommended expression rule for shifting the numerical value when using “megabyte” by three digits and replacing it with the recommended expression using “gigabyte”, to the recommended expression generation unit 710. In response, as shown in FIG. 10, the recommended expression generation unit 710 shifts the numerical value “2000” in “2000 megabytes” by three digits to “2” and changes the classifier “megabytes” to “gigabytes”. By doing, the expression of "2000 megabytes" is changed to "2
Gigabyte ".

【0054】なお、図1の構成の文書作成支援装置の各
部の処理機能は、その処理機能をコンピュータ、例えば
図11に示すパーソナルコンピュータ1100により実
現させるためのプログラムを記録した記録媒体、例えば
フロッピーディスク(FD)1110を用い、当該フロ
ッピーディスク1110をパーソナルコンピュータ11
00に装着して、当該フロッピーディスク1110に記
録されているプログラムをパーソナルコンピュータ11
00で読み取り実行させることにより実現される。更に
具体的に述べるならば、フロッピーディスク1110
に、図12(a)に示すように、単語分割部104とし
て機能させるための単語分割ルーチン1211、単語関
係解析部106として機能させるための単語関係解析ル
ーチン1212、数値関係抽出部108として機能させ
るための数値関係抽出ルーチン1213、及び数値表現
誤り検出部109として機能させるための数値表現誤り
検出ルーチン1214を有するプログラム1210を記
録しておき、当該プログラム1210をパーソナルコン
ピュータ1100で読み取り実行させればよい。
The processing function of each part of the document creation support device having the configuration shown in FIG. 1 is a recording medium such as a floppy disk on which a program for realizing the processing function by a computer, for example, a personal computer 1100 shown in FIG. (FD) 1110, and the floppy disk 1110 is connected to the personal computer 11
00, the program recorded on the floppy disk 1110 is stored in the personal computer 11.
This is realized by reading and executing at 00. More specifically, the floppy disk 1110
In addition, as shown in FIG. 12A, a word division routine 1211 for functioning as the word division unit 104, a word relation analysis routine 1212 for functioning as the word relation analysis unit 106, and a numerical relation extraction unit 108 are functioned. A program 1210 having a numerical relationship extraction routine 1213 and a numerical expression error detection routine 1214 for functioning as the numerical expression error detection unit 109 may be recorded, and the program 1210 may be read and executed by the personal computer 1100. .

【0055】同様に、図7の構成の文書作成支援装置の
各部の処理機能を実現するには、フロッピーディスク1
110に、図12(b)に示すように、単語分割部10
4として機能させるための単語分割ルーチン1211、
単語関係解析部106として機能させるための単語関係
解析ルーチン1212、数値関係抽出部108として機
能させるための数値関係抽出ルーチン1213、数値表
現誤り検出部709として機能させるための数値表現誤
り検出ルーチン1224、及び推奨表現生成部710と
して機能させるための推奨表現生成ルーチン1225を
有するプログラム1220を記録しておき、当該プログ
ラム1220をパーソナルコンピュータ1100で読み
取り実行させればよい。
Similarly, in order to realize the processing function of each part of the document creation support device having the configuration shown in FIG.
As shown in FIG. 12 (b), the word
4, a word segmentation routine 1211 to function as
A word relation analysis routine 1212 for functioning as the word relation analysis unit 106, a numerical relation extraction routine 1213 for functioning as the numerical relation extraction unit 108, a numerical expression error detection routine 1224 for functioning as the numerical expression error detection unit 709, In addition, a program 1220 having a recommended expression generation routine 1225 for functioning as the recommended expression generation unit 710 may be recorded, and the program 1220 may be read and executed by the personal computer 1100.

【0056】なお、辞書記憶部105及び数え方記憶部
107は、パーソナルコンピュータ1100が一般に有
するROM、或いは磁気ディスク装置(ハードディスク
装置)等の不揮発性記憶装置上に確保すればよい。
It should be noted that the dictionary storage unit 105 and the counting storage unit 107 may be secured in a ROM generally included in the personal computer 1100 or a non-volatile storage device such as a magnetic disk device (hard disk device).

【0057】また、以上に述べた第1及び第2の実施形
態では、日本語入力文を対象とする数値表現の誤り検出
機能を持つ文書作成支援装置について説明したが、本発
明は、日本語以外にも数え方のある言語であれば、例え
ば中国語やタイ語などの他の言語の数値表現の誤り検出
にも応用可能である。
Further, in the first and second embodiments described above, a document creation supporting apparatus having an error detection function of a numerical expression for a Japanese input sentence has been described. The present invention can also be applied to error detection of numerical expressions in other languages such as Chinese and Thai, as long as the language has a counting method other than the above.

【0058】また、以上の実施形態では、入力文中の数
値表現の誤りを検出して、その誤りを、或いはどのよう
な表現が推奨されるかをユーザに提示するのみであった
が、入力文中の誤った数値表現を推奨される表現に自動
的に置き換えることによって、例えば機械翻訳システム
や自然言語理解システムにおいて、より適切な数値表現
を行うことができるようになり、生成された目標言語や
知識データなどを、より自然で扱いやすいものとするこ
とができる。
Further, in the above embodiment, an error in the numerical expression in the input sentence is detected and only the error or what kind of expression is recommended is presented to the user. By automatically replacing the incorrect numerical expressions in the language with the recommended expressions, it is possible to perform more appropriate numerical expressions, for example, in a machine translation system or a natural language understanding system, and to generate the target language and knowledge generated. Data and the like can be made more natural and easy to handle.

【0059】[0059]

【発明の効果】以上詳述したように本発明によれば、数
を数えられる各単語に対応して、その数え方の情報を予
め記憶手段に登録しておくことで、入力文を解析して数
を数えている関係を持つ数値表現を抽出し、その数値表
現中の単語についての数え方情報を参照するだけで、そ
の数値表現が誤っているか否かを簡単に判定することが
できる。
As described above in detail, according to the present invention, the input sentence is analyzed by registering the counting method information in advance in the storage means in correspondence with each word whose number can be counted. It is possible to easily determine whether or not the numerical expression is erroneous simply by extracting a numerical expression having a relationship of counting the numbers and referring to the counting method information on the words in the numerical expression.

【0060】また本発明によれば、単語の数え方の単位
を持つ数え方情報を用いることで、数え方の単位を間違
えている数値表現を検出できる。また本発明によれば、
単語の数え方の単位とその単位を用いるときの数値の条
件を持つ数え方情報を用いることで、数え方の単位は間
違っていないが、表現された数値が数値条件を満たして
いない数値制限誤りのある数値表現を検出できる。
Further, according to the present invention, by using the counting information having the unit of word counting, it is possible to detect a numerical expression in which the unit of counting is wrong. According to the present invention,
By using the counting information that has the unit of the word count and the numerical condition when using the unit, the numerical unit is not wrong, but the expressed numerical value does not satisfy the numerical condition. Can be detected.

【0061】また本発明によれば、単語の数え方の単位
とその単位を用いるときの数値の条件の他に、その条件
から外れている場合に推奨する表現を生成するための推
奨表現規則を持つ数え方情報を用いることで、数え方の
単位は間違っていないが、表現された数値が数値条件を
満たしていない数値表現を検出した場合に、数値制限誤
りのない妥当な数値表現を生成することができる。
Further, according to the present invention, in addition to a unit for counting words and a numerical condition when using the unit, a recommended expression rule for generating an expression recommended when the condition is not satisfied is defined. By using the counting information that has, the unit of counting is not wrong, but if a numerical value expressed that does not satisfy the numerical condition is detected, a valid numerical expression without numerical limit error is generated be able to.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1の実施形態に係る文書作成支援装
置の機能構成を示すブロック図。
FIG. 1 is a block diagram showing a functional configuration of a document creation support device according to a first embodiment of the present invention.

【図2】図1中の数え方情報テーブル107aの登録内
容例を示す図。
FIG. 2 is a view showing an example of registered contents of a counting information table 107a in FIG. 1;

【図3】図1中の単語分割部104による入力文に対す
る単語分割結果例を示す図。
FIG. 3 is a view showing an example of a word division result for an input sentence by a word division unit 104 in FIG. 1;

【図4】図1中の単語関係解析部106による図3の単
語分割結果に対する単語関係解析結果を示す図。
FIG. 4 is a view showing a result of a word relationship analysis performed by the word relationship analysis unit 106 in FIG. 1 on the result of the word division in FIG. 3;

【図5】図1中の数値表現誤り検出部109による数値
表現誤り検出処理を説明するためのフローチャート。
FIG. 5 is a flowchart for explaining a numerical expression error detection process by a numerical expression error detection unit 109 in FIG. 1;

【図6】同第1の実施形態における入力文(入力文字
列)を対象とする数値表現(数え方の単位)の検査につ
いての具体例を説明するために、「数値制限誤り」のあ
る入力文、「誤りなし」の入力文、及び「助数詞誤り」
のある入力文を、その入力文における単語相互間の係り
受け関係と共に示す図。
FIG. 6 is a diagram illustrating an input with a “numeric limit error” in order to explain a specific example of checking a numerical expression (unit of counting) for an input sentence (input character string) in the first embodiment. Sentence, "error-free" input sentence, and "classifier error"
FIG. 6 is a diagram showing an input sentence with a symbol and a dependency relationship between words in the input sentence.

【図7】本発明の第2の実施形態に係る文書作成支援装
置の機能構成を示すブロック図。
FIG. 7 is a block diagram showing a functional configuration of a document creation support device according to a second embodiment of the present invention.

【図8】図7中の数え方情報テーブル707aの登録内
容例を示す図。
FIG. 8 is a view showing an example of registered contents of a counting information table 707a in FIG. 7;

【図9】図7中の数値表現誤り検出部709による数値
表現誤り検出処理を説明するためのフローチャート。
FIG. 9 is a flowchart for explaining a numerical expression error detection process by a numerical expression error detection unit 709 in FIG. 7;

【図10】同第2の実施形態において「数値制限誤り」
と検出された数値表現例と、当該表現をもとに生成され
た推奨する表現例とを対比して示す図。
FIG. 10 shows a “numerical value limit error” in the second embodiment.
FIG. 7 is a diagram showing a comparison between a numerical expression example detected and a recommended expression example generated based on the expression.

【図11】図1或いは図7の構成の文書作成支援装置の
各部の機能を実現するためのプログラムを記録したフロ
ッピーディスクが装着されるパーソナルコンピュータの
外観を示す図。
FIG. 11 is a diagram showing the appearance of a personal computer on which a floppy disk in which a program for realizing the function of each unit of the document creation support device having the configuration shown in FIG. 1 or 7 is recorded is mounted.

【図12】図1の構成の文書作成支援装置の各部の機能
を実現するためのプログラムに含まれる主要なルーチン
と図7の構成の文書作成支援装置の各部の機能を実現す
るためのプログラムに含まれる主要なルーチンとを示す
図。
12 shows a main routine included in a program for realizing the function of each unit of the document creation support device having the configuration of FIG. 1 and a program for realizing the function of each unit of the document creation support device having the configuration of FIG. 7; The figure which shows the main routine included.

【符号の説明】[Explanation of symbols]

101…入力部、 102…制御部、 103…出力部、 104…単語分割部、 105…辞書記憶部、 105a…解析辞書、 106…単語関係解析部、 107…数え方記憶部、 107a,707a…数え方情報テーブル、 108…数値関係抽出部、 109,709…数値表現誤り検出部、 710…推奨表現生成部。 101 input unit, 102 control unit, 103 output unit, 104 word division unit, 105 dictionary storage unit, 105a analysis dictionary, 106 word relation analysis unit, 107 counting storage unit, 107a, 707a ... Counting information table, 108: Numerical relation extracting unit, 109, 709: Numerical expression error detecting unit, 710: Recommended expression generating unit.

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】 入力された文を単語単位に分割し、関係
のある単語を取り出してその関係によって文章の誤りを
検出する文書作成支援方法であって、 数値表現の対象となり得る単語毎に、その数え方の情報
を記憶手段に登録しておき、 前記入力された文中の数値表現の誤りを検出するため
に、 前記入力された文を単語単位に分割し、その分割した各
単語の係り受けの関係を解析することで、数を数えてい
る関係を持つ数値表現を抽出し、 前記抽出した数値表現毎に、その数値表現中の単語に対
応する前記記憶手段内の前記数え方情報を参照すること
で、誤りのある数値表現を検出することを特徴とする文
書作成支援方法。
1. A document creation support method for dividing an input sentence into words, extracting related words, and detecting an error in a sentence based on the relationship. The counting method is registered in a storage unit, and the input sentence is divided into words in order to detect an error in the numerical expression in the input sentence, and the dependency of each divided word is determined. By analyzing the relationship, a numerical expression having a relationship counting the number is extracted, and for each of the extracted numerical expressions, refer to the counting method information in the storage unit corresponding to the word in the numerical expression. A document creation support method, wherein an erroneous numerical expression is detected.
【請求項2】 文を入力する入力手段と、 前記入力手段により入力された文を単語単位に分割する
単語分割手段と、 前記単語分割手段により分割された単語同士の係り受け
の関係を解析する単語関係解析手段と、 前記単語関係解析手段により解析された単語同士の係り
受けの関係の中から数を数えている関係を持つ数値表現
を抽出する数値関係抽出手段と、 数値表現の対象となり得る単語毎に、その数え方の情報
を記憶しておくための数え方記憶手段と、 前記数値関係抽出手段により抽出された数値表現毎に、
その数値表現中の単語に対応する前記記憶手段内の前記
数え方情報を参照することで、誤りのある数値表現を検
出する数値表現誤り検出手段とを具備することを特徴と
する文書作成支援装置。
2. An input unit for inputting a sentence, a word dividing unit for dividing the sentence input by the input unit into words, and a dependency relationship between the words divided by the word dividing unit is analyzed. Word relation analysis means; and numerical relation extraction means for extracting a numerical expression having a relation of counting the number from the dependency relation between words analyzed by the word relation analysis means; For each word, a counting method storage means for storing information on the counting method, and for each numerical expression extracted by the numerical relationship extracting means,
A document expression supporting apparatus comprising: a numerical expression error detecting means for detecting an erroneous numerical expression by referring to the counting information in the storage means corresponding to a word in the numerical expression. .
【請求項3】 入力された文を単語単位に分割し、関係
のある単語を取り出してその関係によって文章の誤りを
検出する文書作成支援方法であって、 数値表現の対象となり得る単語毎に、その数え方の単位
を含む数え方情報を記憶手段に登録しておき、 前記入力された文中の数値表現の誤りを検出するため
に、 前記入力された文を単語単位に分割し、その分割した各
単語の係り受けの関係を解析することで、数を数えてい
る関係を持つ数値表現を抽出し、 前記抽出した数値表現毎に、その数値表現中の単語に対
応する前記記憶手段内の前記数え方情報を参照すること
で、数え方の単位が間違っている数値表現を検出するこ
とを特徴とする文書作成支援方法。
3. A document creation support method for dividing an input sentence into words, extracting related words, and detecting an error in a sentence based on the relationship. The counting information including the counting unit is registered in the storage unit, and the input sentence is divided into word units in order to detect an error in the numerical expression in the input sentence, and the divided sentence is divided. By analyzing the dependency relation of each word, a numerical expression having a relation counting the number is extracted, and for each of the extracted numerical expressions, the numerical value in the storage means corresponding to the word in the numerical expression is extracted. A document creation support method characterized by detecting a numerical expression in which a unit of counting is wrong by referring to counting information.
【請求項4】 文を入力する入力手段と、 前記入力手段により入力された文を単語単位に分割する
単語分割手段と、 前記単語分割手段により分割された単語同士の係り受け
の関係を解析する単語関係解析手段と、 前記単語関係解析手段により解析された単語同士の係り
受けの関係の中から数を数えている関係を持つ数値表現
を抽出する数値関係抽出手段と、 数値表現の対象となり得る単語毎に、その数え方の単位
を含む数え方情報を記憶しておくための数え方記憶手段
と、 前記数値関係抽出手段により抽出された数値表現毎に、
その数値表現中の単語に対応する前記記憶手段内の前記
数え方情報を参照することで、数え方の単位が間違って
いる数値表現を検出する数値表現誤り検出手段とを具備
することを特徴とする文書作成支援装置。
4. An input unit for inputting a sentence, a word dividing unit for dividing the sentence input by the input unit into words, and a dependency relationship between the words divided by the word dividing unit is analyzed. Word relation analysis means; and numerical relation extraction means for extracting a numerical expression having a relation of counting the number from the dependency relation between words analyzed by the word relation analysis means; For each word, counting method storage means for storing counting information including the counting unit, for each numerical expression extracted by the numerical relationship extraction means,
Numeric expression error detecting means for detecting a numerical expression in which the unit of counting is incorrect by referring to the counting information in the storage means corresponding to the word in the numerical expression. Document creation support device.
【請求項5】 入力された文を単語単位に分割し、関係
のある単語を取り出してその関係によって文章の誤りを
検出する文書作成支援方法であって、 数値表現の対象となり得る単語毎に、その数え方の単位
とその単位を用いるときの数値の条件を含む数え方情報
を記憶手段に登録しておき、 前記入力された文中の数値表現の誤りを検出するため
に、 前記入力された文を単語単位に分割し、その分割した各
単語の係り受けの関係を解析することで、数を数えてい
る関係を持つ数値表現を抽出し、 前記抽出した数値表現毎に、その数値表現中の単語に対
応する前記記憶手段内の前記数え方情報を参照すること
で、数え方の単位が間違っている、或いは数え方の単位
は間違っていないものの、表現された数値が前記数え方
情報中の前記数値条件を満たしていない、誤りのある数
値表現を検出することを特徴とする文書作成支援方法。
5. A document creation support method for dividing an input sentence into words, extracting relevant words, and detecting an error in the sentence based on the relevant words. The counting unit including the unit of the counting method and the numerical value condition when using the unit is registered in the storage unit, and the input sentence is detected in order to detect an error in the numerical expression in the input sentence. Is divided into words, and by analyzing the dependency relation of each of the divided words, a numerical expression having a relation of counting the number is extracted, and for each of the extracted numerical expressions, By referring to the counting information in the storage means corresponding to a word, the counting unit is wrong, or the counting unit is not wrong, but the expressed numerical value in the counting information is The above numerical condition Not Tashi, document creation support method and detecting a numeric representation erroneous.
【請求項6】 文を入力する入力手段と、 前記入力手段により入力された文を単語単位に分割する
単語分割手段と、 前記単語分割手段により分割された単語同士の係り受け
の関係を解析する単語関係解析手段と、 前記単語関係解析手段により解析された単語同士の係り
受けの関係の中から数を数えている関係を持つ数値表現
を抽出する数値関係抽出手段と、 数値表現の対象となり得る単語毎に、その数え方の単位
とその単位を用いるときの数値の条件を含む数え方情報
を記憶しておくための数え方記憶手段と、 前記数値関係抽出手段により抽出された数値表現毎に、
その数値表現中の単語に対応する前記記憶手段内の前記
数え方情報を参照することで、数え方の単位が間違って
いる、或いは数え方の単位は間違っていないものの、表
現された数値が前記数え方情報中の前記数値条件を満た
していない、誤りのある数値表現を検出する数値表現誤
り検出手段とを具備することを特徴とする文書作成支援
装置。
6. An input unit for inputting a sentence, a word dividing unit for dividing the sentence input by the input unit into words, and analyzing a dependency relationship between the words divided by the word dividing unit. Word relation analysis means; and numerical relation extraction means for extracting a numerical expression having a relation of counting the number from the dependency relation between words analyzed by the word relation analysis means; For each word, a counting method storage means for storing counting method information including a unit of the counting method and a numerical condition when the unit is used, and a numerical expression extracted by the numerical relation extracting means. ,
By referring to the counting information in the storage means corresponding to the word in the numerical expression, the unit of counting is wrong, or the unit of counting is not wrong, but the expressed numerical value is A document creation support device, comprising: a numerical expression error detection unit that detects an erroneous numerical expression that does not satisfy the numerical condition in the counting method information.
【請求項7】 入力された文を単語単位に分割し、関係
のある単語を取り出してその関係によって文章の誤りを
検出する文書作成支援方法であって、 数値表現の対象となり得る単語毎に、その数え方の単
位、その単位を用いるときの数値の条件、及びその条件
から外れている場合に推奨する表現を生成するための推
奨表現規則を含む数え方情報を記憶手段に登録してお
き、 前記入力された文中の数値表現の誤りを検出するため
に、 前記入力された文を単語単位に分割し、その分割した各
単語の係り受けの関係を解析することで、数を数えてい
る関係を持つ数値表現を抽出し、 前記抽出した数値表現毎に、その数値表現中の単語に対
応する前記記憶手段内の前記数え方情報を参照すること
で、数え方の単位が間違っている、或いは数え方の単位
は間違っていないものの、表現された数値が前記数え方
情報中の前記数値条件を満たしていない、誤りのある数
値表現を検出し、 数え方の単位は間違っていないものの、表現された数値
が前記数え方情報中の前記数値条件を満たしていない数
値表現を検出した場合、当該数値条件と対応する前記推
奨表現規則に従って推奨する数値表現を生成するように
したことを特徴とする文書作成支援方法。
7. A document creation support method for dividing an input sentence into words, extracting relevant words, and detecting an error in a sentence based on the relation. Register the counting method information including a unit of the counting method, a numerical condition when using the unit, and a recommended expression rule for generating an expression recommended when the condition is not satisfied, in the storage unit, In order to detect an error in the numerical expression in the input sentence, the input sentence is divided into words, and the dependency relation of each of the divided words is analyzed to count the number. By extracting a numerical expression having the following, and referring to the counting information in the storage unit corresponding to the word in the numerical expression for each of the extracted numerical expressions, the unit of counting is incorrect, or Simple counting Is not wrong, the detected numerical value does not satisfy the numerical condition in the counting method information, detects an erroneous numerical expression, the counting unit is not wrong, but the expressed numerical value is A document creation support method, characterized in that, when a numerical expression in the counting information that does not satisfy the numerical condition is detected, a recommended numerical expression is generated according to the recommended expression rule corresponding to the numerical condition.
【請求項8】 文を入力する入力手段と、 前記入力手により入力された文を単語単位に分割する単
語分割手段と、 前記単語分割手段により分割された単語同士の係り受け
の関係を解析する単語関係解析手段と、 前記単語関係解析手段により解析された単語同士の係り
受けの関係の中から数を数えている関係を持つ数値表現
を抽出する数値関係抽出手段と、 数値表現の対象となり得る単語毎に、その数え方の単
位、その単位を用いるときの数値の条件、及びその条件
から外れている場合に推奨する表現を生成するための推
奨表現規則を含む数え方情報を記憶しておくための数え
方記憶手段と、 前記数値関係抽出手段により抽出された数値表現毎に、
その数値表現中の単語に対応する前記記憶手段内の前記
数え方情報を参照することで、数え方の単位が間違って
いる、或いは数え方の単位は間違っていないものの、表
現された数値が前記数え方情報中の前記数値条件を満た
していない、誤りのある数値表現を検出する数値表現誤
り検出手段と、 前記数値表現誤り検出手段により前記数え方情報中の前
記数値条件を満たしていないために誤りが検出された数
値表現から、当該数値条件と対応して前記数え方記憶手
段に記憶されている推奨表現規則に従って当該数値条件
を満たす数値表現を生成する推奨表現生成手段とを具備
することを特徴とする文書作成支援装置。
8. An input unit for inputting a sentence, a word dividing unit for dividing the sentence input by the input unit into words, and a dependency relationship between the words divided by the word dividing unit is analyzed. Word relation analysis means; and numerical relation extraction means for extracting a numerical expression having a relation of counting the number from the dependency relation between words analyzed by the word relation analysis means; For each word, counting method information including a unit of counting method, a numerical condition when using the unit, and a recommended expression rule for generating an expression recommended when the condition is not satisfied is stored. For each of the numerical expressions extracted by the numerical relationship extraction means,
By referring to the counting information in the storage means corresponding to the word in the numerical expression, the unit of counting is wrong, or the unit of counting is not wrong, but the expressed numerical value is The numerical condition in the counting information is not satisfied, the numerical expression error detecting means for detecting an erroneous numerical expression, and the numerical expression error detecting means does not satisfy the numerical condition in the counting information. A recommended expression generating means for generating, from the numerical expression in which the error is detected, a numerical expression satisfying the numerical condition in accordance with the recommended expression rule stored in the counting method storage means in correspondence with the numerical condition. Characteristic document creation support device.
JP8347430A 1996-12-26 1996-12-26 Method and device for assisting document preparation Pending JPH10187724A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8347430A JPH10187724A (en) 1996-12-26 1996-12-26 Method and device for assisting document preparation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8347430A JPH10187724A (en) 1996-12-26 1996-12-26 Method and device for assisting document preparation

Publications (1)

Publication Number Publication Date
JPH10187724A true JPH10187724A (en) 1998-07-21

Family

ID=18390184

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8347430A Pending JPH10187724A (en) 1996-12-26 1996-12-26 Method and device for assisting document preparation

Country Status (1)

Country Link
JP (1) JPH10187724A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002023386A1 (en) * 2000-09-12 2002-03-21 Kacis Incorporated Device for creating and reading structural document
JP2007316761A (en) * 2006-05-23 2007-12-06 Toshiba Corp Data processing device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002023386A1 (en) * 2000-09-12 2002-03-21 Kacis Incorporated Device for creating and reading structural document
JP2007316761A (en) * 2006-05-23 2007-12-06 Toshiba Corp Data processing device

Similar Documents

Publication Publication Date Title
JP3598211B2 (en) Related word extraction device, related word extraction method, and computer readable recording medium on which related word extraction program is recorded
US8433709B2 (en) Modular system and method for managing chinese, japanese and korean linguistic data in electronic form
US6219665B1 (en) Retrieval menu creation device, a retrieval menu creation method, and a recording medium that stores a retrieval menu creation program
JP3360617B2 (en) Numerical information extracting device, numerical information searching device, storage medium storing numerical information extracting program, and storage medium storing numerical information searching program
JP2883153B2 (en) Keyword extraction device
JPH10187724A (en) Method and device for assisting document preparation
JP2994336B1 (en) Document analysis apparatus and method
JP5621145B2 (en) Document check device, document check program, and document check method
JP6357912B2 (en) Glossary creation support system and method, program
JP2020008951A (en) Terminology fluctuation extraction device and method
JPH0816597A (en) Word dictionary registration device and document recognition device
JP7223450B2 (en) Automatic translation device and automatic translation program
JP3390567B2 (en) Typo correction device
JP3935374B2 (en) Dictionary construction support method, apparatus and program
JPH08115330A (en) Method for retrieving similar document and device therefor
JP4247849B2 (en) Name input device
JP7293782B2 (en) ELECTRONIC DEVICE, TEXT DISPLAY METHOD AND PROGRAM
JP3045886B2 (en) Character processing device with handwriting input function
JP3856515B2 (en) Document proofing device
JP2776069B2 (en) Document inspection device
JP2973369B2 (en) Japanese dictionary construction device for Japanese sentence morphological analysis
JP4390039B2 (en) Search system and method
Ikeda et al. Extraction of Food Product and Shop Names from Blog Articles Using Named Entity Recognition
JP2006155529A (en) Dictionary registration device, dictionary registration method, and dictionary registration program
JPS63163956A (en) Document preparation and correction supporting device